基本信息
文件名称:2025年大模型红队测试与对抗性攻击防御专题试题答案及深度解析.docx
文件大小:16.05 KB
总页数:8 页
更新时间:2025-09-26
总字数:约7.73千字
文档摘要
2025年大模型红队测试与对抗性攻击防御专题试题答案及深度解析
一、单选题(共15题)
1.以下哪项技术通常用于检测大模型中的偏见,并帮助提高模型公平性?
A.知识蒸馏
B.偏见检测算法
C.数据增强
D.结构剪枝
答案:B
解析:偏见检测算法是专门设计来识别和减少模型偏见的技术,它通过分析模型输出和训练数据来识别潜在的偏见,并采取措施减轻这些偏见。参考《人工智能伦理与公平性指南》2025版3.2节。
2.在大模型红队测试中,以下哪种对抗性攻击方式最常用于评估模型的鲁棒性?
A.输入噪声注入
B.恶意样本注入
C.梯度下降攻击
D.特征选择攻击
答案:C
解析:梯