2025年大模型红队测试与对抗性攻击防御专题试题答案及深度解析.docx

基本信息

文件名称：2025年大模型红队测试与对抗性攻击防御专题试题答案及深度解析.docx

文件大小：16.05 KB

总页数：8 页

更新时间：2025-09-26

总字数：约7.73千字

文档摘要

2025年大模型红队测试与对抗性攻击防御专题试题答案及深度解析

一、单选题（共15题）

1.以下哪项技术通常用于检测大模型中的偏见，并帮助提高模型公平性？

A.知识蒸馏

B.偏见检测算法

C.数据增强

D.结构剪枝

答案：B

解析：偏见检测算法是专门设计来识别和减少模型偏见的技术，它通过分析模型输出和训练数据来识别潜在的偏见，并采取措施减轻这些偏见。参考《人工智能伦理与公平性指南》2025版3.2节。

2.在大模型红队测试中，以下哪种对抗性攻击方式最常用于评估模型的鲁棒性？

A.输入噪声注入

B.恶意样本注入

C.梯度下降攻击

D.特征选择攻击

答案：C

解析：梯