基本信息
文件名称:2025年大模型红队测试与对抗性攻击防御专题试题答案及深度解析.docx
文件大小:16.05 KB
总页数:8 页
更新时间:2025-09-26
总字数:约7.73千字
文档摘要

2025年大模型红队测试与对抗性攻击防御专题试题答案及深度解析

一、单选题(共15题)

1.以下哪项技术通常用于检测大模型中的偏见,并帮助提高模型公平性?

A.知识蒸馏

B.偏见检测算法

C.数据增强

D.结构剪枝

答案:B

解析:偏见检测算法是专门设计来识别和减少模型偏见的技术,它通过分析模型输出和训练数据来识别潜在的偏见,并采取措施减轻这些偏见。参考《人工智能伦理与公平性指南》2025版3.2节。

2.在大模型红队测试中,以下哪种对抗性攻击方式最常用于评估模型的鲁棒性?

A.输入噪声注入

B.恶意样本注入

C.梯度下降攻击

D.特征选择攻击

答案:C

解析:梯