基本信息
文件名称:2025年大模型长序列建模优化专题卷答案及解析.docx
文件大小:16.27 KB
总页数:8 页
更新时间:2025-09-30
总字数:约8.79千字
文档摘要
2025年大模型长序列建模优化专题卷答案及解析
一、单选题(共15题)
1.以下哪种技术在大模型长序列建模中,能有效降低内存消耗并提升模型性能?
A.知识蒸馏
B.模型量化(INT8/FP16)
C.结构剪枝
D.稀疏激活网络设计
答案:D
解析:稀疏激活网络设计通过减少网络中激活的非零元素数量,降低内存消耗并加速模型训练和推理,参考《稀疏激活网络设计白皮书》2025版3.2节。
2.在大模型长序列建模中,以下哪种策略能有效缓解梯度消失问题?
A.使用ReLU激活函数
B.引入Dropout
C.使用LSTM单元
D.使用Gelu激活函数
答案:C
解析:LSTM