基本信息
文件名称:2025年大模型长序列建模优化专题卷答案及解析.docx
文件大小:16.27 KB
总页数:8 页
更新时间:2025-09-30
总字数:约8.79千字
文档摘要

2025年大模型长序列建模优化专题卷答案及解析

一、单选题(共15题)

1.以下哪种技术在大模型长序列建模中,能有效降低内存消耗并提升模型性能?

A.知识蒸馏

B.模型量化(INT8/FP16)

C.结构剪枝

D.稀疏激活网络设计

答案:D

解析:稀疏激活网络设计通过减少网络中激活的非零元素数量,降低内存消耗并加速模型训练和推理,参考《稀疏激活网络设计白皮书》2025版3.2节。

2.在大模型长序列建模中,以下哪种策略能有效缓解梯度消失问题?

A.使用ReLU激活函数

B.引入Dropout

C.使用LSTM单元

D.使用Gelu激活函数

答案:C

解析:LSTM