基本信息
文件名称:2025年大模型参数初始化策略测试题及答案解析.docx
文件大小:15.49 KB
总页数:7 页
更新时间:2025-09-28
总字数:约7.05千字
文档摘要
2025年大模型参数初始化策略测试题及答案解析
一、单选题(共15题)
1.以下哪种初始化策略有助于防止大模型训练过程中的梯度消失问题?
A.使用小的随机初始化值
B.采用Xavier初始化
C.使用He初始化
D.不进行初始化
答案:B
解析:Xavier初始化(也称为Glorot初始化)通过确保权重初始化后的方差与激活函数的方差成比例,有助于避免梯度消失问题,适用于ReLU激活函数。参考《深度学习实践指南》2025版第五章。
2.在分布式训练框架中,以下哪种策略可以提高大模型参数初始化的效率?
A.集中式初始化
B.分布式初始化
C.随机初始化
D.网络初始化