基本信息
文件名称:2025年大模型注意力权重分析习题(含答案与解析).docx
文件大小:15.55 KB
总页数:10 页
更新时间:2025-09-06
总字数:约6.93千字
文档摘要

2025年大模型注意力权重分析习题(含答案与解析)

一、单选题(共15题)

1.在大模型训练过程中,以下哪项技术可以有效解决梯度消失问题?

A.使用LSTM网络

B.使用ReLU激活函数

C.使用梯度累积技术

D.使用Adam优化器

2.以下哪种方法可以用于在预训练模型中引入外部知识?

A.知识蒸馏

B.迁移学习

C.持续预训练

D.数据增强

3.在模型并行策略中,以下哪种方法适用于内存受限的情况?

A.数据并行

B.模型并行

C.流水线并行

D.粒度并行

4.在注意力机制变体中,以下哪种方法能够有效提高模型的上下文感知能力?

A.Self-Atte