基本信息
文件名称:2025年大模型注意力权重分析习题(含答案与解析).docx
文件大小:16.37 KB
总页数:20 页
更新时间:2025-10-23
总字数:约6.95千字
文档摘要
2025年大模型注意力权重分析习题(含答案与解析)
一、单选题(共15题)
1.以下哪种技术可以实现大模型在分布式训练环境中的高效并行计算?
A.模型并行策略
B.数据并行策略
C.稀疏激活网络设计
D.分布式存储系统
2.在参数高效微调中,LoRA与QLoRA的主要区别是什么?
A.LoRA使用固定比例的参数,QLoRA使用可学习的比例
B.LoRA适用于轻量级模型,QLoRA适用于大型模型
C.LoRA不需要额外的计算资源,QLoRA需要额外的计算资源
D.QLoRA的精度低于LoRA
3.以下哪项不是持续预训练策略的一部分?
A.长期监督学习
B.迁移学习