基本信息
文件名称:2025年大模型注意力权重分析习题(含答案与解析).docx
文件大小:16.37 KB
总页数:20 页
更新时间:2025-10-23
总字数:约6.95千字
文档摘要

2025年大模型注意力权重分析习题(含答案与解析)

一、单选题(共15题)

1.以下哪种技术可以实现大模型在分布式训练环境中的高效并行计算?

A.模型并行策略

B.数据并行策略

C.稀疏激活网络设计

D.分布式存储系统

2.在参数高效微调中,LoRA与QLoRA的主要区别是什么?

A.LoRA使用固定比例的参数,QLoRA使用可学习的比例

B.LoRA适用于轻量级模型,QLoRA适用于大型模型

C.LoRA不需要额外的计算资源,QLoRA需要额外的计算资源

D.QLoRA的精度低于LoRA

3.以下哪项不是持续预训练策略的一部分?

A.长期监督学习

B.迁移学习