基本信息
文件名称:2025年大模型推理延迟(含答案与解析).docx
文件大小:16.69 KB
总页数:24 页
更新时间:2025-10-22
总字数:约7.51千字
文档摘要
2025年大模型推理延迟(含答案与解析)
一、单选题(共15题)
1.以下哪种技术在大模型推理中能够有效减少延迟并保持较高准确率?
A.INT8量化
B.知识蒸馏
C.模型剪枝
D.模型并行
答案:B
解析:知识蒸馏技术通过将大模型的知识迁移到小模型中,能够显著降低推理延迟同时保持高准确率。参考《知识蒸馏技术详解》2025年版第3.2节。
2.在分布式训练框架中,以下哪种策略可以降低大模型推理延迟?
A.批处理大小调整
B.数据加载并行
C.通信协议优化
D.内存管理优化
答案:B
解析:数据加载并行策略通过并行处理数据加载阶段,可以有效减少模型推理延迟。详见《