基本信息
文件名称:2025年大模型推理延迟优化技术考核卷答案及解析.docx
文件大小:14.82 KB
总页数:8 页
更新时间:2025-09-30
总字数:约7.72千字
文档摘要

2025年大模型推理延迟优化技术考核卷答案及解析

一、单选题(共15题)

1.以下哪种技术可以显著提升大模型推理速度,同时保持较高的准确率?

A.模型并行策略

B.低精度推理

C.知识蒸馏

D.结构剪枝

答案:A

解析:模型并行策略通过将模型分割成多个部分,在多个处理器上并行执行,可以显著提升大模型的推理速度。根据《2025年大模型推理优化技术指南》第4.2节,模型并行策略在保持较高准确率的同时,可以将推理速度提升2-3倍。

2.在大模型推理中,哪种技术可以减少内存占用,从而降低延迟?

A.动态神经网络

B.稀疏激活网络设计

C.梯度消失问题解决

D.特征工程自动化