基本信息
文件名称:2025年大模型推理延迟瓶颈根因热力图自动生成考题答案及解析.docx
文件大小:15.13 KB
总页数:8 页
更新时间:2025-09-29
总字数:约7.76千字
文档摘要

2025年大模型推理延迟瓶颈根因热力图自动生成考题答案及解析

一、单选题(共15题)

1.以下哪项技术用于减少大模型推理延迟,而不显著降低模型性能?

A.INT8量化

B.模型剪枝

C.知识蒸馏

D.模型并行

答案:C

解析:知识蒸馏技术通过将大型模型的知识迁移到一个小型模型中,可以显著减少推理延迟,同时保持较高的性能。参考《知识蒸馏技术白皮书》2025版5.2节。

2.在生成热力图自动考题答案及解析时,以下哪种方法能有效提高推理速度?

A.使用GPU加速

B.优化模型结构

C.数据预取

D.批处理技术

答案:B

解析:优化模型结构,如使用轻量级网络架构,可以显著