基本信息
文件名称:2025年大模型推理延迟(含答案与解析).docx
文件大小:14.26 KB
总页数:9 页
更新时间:2025-09-05
总字数:约6.32千字
文档摘要

2025年大模型推理延迟(含答案与解析)

一、单选题(共15题)

1.以下哪种技术可以显著降低大模型推理延迟,同时保持高精度?

A.INT8量化

B.知识蒸馏

C.模型并行

D.神经架构搜索(NAS)

2.在大模型推理中,以下哪种方法可以减少内存占用,从而降低延迟?

A.模型压缩

B.模型剪枝

C.模型量化

D.模型并行

3.为了加速大模型推理,以下哪种技术可以同时减少计算量和内存占用?

A.知识蒸馏

B.模型剪枝

C.模型量化

D.模型并行

4.在分布式训练框架中,以下哪种策略可以降低大模型推理延迟?

A.数据并行

B.模型并行

C.硬件加速

D.