基本信息
文件名称:2025年大模型推理延迟(含答案与解析).docx
文件大小:14.26 KB
总页数:9 页
更新时间:2025-09-05
总字数:约6.32千字
文档摘要
2025年大模型推理延迟(含答案与解析)
一、单选题(共15题)
1.以下哪种技术可以显著降低大模型推理延迟,同时保持高精度?
A.INT8量化
B.知识蒸馏
C.模型并行
D.神经架构搜索(NAS)
2.在大模型推理中,以下哪种方法可以减少内存占用,从而降低延迟?
A.模型压缩
B.模型剪枝
C.模型量化
D.模型并行
3.为了加速大模型推理,以下哪种技术可以同时减少计算量和内存占用?
A.知识蒸馏
B.模型剪枝
C.模型量化
D.模型并行
4.在分布式训练框架中,以下哪种策略可以降低大模型推理延迟?
A.数据并行
B.模型并行
C.硬件加速
D.