基本信息
文件名称:2025年大模型推理缓存优化(含答案与解析).docx
文件大小:14 KB
总页数:10 页
更新时间:2025-09-05
总字数:约6.63千字
文档摘要
2025年大模型推理缓存优化(含答案与解析)
一、单选题(共15题)
1.以下哪项技术主要用于减少大模型推理时的内存占用?
A.模型并行策略
B.低精度推理
C.结构剪枝
D.知识蒸馏
2.在大模型推理缓存优化中,以下哪种方法可以有效减少I/O操作?
A.数据预取
B.内存池管理
C.缓存一致性协议
D.模型压缩
3.大模型推理缓存优化中,以下哪种技术可以减少CPU和GPU之间的数据传输?
A.硬件加速
B.模型量化
C.知识蒸馏
D.知识增强
4.在大模型推理过程中,以下哪种技术可以提高模型的推理速度?
A.模型剪枝
B.模型并行
C.模型量化
D.