基本信息
文件名称:2025年大模型推理缓存优化(含答案与解析).docx
文件大小:14 KB
总页数:10 页
更新时间:2025-09-05
总字数:约6.63千字
文档摘要

2025年大模型推理缓存优化(含答案与解析)

一、单选题(共15题)

1.以下哪项技术主要用于减少大模型推理时的内存占用?

A.模型并行策略

B.低精度推理

C.结构剪枝

D.知识蒸馏

2.在大模型推理缓存优化中,以下哪种方法可以有效减少I/O操作?

A.数据预取

B.内存池管理

C.缓存一致性协议

D.模型压缩

3.大模型推理缓存优化中,以下哪种技术可以减少CPU和GPU之间的数据传输?

A.硬件加速

B.模型量化

C.知识蒸馏

D.知识增强

4.在大模型推理过程中,以下哪种技术可以提高模型的推理速度?

A.模型剪枝

B.模型并行

C.模型量化

D.