基本信息
文件名称:2025年轻量化部署推理延迟对比测试题(含答案与解析).docx
文件大小:17.12 KB
总页数:23 页
更新时间:2025-10-23
总字数:约7.76千字
文档摘要

2025年轻量化部署推理延迟对比测试题(含答案与解析)

一、单选题(共15题)

1.在2025年的年轻量化部署中,以下哪种量化方法最适合在移动设备上进行实时推理?

A.INT8量化

B.INT4量化

C.FP16量化

D.BFloat16量化

答案:A

解析:INT8量化在保持较高推理速度的同时,相比FP16和BFloat16量化在移动设备上能更好地降低内存使用和功耗,适合移动端实时推理,参考《移动端AI推理优化技术指南》2025版3.1节。

2.在进行模型并行策略设计时,以下哪种方法适用于多GPU场景下的卷积神经网络?

A.数据并行

B.模型并行

C.流水线并行

D