基本信息
文件名称:2025年轻量化部署推理延迟对比测试题(含答案与解析).docx
文件大小:17.12 KB
总页数:23 页
更新时间:2025-10-23
总字数:约7.76千字
文档摘要
2025年轻量化部署推理延迟对比测试题(含答案与解析)
一、单选题(共15题)
1.在2025年的年轻量化部署中,以下哪种量化方法最适合在移动设备上进行实时推理?
A.INT8量化
B.INT4量化
C.FP16量化
D.BFloat16量化
答案:A
解析:INT8量化在保持较高推理速度的同时,相比FP16和BFloat16量化在移动设备上能更好地降低内存使用和功耗,适合移动端实时推理,参考《移动端AI推理优化技术指南》2025版3.1节。
2.在进行模型并行策略设计时,以下哪种方法适用于多GPU场景下的卷积神经网络?
A.数据并行
B.模型并行
C.流水线并行
D