基本信息
文件名称:2025年大模型推理服务扩展(含答案与解析).docx
文件大小:16.2 KB
总页数:21 页
更新时间:2025-10-22
总字数:约7.14千字
文档摘要

2025年大模型推理服务扩展(含答案与解析)

一、单选题(共15题)

1.以下哪项技术可以帮助大模型在推理时减少内存使用?

A.分布式训练框架

B.模型量化(INT8/FP16)

C.知识蒸馏

D.结构剪枝

2.在大模型推理服务扩展中,哪种技术可以提高模型处理速度而不显著降低精度?

A.低精度推理

B.模型并行策略

C.云边端协同部署

D.模型服务高并发优化

3.为了防止模型在推理过程中受到对抗性攻击,应采取哪种防御策略?

A.梯度消失问题解决

B.知识蒸馏

C.对抗性攻击防御

D.评估指标体系(困惑度/准确率)

4.以下哪项技术可以在不牺牲推理精度的