基本信息
文件名称:2025年招聘类面试题目及答案.docx
文件大小:32.65 KB
总页数:13 页
更新时间:2025-10-30
总字数:约6.76千字
文档摘要
2025年招聘类面试题目及答案
技术类岗位面试题及参考答案
问:企业在部署多模态大模型时,常遇到推理延迟高、资源消耗大的问题,作为技术负责人,你会从哪些维度优化?
答:首先需明确问题的核心矛盾:模型性能与资源成本的平衡。可从四个维度系统优化。其一,模型层面的轻量化处理。针对业务场景裁剪非核心模块,例如在电商商品推荐场景中,若多模态需求仅涉及图文匹配,可移除视频理解分支;采用动态量化技术(如8位或4位量化),在精度损失小于3%的范围内降低计算量,某头部电商曾通过FP16转INT8量化,将推理延迟从280ms降至120ms。其二,硬件与框架适配。根据企业算力资源选择最优方案:若使用GPU集