基本信息
文件名称:2025QECon全球软件质量效能大会:基于行业benchmark的智能体评测.pptx
文件大小:6.95 MB
总页数:34 页
更新时间:2026-04-06
总字数:约2.6千字
文档摘要
QECon
2025全球软件质量效能大会·深圳站
2025GLOBALSOFTWAREQUALITYEFFICIENCYCONFERENOESHENZHENZHAN
基于行业benchmark的智能体评测
崔润泽|蚂蚁集团高级测试开发工程师;
崔润泽
蚂蚁集团高级测试开发工程师
负责行业benchmark设计、行业大模型评测、评测技术研发等工作,保障线上大模型业务水位稳定。日常主要工作为协助业务质量团队,从工程、数据、算法角度出发,攻克评测流程例里的各项技术难点。;
QECon
全球软件质量效能大会
01大模型评测概述
02行业评测Benchmark