基本信息
文件名称:2025QECon全球软件质量效能大会:基于行业benchmark的智能体评测.docx
文件大小:2.33 MB
总页数:62 页
更新时间:2026-04-06
总字数:约1.3万字
文档摘要
QECon
2025全球软件质量效能大会·深圳站
2025GLOBALSOFTWAREQUALITYEFFICIENCYCONFERENOESHENZHENZHAN
基于行业benchmark的智能体评测
崔润泽|蚂蚁集团高级测试开发工程师
崔润泽
蚂蚁集团高级测试开发工程师
负责行业benchmark设计、行业大模型评测、评测技术研发等工作,保障线上大模型业务水位稳定。日常主要工作为协助业务质量团队,从工程、数据、算法角度出发,攻克评测流程例里的各项技术难点。
目录
CONTENTS
QECon
全球软件质量效能大会
01大模型评测概述
02行业评测Benchm