基本信息
文件名称:2025QECon全球软件质量效能大会:基于行业benchmark的智能体评测.pptx
文件大小:6.95 MB
总页数:34 页
更新时间:2026-04-06
总字数:约2.6千字
文档摘要

QECon

2025全球软件质量效能大会·深圳站

2025GLOBALSOFTWAREQUALITYEFFICIENCYCONFERENOESHENZHENZHAN

基于行业benchmark的智能体评测

崔润泽|蚂蚁集团高级测试开发工程师;

崔润泽

蚂蚁集团高级测试开发工程师

负责行业benchmark设计、行业大模型评测、评测技术研发等工作,保障线上大模型业务水位稳定。日常主要工作为协助业务质量团队,从工程、数据、算法角度出发,攻克评测流程例里的各项技术难点。;

QECon

全球软件质量效能大会

01大模型评测概述

02行业评测Benchmark