基本信息
文件名称:2025QECon全球软件质量效能大会:基于行业benchmark的智能体评测.docx
文件大小:2.33 MB
总页数:62 页
更新时间:2026-04-06
总字数:约1.3万字
文档摘要

QECon

2025全球软件质量效能大会·深圳站

2025GLOBALSOFTWAREQUALITYEFFICIENCYCONFERENOESHENZHENZHAN

基于行业benchmark的智能体评测

崔润泽|蚂蚁集团高级测试开发工程师

崔润泽

蚂蚁集团高级测试开发工程师

负责行业benchmark设计、行业大模型评测、评测技术研发等工作,保障线上大模型业务水位稳定。日常主要工作为协助业务质量团队,从工程、数据、算法角度出发,攻克评测流程例里的各项技术难点。

目录

CONTENTS

QECon

全球软件质量效能大会

01大模型评测概述

02行业评测Benchm