基本信息
文件名称:教育大模型评测体系构建与场景化测试实践.docx
文件大小:8.78 MB
总页数:103 页
更新时间:2025-06-30
总字数:约1.89万字
文档摘要
教育大模型评测体系构建与
场景化测试实践
文皓|科大讯飞
文皓
科大讯飞AI研究院教育质量部总监
有10多年软件开发及测试经验,2017年加入讯飞研究院质量团队,负责AI算法测试,对于认知类技术产品的落地有较多经验;
在讯飞星火大模型的攻关项目中,参与了星火大模型在教育、汽车、司法等多个业务场景的落地工作。
目录
CONTENTS
I.背景与挑战
II.教育大模型评测体系构建
III.作文批改场景端到端测试实践
IV.总结与展望
PART01
背景与挑战
人工智能四次浪潮