基本信息
文件名称:2025QECon全球软件质量效能大会:代码大模型训练数据建设实践.pptx
文件大小:6.74 MB
总页数:39 页
更新时间:2026-04-03
总字数:约5.12千字
文档摘要
代码大模型训练数据建设实践
高超|华为云大模型数据专家;
华为云计算技术有限公司高级工程师
负责Codemate代码训练数据构建交付及管理
构建高质量的代码训练数据及数据工程能力
支撑代码大模型训练及代码续写任务在各产业的落地;
目录
CONTENTS;
PART01
代码训练数据构建价值;
代码训练数据构建价值
大模型在软件工程落地已从概念验证阶段逐步进入规模化落地阶段;
代码训练数据构建价值
AI代码生成行采纳率和代码生产占比有提升,但还有提升空间;
PART02
代码训练数据构建方案;
CodeLLMStage1CodeLLMStage2