基本信息
文件名称:2025QECon全球软件质量效能大会:代码大模型训练数据建设实践.pptx
文件大小:6.74 MB
总页数:39 页
更新时间:2026-04-03
总字数:约5.12千字
文档摘要

代码大模型训练数据建设实践

高超|华为云大模型数据专家;

华为云计算技术有限公司高级工程师

负责Codemate代码训练数据构建交付及管理

构建高质量的代码训练数据及数据工程能力

支撑代码大模型训练及代码续写任务在各产业的落地;

目录

CONTENTS;

PART01

代码训练数据构建价值;

代码训练数据构建价值

大模型在软件工程落地已从概念验证阶段逐步进入规模化落地阶段;

代码训练数据构建价值

AI代码生成行采纳率和代码生产占比有提升,但还有提升空间;

PART02

代码训练数据构建方案;

CodeLLMStage1CodeLLMStage2