鸿蒙生态下的AI助力移动应用开发
2025
前言
01智能代码辅助
01
02目录 智能问答
02
03万能卡片生成
03
04下一步思考
04
05
AI大模型爆发,重新定义软件工程
1个初级程序员变成1个资深程序员
AI降低开发门槛
1个资深程序员变成10个资深程序员
AI提升程序员开发效率
全民开发者应用开发者专业开发者应
全民开发者
应用开发者
专业开发者
用 应
开 用
发 开
能 发
力 门
边 槛
界 降
更 低
广
竞品洞察:国内外厂商软件开发智能化洞察一览
厂商
产品
智能问答
代码生成
测试用例生成
代码优化
代码解释
代码翻译
微软
GithubCopilot
√
√
√
√
√
√
百度
Comate
√
√
√
√
√
√
HuggingFace
CodeFuse
√
√
√
√
√
√
阿里
通义灵码
√
√
√
√
√
√
字节
MarsCode
√
√
√
√
√
√
科大讯飞
iFlyCode
√
√
√
√
√
√
商汤
小浣熊
√
√
√
√
√
√
智谱AI
CodeGeeX
√
√
√
√
√
√
其他:CodiumAl、Replit、Cursor、CodeStony、JoyCoder、FittenCode、aiXcoder、CodeShell等40+AI智能编码助手
目前辅助编程飞速发展中,不同友商功能逐渐趋同,核心功能包括智能问答,代码生成,用例生成,代码优化,代码解释;
微软GithubCopilot背靠OpenAI,辅助编程效果较好。百度Comate与阿里同义灵码等国内辅助研发工具在中文场景效果较好。
辅助编程可以极大的提升开发者的工作效率;在代码生成方面,直接用于业务场景时,还需开发者优化,其能力有待进一步提升。
业界趋于向Agent智能体演进
AI辅助研发核心功能:代码补全、代码生成、代码修复、异常检测、注释生成、代码解释
代码补全 根据注释生成代码 修复编码错误
添加异常处理 生成文档注释 代码解释;代码修复;生成测试用例
鸿蒙原生应用高效开发:聚焦代码生成补全、鸿蒙知识问答、万能卡片生成,覆盖Top5000应用
ArkTS全新语言鸿蒙整体开发量大
代码生成效率如何提高开发效率?
代码生成效率
Next版本 4万+人月代码量(含三方)约4亿行
系统组件 约1.4亿行
芯片组件 约2.7亿行
220W鸿蒙开发者如何快速赋能?
赋能开发者
赋能开发者
鸿蒙开发者 220万
每月新培养 10万+
社区回帖 30万每月新增提问 1万+
大量新元服务需研发如何提升开发效率?
新增元服务
新增元服务
Top30应用57%不支持卡片鸿蒙卡片添加率68.6%
低于竞品93%
AI使能研发,聚焦高价值高频次场景
AI使能研发,聚焦高价值高频次场景
代码生成补全智能代码辅助鸿蒙开发鸿蒙知识问答
代码生成补全
智能代码辅助鸿蒙开发
鸿蒙知识问答
知识推广辅助应用
万能卡片代码生成
鸿蒙元服务开发辅助
前言
01智能代码辅助
01
02目录 智能问答
02
0304万能卡片生成下一步思考
03
04
代码生成:通过自然语言描述,智能生成应用代码
ArkTS界面代码生成
HarmonyOSAPI代码生成
ArkTS常用算法代码生成
代码补全:智能理解代码意图,实现应用代码补全
精准理解代码注释
智能分析代码上下文
鸿蒙原生应用最佳实践
智能代码辅助技术路线
目标:代码生成与代码补全采纳率达到30%
挑战:
ArkTS代码语料匮乏:公开可获取Token数量1B(主流语言数据量级:10~100B)
ArkTS语料质量偏低:绝大多数代码没有注释,代码文件通常较短信息量少,且代码数据多样性低
现有大模型不懂ArkTS:现有的数据生成和衍生方法难以应用,无法直接用现有大模型生成ArkTS语料和指令
面向代码的增量预训练代码指令微调语言基座模型
面向代码的增
量预训练
代码指令微调
语言基座模型
基本的语言知识,以及中英文理解、生成能力
通用代码对话模型
基本的编程任务和相关对话
L1模型
领域任务增强模型
针对特定编程任务进行增强
L2模型
领域增强模型
注入特定编程语言的知识,或者增强特定编程语言的代码能力
代码基座模型
编程相关知识,以及代码的理解、生成能力
CoT、……
风控、……代码安全、
风控、……
L0模型
预训练数据加工:基于规则和基于模型筛选高质量数据
数据源数据清洗去重质量分级
数据源
数据清洗
去重
质量分级
开源数据集
合成数据
规则过滤
隐私敏感信息
License过滤
文档间去重:MinHash+LSH
代码仓库去重
抽样人工标注
LLM质量分级
分级模型迭代
ArkTS指令数据构造:通过代码解释反向构造指令数据
原始代码片