基本信息
文件名称:2025鸿蒙生态下的AI助力移动应用开发.docx
文件大小:6.06 MB
总页数:26 页
更新时间:2025-03-25
总字数:约4.9千字
文档摘要

鸿蒙生态下的AI助力移动应用开发

2025

前言

01智能代码辅助

01

02目录 智能问答

02

03万能卡片生成

03

04下一步思考

04

05

AI大模型爆发,重新定义软件工程

1个初级程序员变成1个资深程序员

AI降低开发门槛

1个资深程序员变成10个资深程序员

AI提升程序员开发效率

全民开发者应用开发者专业开发者应

全民开发者

应用开发者

专业开发者

用 应

开 用

发 开

能 发

力 门

边 槛

界 降

更 低

广

竞品洞察:国内外厂商软件开发智能化洞察一览

厂商

产品

智能问答

代码生成

测试用例生成

代码优化

代码解释

代码翻译

微软

GithubCopilot

百度

Comate

HuggingFace

CodeFuse

阿里

通义灵码

字节

MarsCode

科大讯飞

iFlyCode

商汤

小浣熊

智谱AI

CodeGeeX

其他:CodiumAl、Replit、Cursor、CodeStony、JoyCoder、FittenCode、aiXcoder、CodeShell等40+AI智能编码助手

目前辅助编程飞速发展中,不同友商功能逐渐趋同,核心功能包括智能问答,代码生成,用例生成,代码优化,代码解释;

微软GithubCopilot背靠OpenAI,辅助编程效果较好。百度Comate与阿里同义灵码等国内辅助研发工具在中文场景效果较好。

辅助编程可以极大的提升开发者的工作效率;在代码生成方面,直接用于业务场景时,还需开发者优化,其能力有待进一步提升。

业界趋于向Agent智能体演进

AI辅助研发核心功能:代码补全、代码生成、代码修复、异常检测、注释生成、代码解释

代码补全 根据注释生成代码 修复编码错误

添加异常处理 生成文档注释 代码解释;代码修复;生成测试用例

鸿蒙原生应用高效开发:聚焦代码生成补全、鸿蒙知识问答、万能卡片生成,覆盖Top5000应用

ArkTS全新语言鸿蒙整体开发量大

代码生成效率如何提高开发效率?

代码生成效率

Next版本 4万+人月代码量(含三方)约4亿行

系统组件 约1.4亿行

芯片组件 约2.7亿行

220W鸿蒙开发者如何快速赋能?

赋能开发者

赋能开发者

鸿蒙开发者 220万

每月新培养 10万+

社区回帖 30万每月新增提问 1万+

大量新元服务需研发如何提升开发效率?

新增元服务

新增元服务

Top30应用57%不支持卡片鸿蒙卡片添加率68.6%

低于竞品93%

AI使能研发,聚焦高价值高频次场景

AI使能研发,聚焦高价值高频次场景

代码生成补全智能代码辅助鸿蒙开发鸿蒙知识问答

代码生成补全

智能代码辅助鸿蒙开发

鸿蒙知识问答

知识推广辅助应用

万能卡片代码生成

鸿蒙元服务开发辅助

前言

01智能代码辅助

01

02目录 智能问答

02

0304万能卡片生成下一步思考

03

04

代码生成:通过自然语言描述,智能生成应用代码

ArkTS界面代码生成

HarmonyOSAPI代码生成

ArkTS常用算法代码生成

代码补全:智能理解代码意图,实现应用代码补全

精准理解代码注释

智能分析代码上下文

鸿蒙原生应用最佳实践

智能代码辅助技术路线

目标:代码生成与代码补全采纳率达到30%

挑战:

ArkTS代码语料匮乏:公开可获取Token数量1B(主流语言数据量级:10~100B)

ArkTS语料质量偏低:绝大多数代码没有注释,代码文件通常较短信息量少,且代码数据多样性低

现有大模型不懂ArkTS:现有的数据生成和衍生方法难以应用,无法直接用现有大模型生成ArkTS语料和指令

面向代码的增量预训练代码指令微调语言基座模型

面向代码的增

量预训练

代码指令微调

语言基座模型

基本的语言知识,以及中英文理解、生成能力

通用代码对话模型

基本的编程任务和相关对话

L1模型

领域任务增强模型

针对特定编程任务进行增强

L2模型

领域增强模型

注入特定编程语言的知识,或者增强特定编程语言的代码能力

代码基座模型

编程相关知识,以及代码的理解、生成能力

CoT、……

风控、……代码安全、

风控、……

L0模型

预训练数据加工:基于规则和基于模型筛选高质量数据

数据源数据清洗去重质量分级

数据源

数据清洗

去重

质量分级

开源数据集

合成数据

规则过滤

隐私敏感信息

License过滤

文档间去重:MinHash+LSH

代码仓库去重

抽样人工标注

LLM质量分级

分级模型迭代

ArkTS指令数据构造:通过代码解释反向构造指令数据

原始代码片