CONTENTS目录
IDC观点 01
01 前言 02
大模型发端及内涵 02
国家政策推动中国大模型加速发展 03
大模型成为AI开发新范式 06
人工智能发展的挑战与阻碍 06
大模型带来AI开发新范式 09
大模型加速产业智能化变革 12
大模型带来AI技术与应用变革潜能被广泛验证 12
“模型+工具平台+生态”三级协同加速产业智能化 15
大模型加深度学习平台正在成为产业智能化基座 16
大模型的评估与典型市场参与者 19
产业生态图谱 19
大模型评估框架及评估结果 20
百度文心大模型 22
大模型未来发展趋势 33
大模型的发展是大势所趋 33
对行业用户的建议 34
对大模型供应商的建议 35
—
—01—
IDC观点
随着数字化转型需求增长,AI在企业中的应用也越来越多,AI开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题成为AI规模化落地的挑战,而预训练大模型的出现则为人工智能带来了新的机遇与希望。大模型作为政府和企业推进人工智能产业发展的重要抓手,在识别、理解、决策、生成等AI任务的泛化性、通用性、迁移性方面都表现出显著优势和巨大潜力。
IDC预测未来大模型将带动新的产业和服务应用范式,在深度学习平台的支撑下将成为产业智能化基座,企业需加快建设人工智能统一底座,融合专家知识图谱,打造可
IDC预测未来大模型将带动新的产业和服务应用范式,在深度学习平台的支撑下将成为产业智能化基座,企业需加快建设人工智能统一底座,融合专家知识图谱,打造可面
服务的“元能力引擎”。
具体来看:
大模型具有良好的通用性、泛化性,显著降低人工智能应用门槛。预训练大模型在海量数据的学习训练后具有良好的通用性和泛化性,用户基于大模型通过零样本、小样本学习即可获得领先的效果,同时“预训练+精调”等开发范式,让研发过程更加标准化,显著降低了人工智能应用门槛,成为AI走向工程化应用落地的重要手段。
深度学习平台为预训练大模型的发展保驾护航,两者结合夯实了产业智能化基座。深度学习平台是推动产业智能化转型升级的核心载体,为大模型的算法开发、训练、部署保驾护航。大模型加上深度学习平台,贯通了从硬件适配、模型训练、推理部署到场景应用的AI全产业链,夯实产业智能化基座,将加速产业智能化升级。
大模型在推进产业智能化升级中已表现出巨大潜力,企业应该尽早关注。大模型目前的产业应用包括面向企业提供AI中台基座、深度定制支持产品或生产的优化与创新、开放模型服务等。大模型已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力,企业应该尽早关注,在业务中布局。
未来还需加强大模型与真实场景需求匹配,推动大模型大规模落地。目前中国大模型厂商在模型布局方面较为完善,应进一步围绕行业赋能的广度和深度持续探索,不断夯实基于大模型的产品建设,推动大模型技术从实验室走向实际大规模落地。
—
—02—
前言
人工智能显著的溢出效应加快推进了新一轮科技革命,也带动了其他技术的进步。随着产业应用的深入、场景复杂度提升,随之而来的是数据的爆发式增长、算法的飞速更新迭代、算力的消耗指数上升,这些都对人工智能的发展提出新的要求。
1.1大模型发端及内涵
随着人工智能赋能实体经济进入深水区,企业通常面临数据资源有限、算力投资难度大、高水平人才稀缺的发展瓶颈。大模型作为解决上述问题的最优路径之一,可极大降低企业的技术门槛和开发成本。
IDC定义下的AI大模型是基于海量多源数据打造的预训练模型,是对原有算法模型的技术升级和产品迭代,用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。大模型的核心作用是突破数据标注的困境,通过学习海量无标注的数据来做预训练,拓展整体模型前期学习的广度和深度,以此提升大模型的知识水平,从而低成本、高适应性地赋能大模型在后续下游任务中的应用。在实践中,预训练大模型在基于海量数据的自监督学习阶段完成了“通识”教育,再借助“预训练+精调”等模式,在共享参数的情况下,根据具体应用场景的特性,用少量数据进行相应微调,即可高水平完成任务。
—
—03—
产业应用
原
任务相关少量数据
图1训练大模型“预训练+精调”模式
智能检索智能推荐智能客服智能审核工业质检智能录入智能对话智能创作智能问答文档理解
智能检索智能推荐
智能客服智能审核
工业质检智能录入
智能对话智能创作
智能问答文档理解
目标检测图像分割
类似人类学习机制
精调
专业教育
预训练
通识教育
海量无标注数据自监督学习文
海量无标注数据
自监督学习
文本 知识 图像 视频
从技术的角度来看,大模型发端于自然语言处理领