基本信息
文件名称:2025年中期策略会速递——AI,持续看好算力需求,Agent进展提速.docx
文件大小:809.1 KB
总页数:7 页
更新时间:2025-06-20
总字数:约6.28千字
文档摘要

AI算力:看好算力需求积极向上趋势

从策略会我们观察到,全球AI算力需求持续上行趋势不改,我们认为,训练端与推理端两条主线都对未来AI算力需求保持积极推动:

训练端来看,模型层后训练阶段不断有新的scaling路径涌现;新架构正在积极探索过程中,未来有望重启预训练阶段的算力需求叙事;全球大规模算力集群有望伴随英伟达B系列交付节奏的恢复加速推进,主权AI正逐步落地。

推理端来看,策略会上我们观察到,部分AI应用厂商已探索出可复制的落地场景,加速实现从简单环节到复杂环节的产品升级。Agent的加速落地有望带来tokens调用量十到百倍提升,推理需求有望加速放量,我们看好AI算力需求持续向上。

训练端:预训练ScalingLaw有望开启新起点

训练端来看,总结最近的大模型迭代趋势,模型架构的改进或是ScalingLaw提速的可行性方案,预训练有望诞生新的起点。从近期的模型架构探索来看,腾讯发布的混元大语言模型TurboS,是业界首个大规模部署的Transformer-Mamba专家混合(MoE)模型,通过Mamba架构在长序列处理上的卓越效率与Transformer架构在上下文理解上的固有优势的有机协同,实现了性能与效率的平衡。Google于5月的I/O大会上发布了GeminiDiffusion文本扩散模型,能够通过将随机噪声转换为连贯的文本或代码来生成输出,类似图像/视频生成模型的工作模式,GeminiDiffusion是大厂在商业化模型上首次将扩散模型用于文本生成,或是类似于OpenAIo1一样的重要路径转折点。自2024年下半年模型参数的扩大的趋势有所放缓,llya在NeurlPS演讲中表示互联网中用于模型训练的公开数据已到达瓶颈,我们认为,模型架构的改进或为预训练阶段找到ScalingLaw的新路径,预训练阶段的AI算力叙事有望开启新起点。

图表1:AI大模型演进历程

OpenAI

OpenAI官网,华泰研究

资料来源:产业端来看,我们也看到了算力需求继续上涨的积极信号,预训练的算力投入步伐从未停下。

资料来源:

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。大规模算力集群随英伟达B系列交付节奏恢复加速落地。OpenAI星际之门项目与xAIColossus是全球大规模算力集群的代表项目,目前处于加速落地进程中。星际之门阿比林一期工程将包含8个建筑,每座建筑中都会有5万块完全互连的大型GPU集群,总共有多达40万块芯片,总发电容量将达到1.2GW,从最新释出的项目现场视频来看,目前其中2座主体建筑基本完工,伴随英伟达GPU的逐步交付正在进行算力机架与冷却系统的铺设。

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。

图表2:美国在建大型算力集群项目

OpenAIMegafactory

OpenAIMegafactory纪录片(2025.5)、华泰研究

资料来源:北美算力租赁厂商订单加速增长,反映出大模型厂商对未来算力需求的乐观态度。CoreWeave作为北美最大的算力租赁厂商之一,3月底在纳斯达克上市,自上市以来涨幅接近260%,反映了美股资本市场对算力端的信心。2025年3月,公司与OpenAI签署5年119亿美元的合同;2025年5月,公司与OpenAI再签40亿美元拓展协议,期限至2029年;根据公司25Q1电话会,截至25Q1,公司收入积压为259亿美元,同比增长63%。从CoreWeave订单快速增长来看,高端GPU需求仍存在强劲的增长动能,证明了全球算力需求高景气度仍然存在,我们持续看好AI算力需求。

资料来源:

图表3:CoreWeave在手订单数量快速增长

(十亿美元)

Coreweaverevenuebacklog(收入积压)

Coreweaverevenuebacklog(收入积压)

15.9

25.9

25

20

15

10

5

0

资料来源:24Q1

资料来源:

25Q1

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。

CoreWeave

CoreWeave公告、华泰研究

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。推理端:推理需求有望随Agent落地爆发

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。

Agent需求的爆发或将驱动推理算力实现数十倍乃至上百倍的增长。据ArtificialAnalysis统计,在模型扩展律