2025年中期策略会速递——AI，持续看好算力需求，Agent进展提速.docx

基本信息

文件名称：2025年中期策略会速递——AI，持续看好算力需求，Agent进展提速.docx

文件大小：809.1 KB

总页数：7 页

更新时间：2025-06-20

总字数：约6.28千字

文档摘要

AI算力：看好算力需求积极向上趋势

从策略会我们观察到，全球AI算力需求持续上行趋势不改，我们认为，训练端与推理端两条主线都对未来AI算力需求保持积极推动：

训练端来看，模型层后训练阶段不断有新的scaling路径涌现；新架构正在积极探索过程中，未来有望重启预训练阶段的算力需求叙事；全球大规模算力集群有望伴随英伟达B系列交付节奏的恢复加速推进，主权AI正逐步落地。

推理端来看，策略会上我们观察到，部分AI应用厂商已探索出可复制的落地场景，加速实现从简单环节到复杂环节的产品升级。Agent的加速落地有望带来tokens调用量十到百倍提升，推理需求有望加速放量，我们看好AI算力需求持续向上。

训练端：预训练ScalingLaw有望开启新起点

训练端来看，总结最近的大模型迭代趋势，模型架构的改进或是ScalingLaw提速的可行性方案，预训练有望诞生新的起点。从近期的模型架构探索来看，腾讯发布的混元大语言模型TurboS，是业界首个大规模部署的Transformer-Mamba专家混合（MoE）模型，通过Mamba架构在长序列处理上的卓越效率与Transformer架构在上下文理解上的固有优势的有机协同，实现了性能与效率的平衡。Google于5月的I/O大会上发布了GeminiDiffusion文本扩散模型，能够通过将随机噪声转换为连贯的文本或代码来生成输出，类似图像/视频生成模型的工作模式，GeminiDiffusion是大厂在商业化模型上首次将扩散模型用于文本生成，或是类似于OpenAIo1一样的重要路径转折点。自2024年下半年模型参数的扩大的趋势有所放缓，llya在NeurlPS演讲中表示互联网中用于模型训练的公开数据已到达瓶颈，我们认为，模型架构的改进或为预训练阶段找到ScalingLaw的新路径，预训练阶段的AI算力叙事有望开启新起点。

图表1：AI大模型演进历程

OpenAI

OpenAI官网，华泰研究

资料来源：产业端来看，我们也看到了算力需求继续上涨的积极信号，预训练的算力投入步伐从未停下。

资料来源：

免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。大规模算力集群随英伟达B系列交付节奏恢复加速落地。OpenAI星际之门项目与xAIColossus是全球大规模算力集群的代表项目，目前处于加速落地进程中。星际之门阿比林一期工程将包含8个建筑，每座建筑中都会有5万块完全互连的大型GPU集群，总共有多达40万块芯片，总发电容量将达到1.2GW，从最新释出的项目现场视频来看，目前其中2座主体建筑基本完工，伴随英伟达GPU的逐步交付正在进行算力机架与冷却系统的铺设。

免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。

图表2：美国在建大型算力集群项目

OpenAIMegafactory

OpenAIMegafactory纪录片（2025.5）、华泰研究

资料来源：北美算力租赁厂商订单加速增长，反映出大模型厂商对未来算力需求的乐观态度。CoreWeave作为北美最大的算力租赁厂商之一，3月底在纳斯达克上市，自上市以来涨幅接近260%，反映了美股资本市场对算力端的信心。2025年3月，公司与OpenAI签署5年119亿美元的合同；2025年5月，公司与OpenAI再签40亿美元拓展协议，期限至2029年；根据公司25Q1电话会，截至25Q1，公司收入积压为259亿美元，同比增长63%。从CoreWeave订单快速增长来看，高端GPU需求仍存在强劲的增长动能，证明了全球算力需求高景气度仍然存在，我们持续看好AI算力需求。

资料来源：

图表3：CoreWeave在手订单数量快速增长

(十亿美元)

Coreweaverevenuebacklog（收入积压）

15.9

25.9

资料来源：24Q1

资料来源：

25Q1

免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。

CoreWeave

CoreWeave公告、华泰研究

免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。推理端：推理需求有望随Agent落地爆发

免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。

Agent需求的爆发或将驱动推理算力实现数十倍乃至上百倍的增长。据ArtificialAnalysis统计，在模型扩展律