请务必阅读正文之后的免责条款部分目录
请务必阅读正文之后的免责条款部分
AI计算的性能优化需求催化ASIC市场迎来拐点 3
全球AI头部玩家布局AIASIC,前景预期乐观 4
产业链重点公司梳理 9
4. 总结 11
5. 风险提示 11
AI计算的性能优化需求催化ASIC市场迎来拐点
ASIC是一种专用芯片,与传统的通用芯片有一定的差异,是为了某种特定的需求而专门定制的芯片。ASIC芯片的计算能力和计算效率都可以根据算法需要进行定制,所以ASIC与通用芯片相比,具有以下几个方面的优越性:体积小、功耗低、计算性能高、计算效率高、芯片出货量越大成本越低。
图1:算力从通用走向定制
数据来源:《异构算力统一标识与服务白皮书》
大型云端服务供应商的业务模型、应用场景等很多通过自身的云来承载,每个云承载了独特的应用和商业模型,包括内部应用(比如搜索引擎、社交媒体等)、SaaS服务(比如AI聊天机器人、Copilot等)、IaaS服务等。ASIC可以适应不同的业务场景和商业模式的需求。
ASIC可以满足多种多样客户的需求,实现内部工作负载的架构优化,实现更低的功耗,更低的成本以及为AI工作负载定制的内存和I/O架构。
图2:每个云承载了独特的应用和商业模型 图3:ASIC芯片满足不同种类需求
数据来源:迈威尔官网 数据来源:迈威尔官网
这些年来,GPU的迭代速度非常快,算力增长迅速。网络迭代速度没有算力增长速度快,如何在网络速度相对滞后于GPU算力发展的情况下,确保GPU性能不降低,或者至少保持较强的发展势头,成为未来云基础设施在组网层面面临的一个重大挑战。所以我们认为,在AI场景下,要更好地发挥算力能力,网络通信能力至关重要,而无论是对于GPU芯片设计还是ASIC芯片设计,拥有高速通信技术的公司将有望具备更大优势。
请务必阅读正文之后的免责条款部分在训练阶段,训练集群对加速计算芯片的需求已提升到万卡级别。随着AI
请务必阅读正文之后的免责条款部分
模型对训练需求的提升,未来10万卡级别是大势所趋。图4:GPU迭代以及算力增长迅速
数据来源:博通官网
全球AI头部玩家布局AIASIC,前景预期乐观
集成电路产业链由上、中、下游三部分组成。集成电路产业链的上游包括EDA、IP、材料和设备等供应商;产业链中游主要包括芯片设计、晶圆制造和封装测试等企业;下游主要包括终端系统厂商。随着芯片产业升级,产
业链分工日益精细,集成电路设计产业的参与者逐渐细分为芯片设计公司,以及其上游的芯片设计服务公司、半导体IP供应商与EDA工具供应商等。芯片设计服务企业主要面向芯片设计公司与系统厂商等客户的芯片定制需求,具有多工艺、多领域、定制化、一站式等特点,已成为产业链重要一环。
图5:集成电路产业链格局 图6:2010-2021我国集成电路设计产业规模
数据来源:灿芯股份招股书 数据来源:灿芯股份招股书
2024年5月15日,谷歌正式发布了其最新一代TPU(张量处理器)芯片Trillium。第六代TPU芯片Trillium采用先进的芯片架构与制程工艺,单个TPU芯片的算力较上一代产品提高了2倍以上,同时能效比也获得显著提升。为满足大规模集群部署的需要,谷歌还发布了基于Trillium芯片的全新
请务必阅读正文之后的免责条款部分机架系统TPUv6Pod。每个TPUv6Pod由512个Trillium芯片(共4096个
请务必阅读正文之后的免责条款部分
TPU核心)组成,提供高达1.5ExaFlops的峰值性能,较上一代提升83%。Pod系统内置了高性能互连网络,芯片间采用ICI(Inter-ChipInterconnect)链路直连。
Google的TPU网络使用3D圆环拓扑来连接3D网格状结构中的节点。每个节点都连接到网格中的六个相邻节点(上、下、左、右、前和后),在三个维度(X、Y和Z)中的每一个维度上形成一个闭合循环,只需要48个光开关即可部署4096TPU。
图7:一台4096颗芯片组成的超级计算机的物理系统架构
数据来源:TPUv4:AnOpticallyReconfigurableSupercomputerforMachineLearningwithHardwareSupportforEmbeddings,AMachineLearningSupercomputerwithanOpticallyReconfigurableInterconnectandEmbeddingsSupport
图8:A