AI行业跟踪报告第61期：全球GPU销量增长，存算一体产业布局加速.docx

基本信息

文件名称：AI行业跟踪报告第61期：全球GPU销量增长，存算一体产业布局加速.docx

文件大小：190.78 KB

总页数：9 页

更新时间：2025-03-27

总字数：约7.73千字

文档摘要

TOC\o1-2\h\z\u1、24年全球GPU销量增长 4

2、存算一体产业布局加速 4

3、东芯股份：聚焦中小容量通用型存储芯片的芯片研发设计公司 7

产品系列多样，闪存工艺国内领先 7

下游市场逐步回暖，24年亏损收窄 9

投资砺算科技，其首代芯片产品已正式进入流片阶段 9

4、投资建议 10

5、风险分析 10

图目录

图1：台式机系统独立显卡出货量 4

图2：三类存算一体技术 5

图3：东芯股份产品应用示例 7

图4：东芯股份NANDFlash产品 8

图5：东芯股份NORFlash产品 8

图6：东芯股份2020年-2024年前三季度营收及同比增速 9

图7：东芯股份2020年-2024年前三季度归母净利润及同比增速 9

表目录

表1：存算一体工艺介绍 5

表2：存算一体应用场景介绍 6

1、24年全球GPU销量增长

根据JonPeddieResearch的数据，2024年全球集成GPU和独立GPU的销量同比增长6%，达到2.51亿块。24H1台式机系统的独立显卡出货量为1820万张，同比增长46%。

然而，2024年第三季度的独立显卡出货量下降至810万张，低于2023年第三季度的890万张，这主要由于AMD库存调整及AdaLovelace和RDNA3架构生命周期的结束所致。尽管通常第四季度因新游戏发布而带动显卡销量上升，但2024年的表现似乎未遵循此趋势。JonPeddieResearch认为，鉴于24年上半年出货量的增长，2024年的独立显卡出货量可能与2023年持平甚至略高，但仍不及2022年或2021年的水平。

图1：台式机系统独立显卡出货量

JonPeddieResearch

2、存算一体产业布局加速

存算一体技术是指将计算逻辑直接嵌入到存储单元中，使数据在存储器内完成部分或全部计算任务，从而减少数据在存储器与处理器之间的传输。这种技术可以显著降低数据传输延迟和功耗，提高系统的整体性能。存算一体的核心思想是在数据所在位置进行计算，避免了数据的长距离传输。这一理念可以通过多种方式实现，包括在存储器内部集成计算单元、在存储器附近放置计算单元等。

存算一体技术可以根据存储与计算的距离远近分为三类：1、近存计算（ProcessingNearMemory,PNM）

近存计算（PNM）技术将计算单元靠近存储单元，但未完全集成在一起。通过

缩短数据传输距离，减少传输延迟和能耗。这种技术适用于需要高频数据交换但对集成度要求不高的场景，如某些高性能计算任务。PNM技术通过优化数据路径，提高了系统的整体性能。

2、存内处理（ProcessingInMemory,PIM）

存内处理（PIM）技术将计算单元部分集成在存储单元内部，但仍保留一定的分离。通过部分集成，进一步减少了数据传输，提高了能效。PIM技术在处理大规

模数据集和复杂计算任务时表现出色，适用于人工智能和机器学习等应用。PIM技术通过在存储单元内部进行部分计算，减少了数据移动，提高了计算效率。

3、存内计算（ComputinginMemory,CIM）

存内计算（CIM）技术将计算和存储完全集成在同一物理位置，实现了真正的存算一体。这种技术通过在存储单元内部直接执行计算任务，彻底消除了数据移动的延迟和能耗。CIM技术在处理大规模并行计算和深度学习任务时具有显著优势，适用于高性能计算和边缘计算等应用场景。CIM技术通过高度集成，提供了极致的计算效率和能效。

图2：三类存算一体技术

公众号【芯片设计进阶之路】

当前存算一体芯片研发企业/机构在成熟介质上的切入点集中在SRAM、Nor-Flash和DRAM等；部分学术机构选择切入RRAM等新型介质研发。从存储介质的分类来讲，分为易失性存储器和非易失性存储器。按照存储器件工艺划分为成熟存储工艺和新型存储工艺。

表1：存算一体工艺介绍

类别

子类别

优势

缺点

代表企业/机构

成熟存储工艺

SRAM

SRAM的优势是基于CMOS工艺，可以采用最先进的工艺节点，读写速度快；但是有存储密度低、静态漏电流高的

缺点。

基于SRAM的近存计算

基于CMOS工艺，读写速度快，适合大算力场景

存储密度低，静态漏电流高

Graphcore,Tenstorrent

基于SRAM的数字存内计算

改造SRAM阵列，加入数字计算逻辑单元，支持

MAC计算，适合AI大算力场景

存储密度低，静态漏电流高

后摩智能,苹芯,TSMC

基于SRAM的模拟存内计算