目 录
TOC\o1-2\h\z\u1、24年全球GPU销量增长 4
2、存算一体产业布局加速 4
3、东芯股份:聚焦中小容量通用型存储芯片的芯片研发设计公司 7
产品系列多样,闪存工艺国内领先 7
下游市场逐步回暖,24年亏损收窄 9
投资砺算科技,其首代芯片产品已正式进入流片阶段 9
4、投资建议 10
5、风险分析 10
图目录
图1:台式机系统独立显卡出货量 4
图2:三类存算一体技术 5
图3:东芯股份产品应用示例 7
图4:东芯股份NANDFlash产品 8
图5:东芯股份NORFlash产品 8
图6:东芯股份2020年-2024年前三季度营收及同比增速 9
图7:东芯股份2020年-2024年前三季度归母净利润及同比增速 9
表目录
表1:存算一体工艺介绍 5
表2:存算一体应用场景介绍 6
1、24年全球GPU销量增长
根据JonPeddieResearch的数据,2024年全球集成GPU和独立GPU的销量同比增长6%,达到2.51亿块。24H1台式机系统的独立显卡出货量为1820万张,同比增长46%。
然而,2024年第三季度的独立显卡出货量下降至810万张,低于2023年第三季度的890万张,这主要由于AMD库存调整及AdaLovelace和RDNA3架构生命周期的结束所致。尽管通常第四季度因新游戏发布而带动显卡销量上升,但2024年的表现似乎未遵循此趋势。JonPeddieResearch认为,鉴于24年上半年出货量的增长,2024年的独立显卡出货量可能与2023年持平甚至略高,但仍不及2022年或2021年的水平。
图1:台式机系统独立显卡出货量
JonPeddieResearch
2、存算一体产业布局加速
存算一体技术是指将计算逻辑直接嵌入到存储单元中,使数据在存储器内完成部分或全部计算任务,从而减少数据在存储器与处理器之间的传输。这种技术可以显著降低数据传输延迟和功耗,提高系统的整体性能。存算一体的核心思想是在数据所在位置进行计算,避免了数据的长距离传输。这一理念可以通过多种方式实现,包括在存储器内部集成计算单元、在存储器附近放置计算单元等。
存算一体技术可以根据存储与计算的距离远近分为三类:1、近存计算(ProcessingNearMemory,PNM)
近存计算(PNM)技术将计算单元靠近存储单元,但未完全集成在一起。通过
缩短数据传输距离,减少传输延迟和能耗。这种技术适用于需要高频数据交换但对集成度要求不高的场景,如某些高性能计算任务。PNM技术通过优化数据路径,提高了系统的整体性能。
2、存内处理(ProcessingInMemory,PIM)
存内处理(PIM)技术将计算单元部分集成在存储单元内部,但仍保留一定的分离。通过部分集成,进一步减少了数据传输,提高了能效。PIM技术在处理大规
模数据集和复杂计算任务时表现出色,适用于人工智能和机器学习等应用。PIM技术通过在存储单元内部进行部分计算,减少了数据移动,提高了计算效率。
3、存内计算(ComputinginMemory,CIM)
存内计算(CIM)技术将计算和存储完全集成在同一物理位置,实现了真正的存算一体。这种技术通过在存储单元内部直接执行计算任务,彻底消除了数据移动的延迟和能耗。CIM技术在处理大规模并行计算和深度学习任务时具有显著优势,适用于高性能计算和边缘计算等应用场景。CIM技术通过高度集成,提供了极致的计算效率和能效。
图2:三类存算一体技术
公众号【芯片设计进阶之路】
当前存算一体芯片研发企业/机构在成熟介质上的切入点集中在SRAM、Nor-Flash和DRAM等;部分学术机构选择切入RRAM等新型介质研发。从存储介质的分类来讲,分为易失性存储器和非易失性存储器。按照存储器件工艺划分为成熟存储工艺和新型存储工艺。
表1:存算一体工艺介绍
类别
子类别
优势
缺点
代表企业/机构
成熟存储工艺
SRAM
SRAM的优势是基于CMOS工艺,可以采用最先进的工艺节点,读写速度快;但是有存储密度低、静态漏电流高的
缺点。
基于SRAM的近存计算
基于CMOS工艺,读写速度快,适合大算力场景
存储密度低,静态漏电流高
Graphcore,Tenstorrent
基于SRAM的数字存内计算
改造SRAM阵列,加入数字计算逻辑单元,支持
MAC计算,适合AI大算力场景
存储密度低,静态漏电流高
后摩智能,苹芯,TSMC
基于SRAM的模拟存内计算