
在2026 年国际消耗电子展(CES)上,,,,,,,英伟达CEO黄仁勋宣布了Vera Rubin AI 超算平台,,,,,,,并推出推理上下文内存存储(ICMS)—— 这一被视为AI存储架构刷新的计划,,,,,,,正为 NAND闪存与SSD开发全新的AI推理应用场景。。。。。。。。现场展示的自力玄色存储机架,,,,,,,标记着AI硬件从“算力优先”向“算力+存储协同”的深刻转变。。。。。。。。
爱集微VIP频道克日上线Citi Research宣布的《英伟达推理上下文内存平台,,,,,,,进一步加剧NAND欠缺》。。。。。。。。本报告深度剖析了英伟达为Vera Rubin平台引入的ICMS架构,,,,,,,并通过量化的需求模子展望:这项立异将为全球NAND闪存市场带来结构性、大规模的增量需求,,,,,,,可能使本已主要的供应欠缺时势雪上加霜。。。。。。。。
接待订阅爱集微VIP频道
焦点洞察:一项架构刷新怎样重塑NAND市场
一、手艺焦点:用SSD解决AI推理的“内存墙”
英伟达为其Vera Rubin平台搭载了基于BlueField-4芯片的推理上下文内存存储(ICMS)架构,,,,,,,旨在解决大规模 AI 推理场景中普遍保存的内存瓶颈问题。。。。。。。。该架构的焦点立异在于:将AI推理历程中的要害键值缓存(KV Cache)从古板高带宽内存(HBM)中分流剥离,,,,,,,迁徙至扩展性更强的专用存储介质,,,,,,,挣脱对腾贵且容量受限的HBM的太过依赖。。。。。。。。
这一设计可带来三大性能提升:天生令牌速率最高提升5倍、能效最高提升5倍、延迟显著降低,,,,,,,从而周全强化Vera Rubin平台的AI推理算力。。。。。。。。
为清晰阐释ICMS的手艺逻辑,,,,,,,报告首先明确了KV Cache的焦点作用:作为Transformer 模子的要害内存优化机制,,,,,,,KV Cache 通过缓存已盘算的键值对阻止重复运算。。。。。。。。凭证内存层级,,,,,,,其可划分为四类:
-GPU HBM(G1层级):承载活跃KV缓存;;;;;
-系统 DRAM(G2层级):承载过渡/溢出 KV 缓存;;;;;
-外地SSD(G3层级):承载温/偏热KV缓存;;;;;
-传总共享企业存储(G4层级):用于存储冷 KV 缓存数据。。。。。。。。
ICMS的焦点突破,,,,,,,是在现有内存层级中新增一个G3.5层级。。。。。。。。该层级以16TB TLC SSD 为存储介质,,,,,,,可高效将海量、会见频率较低的冷KV缓存数据,,,,,,,转化为盘算单位可快速会见的温/热数据,,,,,,,相当于在高速但容量有限的HBM与大容量但速率较慢的古板企业存储之间,,,,,,,搭建起一层高容量、中高带宽的高速桥梁,,,,,,,从架构层面系统性缓解大模子推理的内存墙问题。。。。。。。。
二、需求量化:单台效劳器需求超1PB,,,,,,,市场影响显著
报告通过严谨的硬件规格推演,,,,,,,量化了ICMS带来的NAND需求攻击:
1.单台效劳器需求惊人
一台完整的Vera Rubin效劳器配备72块GPU。。。。。。。。凭证架构,,,,,,,每块GPU需对应16TB的SSD用于ICMS。。。。。。。。因此,,,,,,,单台效劳器就需要特殊搭载高达1152TB(即1.152PB)的NAND闪存。。。。。。。。
2.全球需求占比可观
守旧情景:假设2026年Vera Rubin效劳器出货3万台,,,,,,,将新增3460万TB的NAND需求,,,,,,,占2026年全球NAND总需求的2.8%。。。。。。。。
起劲情景:若2027年出货量增至10万台,,,,,,,新增需求将跃升至1.152亿TB,,,,,,,占2027年全球NAND总需求的9.3%。。。。。。。。
关于一个产能扩张周期长(通常需18-24个月)、供需本就紧平衡的市场而言,,,,,,,云云集中且重大的新增需求,,,,,,,无疑将显著加剧供应欠缺,,,,,,,并可能对价钱爆发强劲的向上支持。。。。。。。。
三、市场影响:焦点NAND供应商直接受益
报告明确指出,,,,,,,ICMS架构的落地将成为NAND闪存焦点供应商的重大利好。。。。。。。。直接受益的企业包括全球市场的向导者:三星电子、SK海力士、西部数据(闪迪)、铠侠、美光科技。。。。。。。。
这些公司依附其手艺、产能与客户关系,,,,,,,将率先承接来自英伟达及其效劳器相助同伴的订单,,,,,,,其市场份额与盈利能力有望获得提升。。。。。。。。
工业前瞻:AI驱动存储架构的范式转移
报告展现了一个逾越短期市场波动的恒久趋势:AI推理事情负载正在重塑数据中心存储层级。。。。。。。。当模子参数和上下文长度一直增添,,,,,,,KV Cache的巨细可能抵达TB甚至PB级,,,,,,,纯粹依赖HBM在本钱和物理上都不再可行。。。。。。。。
英伟达的ICMS架构标记着一个明确的转向:通过软件与系统架构立异,,,,,,,将海量、温冷的数据存储肩负向更高容量、更具本钱效益的NAND闪存转移。。。。。。。。这不但是为解决眼前的内存墙问题,,,,,,,更可能界说了未来AI效劳器的标准存储设置。。。。。。。。
连忙注册爱集微VIP账号
解锁报告所有内容
爱集微VIP频道:您的前沿手艺雷达
在手艺快速迭代、全球竞争名堂瞬息万变的时代,,,,,,,拥有系统、权威、前瞻的信息泉源是做出准确决议的条件。。。。。。。。爱集微VIP频道致力于打造ICT工业的全球报告资源库,,,,,,,通过“行业报告”“集微咨询”“政策指引”三大板块,,,,,,,为您提供:
-凌驾2万份深度工业与手艺研究报告,,,,,,,一连更新;;;;;
-每周新增数百篇前沿剖析与手艺解读,,,,,,,紧扣脉搏;;;;;
-笼罩手艺演进、市场动态、工业链结构的多维信息系统。。。。。。。。
我们坚持“信息普惠”原则,,,,,,,会员一次订阅即可会见全平台内容,,,,,,,无二次收费,,,,,,,无分级限制。。。。。。。。
限时会员通道现已开启,,,,,,,为您的专业决议注入一连动能:
-首月体验价仅需9.9元,,,,,,,以最低本钱,,,,,,,超值体验完整效劳。。。。。。。。
-月卡19.9元,,,,,,,无邪应对短期、高强度的信息需求。。。。。。。。
-季卡54.9元,,,,,,,以稳固的节奏,,,,,,,一连掌握工业脉搏。。。。。。。。
-年卡199元,,,,,,,是恒久主义者最具性价比的智囊同伴。。。。。。。。
连忙注册爱集微VIP账号,,,,,,,一天津渤海物流运营有限公司键获取《英伟达推理上下文内存平台,,,,,,,进一步加剧NAND欠缺》完整报告,,,,,,,深入明确英伟达ICMS架构怎样倾覆AI存储系统,,,,,,,及其对全球NAND闪存市场供需与焦点企业的深远影响。。。。。。。。