辉达GTC突显AI时代的内存新赛局：从SRAM到MLC NAND的良率保卫战

辉达（NVIDIA）GTC 2026 大会甫落幕，全球科技产业的目光再次聚焦于「AI 推论（Inference）」。执行长黄仁勋在演讲中明确指出，我们已经进入了「代币工厂（Token Factory）」的时代，计算需求在短短两年内暴增了百万倍。

在这场计算风暴中，半导体架构正经历一场前所未有的变革。过去我们关注的是计算核心的算力，但现在内存的表现才真正决定了 AI 代理人（Agentic AI）的反应速度和营运成本的表现。

异构推论新趋势：当GPU遇上LPU

在GTC相关报导和延伸讨论中，最受瞩目的技术转向莫过于「解构式推论（Disaggregated Inference）」。辉达整合了 Groq 团队的技术，推出全新的 Groq LP30 芯片。这背后的逻辑在于解决「内存墙」的瓶颈：Vera Rubin GPU擅长处理「预填（Prefill）」阶段，利用其强大算力处理海量上下文。Groq LPU则专攻「代币生成（Decode）」阶段。它的设计核心是舍弃传统的高带宽内存（HBM），改为搭载庞大的片上SRAM。

为什么是SRAM？因为它的延迟极低、速度极快。当AI在进行实时对话或生成程序代码时，数据能直接在芯片内部快速流动，不必频繁跳出芯片去存取外部内存。因此，SRAM的容量与稳定性决定了AI芯片的竞争力。

2D NAND 的意外逆袭：MLC 价格飙涨的背后

正当先进制程领域疯狂追求SRAM与HBM之际，成熟制程市场也爆发了震荡。根据产业最新情资，利基型内存市场正出现「价格翻倍」的奇异现象。

三星、美光等国际大厂为了腾出产能给利润更高的AI应用（如300层以上的 3D NAND），正加速淡出低容量、旧制程的2DNAND 产线。这导致了网通、数字电视与机顶盒等设备必备的MLC NAND 陷入严重断链，2026 年的供应量预计减半，市场缺口高达3至4成。

此现象反映出，即便在非 AI 核心计算的利基设备中，内存的可靠度与稳定供应依然是企业生存的命脉。当面临NAND史无前例的天价，如何确保每一颗出厂内存的完美质量，成为了IC设计公司与制造商获利的关键。

芯片良率：AI时代的隐形护城河

不论是GTC大会上备受推崇的SRAM核心LPU，还是市场稀缺的MLC NAND，都有一个共同的技术挑战：良率与可靠性。

随着先进制程迈向 N3P 甚至是更精细的维度，SRAM在芯片中所占的面积越来越大，发生故障的机率也随之增加。如果一颗昂贵的AI芯片因为内部的 SRAM损坏而报废，那将是企业巨大的财务损失。这也是为什么投资市场近期高度看好相关测试技术的原因——在追求极致效能的道路上，「测试与修复」已从以往的辅助角色，跃升为守护芯片设计质量的标配。

智能化与高弹性内存测试修复技术 成为获利关键

在这波 AI 推论与内存缺货潮中，芯测科技凭借着深耕多年的内存测试与修复技术，成为SRAM良率的守门员。如果说标准算法是基础防护，芯测的用户自定义算法平台（User-Defined Algorithm, UDA）就是一座灵活的研发基地。透过图形化接口与独家的 TEC（Testing Elements Change）技术，工程师无需编写复杂程序代码，即可针对高温、低压等特殊应用场景，自行量身打造测试策略。无论是侦测复杂的 Leakage Defect 还是多样化的内存缺陷（如 SAF、DRDF），UDA 都能实现全面性的防御效果，确保芯片在任何严苛环境下都能稳定运作。

同时，面对先进制程下日益复杂的SRAM架构，芯测推出的MART（MBIST Algorithm Recommendation Tool）将 AI 技术导入测试流程，克服传统表格查询的繁琐和缺乏弹性的测试选择问题。用户仅需透过简单的互动问答，系统便会根据功耗、面积、良率等条件自动进行 AI 权重加权分析。这不仅大幅降低了决策成本与 DPPM（每百万颗不良品数），更让 BIST 算法的挑选从「人工经验」进化为「智慧化精准推荐」，协助客户在激烈的 AI 芯片赛局中夺得上市先机。