
辉达(NVIDIA)GTC 2026 大会甫落幕,全球科技产业的目光再次聚焦于「AI 推论(Inference)」。执行长黄仁勋在演讲中明确指出,我们已经进入了「代币工厂(Token Factory)」的时代,计算需求在短短两年内暴增了百万倍。
在这场计算风暴中,半导体架构正经历一场前所未有的变革。过去我们关注的是计算核心的算力,但现在内存的表现才真正决定了 AI 代理人(Agentic AI)的反应速度和营运成本的表现。
异构推论新趋势:当GPU遇上LPU
在GTC相关报导和延伸讨论中,最受瞩目的技术转向莫过于「解构式推论(Disaggregated Inference)」。辉达整合了 Groq 团队的技术,推出全新的 Groq LP30 芯片。这背后的逻辑在于解决「内存墙」的瓶颈:Vera Rubin GPU擅长处理「预填(Prefill)」阶段,利用其强大算力处理海量上下文。Groq LPU则专攻「代币生成(Decode)」阶段。它的设计核心是舍弃传统的高带宽内存(HBM),改为搭载庞大的片上SRAM。
为什么是SRAM?因为它的延迟极低、速度极快。当AI在进行实时对话或生成程序代码时,数据能直接在芯片内部快速流动,不必频繁跳出芯片去存取外部内存。因此,SRAM的容量与稳定性决定了AI芯片的竞争力。
2D NAND 的意外逆袭:MLC 价格飙涨的背后
正当先进制程领域疯狂追求SRAM与HBM之际,成熟制程市场也爆发了震荡。根据产业最新情资,利基型内存市场正出现「价格翻倍」的奇异现象。
三星、美光等国际大厂为了腾出产能给利润更高的AI应用(如300层以上的 3D NAND),正加速淡出低容量、旧制程的2DNAND 产线。这导致了网通、数字电视与机顶盒等设备必备的MLC NAND 陷入严重断链,2026 年的供应量预计减半,市场缺口高达3至4成。
此现象反映出,即便在非 AI 核心计算的利基设备中,内存的可靠度与稳定供应依然是企业生存的命脉。当面临NAND史无前例的天价,如何确保每一颗出厂内存的完美质量,成为了IC设计公司与制造商获利的关键。
芯片良率:AI时代的隐形护城河
不论是GTC大会上备受推崇的SRAM核心LPU,还是市场稀缺的MLC NAND,都有一个共同的技术挑战:良率与可靠性。
随着先进制程迈向 N3P 甚至是更精细的维度,SRAM在芯片中所占的面积越来越大,发生故障的机率也随之增加。如果一颗昂贵的AI芯片因为内部的 SRAM损坏而报废,那将是企业巨大的财务损失。这也是为什么投资市场近期高度看好相关测试技术的原因——在追求极致效能的道路上,「测试与修复」已从以往的辅助角色,跃升为守护芯片设计质量的标配。
智能化与高弹性内存测试修复技术 成为获利关键
在这波 AI 推论与内存缺货潮中,芯测科技凭借着深耕多年的内存测试与修复技术,成为SRAM良率的守门员。如果说标准算法是基础防护,芯测的用户自定义算法平台(User-Defined Algorithm, UDA)就是一座灵活的研发基地。透过图形化接口与独家的 TEC(Testing Elements Change)技术,工程师无需编写复杂程序代码,即可针对高温、低压等特殊应用场景,自行量身打造测试策略。无论是侦测复杂的 Leakage Defect 还是多样化的内存缺陷(如 SAF、DRDF),UDA 都能实现全面性的防御效果,确保芯片在任何严苛环境下都能稳定运作。
同时,面对先进制程下日益复杂的SRAM架构,芯测推出的MART(MBIST Algorithm Recommendation Tool) 将 AI 技术导入测试流程,克服传统表格查询的繁琐和缺乏弹性的测试选择问题。用户仅需透过简单的互动问答,系统便会根据功耗、面积、良率等条件自动进行 AI 权重加权分析。这不仅大幅降低了决策成本与 DPPM(每百万颗不良品数),更让 BIST 算法的挑选从「人工经验」进化为「智慧化精准推荐」,协助客户在激烈的 AI 芯片赛局中夺得上市先机。