輝達GTC突顯AI時代的記憶體新賽局：從SRAM到MLC NAND的良率保衛戰

輝達（NVIDIA）GTC 2026 大會甫落幕，全球科技產業的目光再次聚焦於「AI 推論（Inference）」。執行長黃仁勳在演講中明確指出，我們已經進入了「代幣工廠（Token Factory）」的時代，運算需求在短短兩年內暴增了百萬倍。

在這場運算風暴中，半導體架構正經歷一場前所未有的變革。過去我們關注的是運算核心的算力，但現在記憶體的表現才真正決定了 AI 代理人（Agentic AI）的反應速度和營運成本的表現。

異構推論新趨勢：當GPU遇上LPU

在GTC相關報導和延伸討論中，最受矚目的技術轉向莫過於「解構式推論（Disaggregated Inference）」。輝達整合了 Groq 團隊的技術，推出全新的 Groq LP30 晶片。這背後的邏輯在於解決「記憶體牆」的瓶頸：Vera Rubin GPU擅長處理「預填（Prefill）」階段，利用其強大算力處理海量上下文。Groq LPU則專攻「代幣生成（Decode）」階段。它的設計核心是捨棄傳統的高頻寬記憶體（HBM），改為搭載龐大的片上SRAM。

為什麼是SRAM？因為它的延遲極低、速度極快。當AI在進行即時對話或生成程式碼時，數據能直接在晶片內部快速流動，不必頻繁跳出晶片去存取外部記憶體。因此，SRAM的容量與穩定性決定了AI晶片的競爭力。

2D NAND 的意外逆襲：MLC 價格飆漲的背後

正當先進製程領域瘋狂追求SRAM與HBM之際，成熟製程市場也爆發了震盪。根據產業最新情資，利基型記憶體市場正出現「價格翻倍」的奇異現象。

三星、美光等國際大廠為了騰出產能給利潤更高的AI應用（如300層以上的 3D NAND），正加速淡出低容量、舊製程的2DNAND 產線。這導致了網通、數位電視與機上盒等設備必備的MLC NAND 陷入嚴重斷鏈，2026 年的供應量預計減半，市場缺口高達3至4成。

此現象反映出，即便在非 AI 核心運算的利基設備中，記憶體的可靠度與穩定供應依然是企業生存的命脈。當面臨NAND史無前例的天價，如何確保每一顆出廠記憶體的完美品質，成為了IC設計公司與製造商獲利的關鍵。

晶片良率：AI時代的隱形護城河

不論是GTC大會上備受推崇的SRAM核心LPU，還是市場稀缺的MLC NAND，都有一個共同的技術挑戰：良率與可靠性。

隨著先進製程邁向 N3P 甚至是更精細的維度，SRAM在晶片中所佔的面積越來越大，發生故障的機率也隨之增加。如果一顆昂貴的AI晶片因為內部的 SRAM損壞而報廢，那將是企業巨大的財務損失。這也是為什麼投資市場近期高度看好相關測試技術的原因——在追求極致效能的道路上，「測試與修復」已從以往的輔助角色，躍升為守護晶片設計品質的標配。

智慧化與高彈性記憶體測試修復技術 成為獲利關鍵

在這波 AI 推論與記憶體缺貨潮中，芯測科技憑藉著深耕多年的記憶體測試與修復技術，成為SRAM良率的守門員。如果說標準演算法是基礎防護，芯測的使用者自定義演算法平台（User-Defined Algorithm, UDA）就是一座靈活的研發基地。透過圖形化介面與獨家的 TEC（Testing Elements Change）技術，工程師無需編寫複雜程式碼，即可針對高溫、低壓等特殊應用場景，自行量身打造測試策略。無論是偵測複雜的 Leakage Defect 還是多樣化的記憶體缺陷（如 SAF、DRDF），UDA 都能實現全面性的防禦效果，確保晶片在任何嚴苛環境下都能穩定運作。

同時，面對先進製程下日益複雜的SRAM架構，芯測推出的MART（MBIST Algorithm Recommendation Tool）將 AI 技術導入測試流程，克服傳統表格查詢的繁瑣和缺乏彈性的測試選擇問題。使用者僅需透過簡單的互動問答，系統便會根據功耗、面積、良率等條件自動進行 AI 權重加權分析。這不僅大幅降低了決策成本與 DPPM（每百萬顆不良品數），更讓 BIST 演算法的挑選從「人工經驗」進化為「智慧化精準推薦」，協助客戶在激烈的 AI 晶片賽局中奪得上市先機。