Skip to main content
IC知識站技術支援

輝達GTC突顯AI時代的記憶體新賽局:從SRAM到MLC NAND的良率保衛戰

By 2026-03-17No Comments

輝達(NVIDIA)GTC 2026 大會甫落幕,全球科技產業的目光再次聚焦於「AI 推論(Inference)」。執行長黃仁勳在演講中明確指出,我們已經進入了「代幣工廠(Token Factory)」的時代,運算需求在短短兩年內暴增了百萬倍。

在這場運算風暴中,半導體架構正經歷一場前所未有的變革。過去我們關注的是運算核心的算力,但現在記憶體的表現才真正決定了 AI 代理人(Agentic AI)的反應速度和營運成本的表現。

異構推論新趨勢:當GPU遇上LPU

在GTC相關報導和延伸討論中,最受矚目的技術轉向莫過於「解構式推論(Disaggregated Inference)」。輝達整合了 Groq 團隊的技術,推出全新的 Groq LP30 晶片。這背後的邏輯在於解決「記憶體牆」的瓶頸:Vera Rubin GPU擅長處理「預填(Prefill)」階段,利用其強大算力處理海量上下文。Groq LPU則專攻「代幣生成(Decode)」階段。它的設計核心是捨棄傳統的高頻寬記憶體(HBM),改為搭載龐大的片上SRAM。

為什麼是SRAM?因為它的延遲極低、速度極快。當AI在進行即時對話或生成程式碼時,數據能直接在晶片內部快速流動,不必頻繁跳出晶片去存取外部記憶體。因此,SRAM的容量與穩定性決定了AI晶片的競爭力。

2D NAND 的意外逆襲:MLC 價格飆漲的背後

正當先進製程領域瘋狂追求SRAM與HBM之際,成熟製程市場也爆發了震盪。根據產業最新情資,利基型記憶體市場正出現「價格翻倍」的奇異現象。

三星、美光等國際大廠為了騰出產能給利潤更高的AI應用(如300層以上的 3D NAND),正加速淡出低容量、舊製程的2DNAND 產線。這導致了網通、數位電視與機上盒等設備必備的MLC NAND 陷入嚴重斷鏈,2026 年的供應量預計減半,市場缺口高達3至4成。

此現象反映出,即便在非 AI 核心運算的利基設備中,記憶體的可靠度與穩定供應依然是企業生存的命脈。當面臨NAND史無前例的天價,如何確保每一顆出廠記憶體的完美品質,成為了IC設計公司與製造商獲利的關鍵。

晶片良率:AI時代的隱形護城河

不論是GTC大會上備受推崇的SRAM核心LPU,還是市場稀缺的MLC NAND,都有一個共同的技術挑戰:良率與可靠性。

隨著先進製程邁向 N3P 甚至是更精細的維度,SRAM在晶片中所佔的面積越來越大,發生故障的機率也隨之增加。如果一顆昂貴的AI晶片因為內部的 SRAM損壞而報廢,那將是企業巨大的財務損失。這也是為什麼投資市場近期高度看好相關測試技術的原因——在追求極致效能的道路上,「測試與修復」已從以往的輔助角色,躍升為守護晶片設計品質的標配。

智慧化與高彈性記憶體測試修復技術 成為獲利關鍵

在這波 AI 推論與記憶體缺貨潮中,芯測科技憑藉著深耕多年的記憶體測試與修復技術,成為SRAM良率的守門員。如果說標準演算法是基礎防護,芯測的使用者自定義演算法平台(User-Defined Algorithm, UDA)就是一座靈活的研發基地。透過圖形化介面與獨家的 TEC(Testing Elements Change)技術,工程師無需編寫複雜程式碼,即可針對高溫、低壓等特殊應用場景,自行量身打造測試策略。無論是偵測複雜的 Leakage Defect 還是多樣化的記憶體缺陷(如 SAF、DRDF),UDA 都能實現全面性的防禦效果,確保晶片在任何嚴苛環境下都能穩定運作。

同時,面對先進製程下日益複雜的SRAM架構,芯測推出的MART(MBIST Algorithm Recommendation Tool) 將 AI 技術導入測試流程,克服傳統表格查詢的繁瑣和缺乏彈性的測試選擇問題。使用者僅需透過簡單的互動問答,系統便會根據功耗、面積、良率等條件自動進行 AI 權重加權分析。這不僅大幅降低了決策成本與 DPPM(每百萬顆不良品數),更讓 BIST 演算法的挑選從「人工經驗」進化為「智慧化精準推薦」,協助客戶在激烈的 AI 晶片賽局中奪得上市先機。