CES 2026專題｜CES 2026 不是新品發表，而是黃仁勳為未來十年 AI 公開定錨的時刻

發佈於: 2026/01/07|分類: 科技(Technology)|

作者：智璞產業趨勢研究所執行副總林偉智

CES（Consumer Electronics Show）是由美國消費者技術協會舉辦，全球最大規模的消費性電子展，首先登入大眾目光的，當然就是nVIDIA執行長黃仁勳的Keynote。許多人仍以「新品規格」、「效能提升幅度」與「短期需求訊號」解讀 CES 2026黃仁勳的 keynote，我認為黃實際上傳遞的是一個更高層次、也更長時間尺度的訊息：nVIDIA 正在嘗試為未來十年的 AI 發展，公開錨定其技術路徑、產業邊界與資本支出的重心所在。這並非一場產品發表會，而是一場

戰略層級的定位行動。從市場反應來看，CES 2026 後 nVIDIA 股價並未出現明顯波動，部分解讀認為「沒有釋出新的需求動能」、「缺乏對 2026-27年對應營收的指引或暗示」。然而，我認為黃仁勳選擇從 AI scaling law 是否仍然成立、AI 是否必然走向實體世界、以及在摩爾定律趨緩的條件下，算力該如何被系統性放大這三個根本問題出發。來跟大眾談談nVIDIA如何定位AI，同時把可能的商業機會放在後面討論。

從模型到平台：Scaling Law 的位置正在改變

黃仁勳在演講中清楚指出一個現實限制：模型參數規模與推論 token 數量仍在高速成長，但可用電晶體與能效改善速度已無法同步跟上。這等同於承認，傳統以製程與模型規模為核心的 scaling 路徑，已接近邊際效益遞減的區間。Vera Rubin 平台的真正意義，並不在於「效能是前一代的幾倍」，而在於它代表 nVIDIA 對 scaling law 的重新定義，從模型層，轉移到系統層與平台層。這也是為何 Vera Rubin 並非單一晶片，而是一次性重新設計 CPU、GPU、NVLink Switch、NIC、資料中心交換器與 DPU 的「極端共同設計」。在這個架構中，效能的提升不再來自單點突破，而是來自於以下幾件事的同步成立：

精度可動態調整的運算單元（如 NVFP4）
訓練、推論與 test-time reasoning 各自最佳化
記憶體、網路與儲存不再成為 scaling 的隱性天花板
能源與電力調度被視為系統設計的一部分，而非外部條件

這不是延續舊有 scaling law，而是試圖讓「有效運算量」持續成長，即便單一元件的進步速度已放緩。

source: nVIDIA

其中一個重要的訊號是，nVIDIA 對推論記憶體架構的重新定義。透過新的 Context Memory 與 DPU 管理架構，讓KV cache 不再只是暫存資料，而被提升為可被調度、共享與保護的系統級資產。這個轉變，讓記憶體與儲存不再只是算力的附屬成本，而是直接影響推論效率、服務品質與資本報酬率的關鍵變數。換句話說，他不是在優化KV cache這個必要但麻煩的暫存資料(向量)，而是在重新定義 AI 推論時「什麼才是真正的資產」。對 nVIDIA 而言，這不僅提升了 GPU 的實際變現能力，也讓其軟體與平台層對整個 AI 基礎設施的掌控進一步加深。從這個角度看，Vera Rubin 所代表的，並非單一世代產品，而是一套試圖將算力、記憶體、網路與軟體統合為「可長期營運的平台資產」的系統設計。我覺得，算是變相回應之前外界對伺服器折舊的疑慮。

Open Models Reach the Frontier：開放模型不是理想，而是結構需求

如果說 Vera Rubin 是對算力供給面的定錨，那麼 Physical AI 則是對需求結構的定錨。黃仁勳花了不少篇幅說明 AI不應再被理解為僅存在於資料中心與螢幕中的工具，像是生成簡報或找到你愛口味的滷肉飯店家，而是即將成為「理解、推理並影響真實世界」的決策系統。也就是Physical AI。

source: nVIDIA

黃提到，目前開放模型[Open Models]的能力曲線已逼近前沿模型，而使用開放模型的新創與企業，正快速成為主流。因此他認為重點並不在於哪一個模型最強，而在於開放生態的擴散速度與覆蓋廣度。nVIDIA 把「模型」變成可部署的單位，而不是一項研究成果得以讓使用者或企業更容易使用，同時將「硬體 × 軟體」變成類似 App Store 的關係。

source: nVIDIA

自動駕駛、機器人、工業設備與智慧工廠，並不是零散的應用場景，而是同一個趨勢不同投射面。順著黃的邏輯，我認為Alpamayo 推出在自駕平台上的象徵意義，不在於 nVIDIA 是否能在自駕市場擊敗既有玩家，而在於它清楚揭示了 nVIDIA 的定位選擇，是成為 Physical AI 的開放平台，而非終端品牌。這種策略，使其潛在市場不再受限於單一產業或單一商業模式，而是直接連結到全球汽車、製造、物流與工業設備的長期資本支出循環。一旦 AI 開始實質參與「車輛如何行駛」、「產線如何配置」、「設備如何自我優化」，算力需求將不再集中於少數的Hyperscaler資料中心，而是呈現高度分散、長期且跨景氣循環的特性。當然，馬斯克對於nVIDIA推出自駕平台的回應也令人玩味，他認為FSD後期遇到的許多問題才是考驗的開始。

在資料中心層級，訓練、推論或是模擬它們可以共享同一套可程式化GPU架構，但在 Physical AI 架構中，推論最終必須往邊緣與實體裝置移動，形成相互不可被完全取代的節點。黃延續此概念把Physical AI 平台依據部屬的場景拆解成訓練、模擬與推論。並明確視為三種不可互相取代的領域，同時存在、彼此協作。

訓練：資料中心等級（GB300）
模擬：生成合成資料、建構世界模型（RTX Pro）
推論：部署於車輛、機器人與設備端（Thor）

source: nVIDIA

在這三個領域中，Physical AI 的學習不是一次性訓練，而是「模擬->部署->回饋」的持續循環。也正是在這個循環中，AI scaling的資料來源被重新打開。AI 在模擬中學習，在現實中驗證，再回到模擬中修正，這個過程本身，就構成了新的 scaling 來源。

我覺得，這場 keynote 與其說是在展示目前nVIDIA既有優勢，不如說是在反映了黃仁勳心中抱持滿滿的危機感。但這不是對短期競爭的焦慮，而是對「AI 成長路徑可能被他人重新定義」的警覺。這個Keynote並非nVIDIA對未來的單向預測，而是一個高度主動、甚至帶著強烈危機意識的戰略行動。當模型規模持續放大、競爭者快速追趕、而摩爾定律已無法單獨支撐成長時，若不重新定義 AI 的成長路徑，領先地位終將被消耗在同質化競爭中。因此，我認為這場keynote 的核心，不是宣告 nVIDIA 已經贏了競爭或未來發展堪慮，而是試圖把 AI 的競爭焦點，從模型參數與單點算力，推進到系統工程、平台整合與現實世界的運作邏輯。平台規模、Physical AI、scaling、以及訓練、模擬與邊緣推論的閉環設計，都是「下一個十年仍能持續放大優勢」的戰略佈局。當市場仍以「GPU 出貨循環」理解 AI 產業時，黃仁勳試圖把時間軸拉到十年，並清楚劃出邊界。未來真正的競爭，不在於誰的模型最大，而在於誰能在高度競爭與不確定性中，讓 AI 成為現實世界中可長期運作、可被信任、且可持續擴張的決策引擎。

台廠的商機

在討論完戰略方向之後，Vera Rubin作為下一代AI Server 產品，想當然要有一定的升級來面對token數量平均增長5倍/年的情況。在訓練模型上，其效能比前一代Blackwell晶片提升3.5倍，在執行AI軟體時則快 5 倍。此外，新的中央處理器（CPU）擁有88個核心，效能是原先的兩倍。不僅如此， Vera Rubin AI Server，採用六顆晶片架構，CPU與GPU可雙向、低延遲共享資料系統可提供100 petaflops的AI運算能力，是前一代的五倍。在資料互聯方面，導入第六代NVLink交換器，可連接18個運算節點，支援最多72顆Rubin GPU同步運作，資料傳輸量超過全球網際網路總和。配合全球首款512通道、200Gb共封裝光學乙太網路交換器Spectrum-X，能將數千機櫃組成完整的AI工廠。這裡也是過去所說CPO導入的時間點。而整體AI Server系統層級上，72顆GPU組成的Vera Rubin NVL72機架，總記憶體頻寬可達1.6PB/s，較Blackwell平台提升近兩倍。

沒有意外的，根據過去宣布的新技術導入時程，這一代在電力上力推AI伺服器電源管理IC升級，800V的高壓直流（HVDC）元件將成市場趨勢，電源廠商的台達電、光寶科以及相關化合物半導體廠有機會直接搶攻商機；同時會導入台積電的晶背供電（BSPD）製程，讓先關晶圓薄化設備廠中砂、昇陽半以及PVD設備天虹等獲得相關商機。

還有許多升級所帶來的商機，像是冷卻設備、矽光等都令人期待，其中讓我印象深刻的是延續上面提到的nVIDIA 對推論記憶體架構的重新定義所改變的硬體。nVIDIA在加入Context Memory Storage Platform並推動DPU SSD Rack。換句話說，把原本屬於資料中心後段的資料處存的SSD，拉進 AI 推論的即時路徑，讓 SSD 從「容量設備」升級成「推論效能的一部分」。成為支撐長上下文、多回合代理與高並發推論的關鍵資源。這將催生一個以 DPU 為核心、以高效能企業級 SSD 為主體的全新儲存市場，其價值不在於容量本身，而在於對 AI 工廠吞吐量與投資報酬率的放大效應。Sandisk 的股價在發布的前後，表現非常強勁，台灣相關控制器與模組廠未來也是很有機會受惠此相關商機。