AI晶片專題｜一個人的雲端之AI 訓練晶片趨勢解析(上)

發佈於: 2025/07/01|分類: 科技(Technology)|

作者：智璞產業趨勢研究所執行副總林偉智

近期Daniel Kokotajlo等作者發表了AI 發展路線預測報告《AI 2027》，對未來幾年的AI發展做了一些大膽的情境推演。該作者曾任 OpenAI 治理與安全團隊研究員，2021 年預判了「鏈式思考（CoT）將成為大型模型必備能力、AI 晶片出口管制將升級、百萬美元級訓練成本會在 2024 年前出現」，這些預測後來全部命中，還被《Time100》與《Lawfare》點名為「少數成功長期押中 AI 路徑的人」。他離開 OpenAI 時捨棄數百萬美元股票，只為公開警示AI的倫理與治理風險。這種不愛真金愛真理的戲劇化反應加上先前準確的AI發展路徑預測，也讓這次他們發表的《AI 2027》增加了許多期待性與可讀性。文中以兩個虛構的公司「OpenBrain (美) vs. DeepCent(中)」的賽局作為骨幹描繪AI Agent從 2025 年到 2027 年的爆發性變化途徑，甚至在悲觀結局中提到2030年人類可能會有滅亡的疑慮。作者強調AI 的邊際效應(進步情況)會反過來加速下一輪 AI 研究，從第一代的

Agent-1能為研發加速1.5倍，等到了第四代Agent-4讓一年算法進步壓縮成一週。另外，成本卻可以隨能力呈 50倍每年的下滑，使超人等級能力的AI Agent迅速普及。這種「能力 × 自我加速 × 降本」進步情境與傳統產品的S曲線（需求飽和後趨平）截然不同，更像連續疊代的指數曲線。我也認同AI 不會是 Normal Technology，而是類似「電氣化→互聯網」級別的典範轉移，甚至超越「工業革命」等級的通用技術平台。到 2027 年，代表美國的OpenBrain 內部已形成「資料中心裡的一座天才國度」，人類研究員每天醒來都落後 AI 一週進度。報告也提到，自2025年AI Agent (Operator/Devin)個人助理開始起步，到2027年已脫離Demo階段，從滲透程式開發、文件生成、營運決策等工作皆能處理的比人類更好。《AI 2027》同時揭示AI Agent在發展上的兩個限制

算力層次差異，也就是LLM(大型語言模型) 訓練仍需雲端百萬顆 GPU；而低延遲推論、機器視覺等必須在邊緣或終端完成。
另一個是成本、功耗、佈署。2027年單顆雲端 GPU 逾 700 W，而可攜裝置 SOC/NPU 必須壓到 <10 W。

這兩個限制同時也告訴我們，「大模型＋多層級硬體(邊緣與終端)」才是AI Agent真正能規模化的前提，雲端所訓練出來高品質的模型提供參數更新與高並行推論，邊緣負責即時的部分推論與大部分決策，終端裝置則把Agent帶到人身邊或生產線末端。因此AI Agent 並非單靠「巨大模型」即可達成，還必須將雲端、邊緣、終端的能力疊加起來。雲端仍是 LLM 訓練大本營，但低延遲推論、工廠視覺與個人助理等場景，需要把部分能力搬到邊緣/終端。隨著 Agent-3 開始「自動科研」，成本功耗成了瓶頸：單顆雲端 GPU 已達700W(功耗瓦特) ，手持裝置 NPU 必須 <10W 才能普及。這解釋了為何 2024-2025 NVIDIA與OEM 搶推 “低功耗 GB200-Inference” 版本，也預示 2026 後Edge SoC 及模組競爭會異常激烈。無獨有偶，台積電在北美技術論壇的開場中，講者(資深副總張曉強博士)所提到：智慧無所不在(Intelligence Everywhere)，人工智慧革命正在從資料中心往邊緣蔓延，且將融入每個設備以支援新的應用。

在AI Agent 來臨的時代，不只《AI 2027》的情境分析中看到，這次Computex 2025 NVIDIA黃仁勳的演講與訪談中也不斷地被提到。我們認為AI Agent 要大量普及，真正拐點並非模型單點突破，而會是在雲端+邊緣+終端三層算力(晶片)的同步成熟與商業閉環。目前三個應用場域的晶片比較如下表一。

表一. 雲端、邊緣、終端三大應用場域之晶片比較

Source. IDC、TrendForce、《AI 2027》；智璞產業趨勢研究所整理

晶片未來的競爭重點如下：

雲端AI晶片戰場聚焦：先進封裝與HBM良率、光／矽光互連減瓶頸；指令集開放化、異質集群與能耗最適化；軟硬協同、供應鏈彈性與生態規模決定勝敗。加速器多元化、開源模型與雲運算成本三角平衡。
邊緣運算 SoC／ASIC 必須在維持既定算力的前提下，持續把 TOPS/W 極限向下推；整合高速網路（5G、Wi-Fi 7、乙太網）的傳輸效能，同時最佳化吞吐與延遲讓負載平衡更優化；內建加解密與運算配額機制，以兼顧隱私、防護與系統穩定性。
而終端的部分，應屬於作業平台與App迅速拉升裝置滲透率，NP的能力將成為裝置升級的催化劑。

本次專題討論將聚焦於訓練極限與低延遲推論這兩項我認為最具爆發性的戰線，也就是『雲端 × 邊緣』，以目前主流應用來看同樣可以視作『訓練 × 推論』的晶片討論。而終端（手機／AI PC／智慧穿戴等）晶片雖說也同樣重要，但目前仍屬換機驅動的創新，晶片架構特性與性能容易被其他變數影響，像是使用者友善的APP或外觀設計等，因此對AI Agent 生態的結構性衝擊相對有限，故暫列為後續專章討論。