七月_GAI 專題|從運算架構發展,剖析Intel、AMD與NVIDIA的市場競局(下)
近期因為ChatGPT火熱的緣故,AI與其硬體佈建成為市場焦點,從所推出的產品來剖析Intel、AMD與NVIDIA三大晶片業者的優劣態勢。NVIDIA在2017年左右,推出以Tesla V100為基礎的伺服器DGX及其主機板HGX產品,此後如A100與H100面世後,NVIDIA皆仿照相同的作法甚至是進一步擴大,以資料中心需求為主推出更大規模的多伺服器方案,藉此厚植NVIDIA在伺服器產業生態的影響力,儘管當時Intel與AMD的CPU產品未受波及,但NVIDIA在2021年宣布將進軍伺服器CPU後,情況便開始有所改變,由於NVIDIA在完成收購Mellanox,一口氣補強在DPU、乙太網路與InfiniBand技術,如今Grace CPU也到位的情況下,幾乎可說是拼完了資料中心所需要的重要零組件的拼圖,NVIDIA也搖身一變,從晶片與顯卡的供應商,搖身一變成為重要的伺服器軟硬體供應商。而市場對於NVIDIA的印象,也不再只是專業的遊戲顯卡業者,反而儼然是AI 晶片的代名詞。NVIDIA在AI Model Training領域中,先以Telsa V100開始打下基礎後,再以Ampere架構為基礎的A100進一步擴大了NVIDIA在該領域的領導地位,也使得全球主要的CSP業者紛紛向其採購晶片,如入無人之境。甚至在中美科技戰的背景下,被美國政府祭出A100與下一代H100晶片禁止售予中國令,顯示了NVIDIA在全球AI Model Training市場地位幾近是居於不可動搖的程度。而Intel雖然長年來在伺服器與資料中心市場擁有領導話語權,但未如NVIDIA一樣以系統級方案的策略推動AI GPU產品搶攻市場。原本Intel受到自家製程延宕拖累,使得資料中心業務的營收表現不佳,再加上NVIDIA也祭出Grace CPU產品,使得Intel在資料中心與伺服器市場的未來發展又蒙上有別於AMD的陰影。而AMD雖然先後收購了Xilinx與Pensando後,也補強了FPGA與DPU戰力,但綜觀來看,其產品線完整度仍遜於NVIDIA,要打造資料中心系統級方案恐怕也力有未逮。
若以市場分析的角度來看NVIDIA為何能在AI晶片市場上獨霸,除了上敘觀以GPU領先的技術發動外,在軟體整合,推出的統一運算架構 CUDA、模擬空間 Omniverse等建構完整平台生態圈更是其競爭關鍵。由於NVIDIA經營CUDA生態系統已有相當長的一段時間,從開發工具、API、函式庫甚至是自有的雲端環境皆一應俱全,加上NVIDIA以CUDA架構投入AI領域的時間也遠早於AMD與Intel,所以縱使AMD收購Xilinx,亦或是Intel旗下亦有Habana等專用的AI加速晶片,仍不易撼動NVIDIA在AI的領導地位。當然,Intel與AMD也明白在軟體面在AI領域的重要性,所以近年來,兩家公司也不斷訴求,客戶所開發的軟體成果能從NIVIDIA平台輕鬆轉移至自家的硬體平台,但以現況來看,其成績仍是差強人意。Intel與AMD要如何趕上NVIDIA腳步進一步搶下其份額? 以自身優勢,建立平台、生態圈會是一個必要的努力,我們也相信這兩家大廠同樣的看到這個痛點,並積極的佈建當中。