七月_GAI 專題|從運算架構發展,剖析Intel、AMD與NVIDIA的市場競局(下)
近期因為ChatGPT火熱的緣故,AI與其硬體佈建成為市場焦點,從所推出的產品來剖析Intel、AMD與NVIDIA三大晶片業者的優劣態勢。NVIDIA在2017年左右,推出以Tesla V100為基礎的伺服器DGX及其主機板HGX產品,此後如A100與H100面世後,NVIDIA皆仿照相同的作法甚至是進一步擴大,以資料中心需求為主推出更大規模的多伺服器方案,藉此厚植NVIDIA在伺服器產業生態的影響力,儘管當時Intel與AMD的CPU產品未受波及,但NVIDIA在2021年宣布將進軍伺服器CPU後,情況便開始有所改變,由於NVIDIA在完成收購Mellanox,一口氣補強在DPU、乙太網路與InfiniBand技術,如今Grace CPU也到位的情況下,幾乎可說是拼完了資料中心所需要的重要零組件的拼圖,NVIDIA也搖身一變,從晶片與顯卡的供應商,搖身一變成為重要的伺服器軟硬體供應商。而市場對於NVIDIA的印象,也不再只是專業的遊戲顯卡業者,反而儼然是AI 晶片的代名詞。NVIDIA在AI Model Training領域中,先以Telsa V100開始打下基礎後,再以Ampere架構為基礎的A100進一步擴大了NVIDIA在該領域的領導地位,也使得全球主要的CSP業者紛紛向其採購晶片,如入無人之境。甚至在中美科技戰的背景下,被美國政府祭出A100與下一代H100晶片禁止售予中國令,顯示了NVIDIA在全球AI Model Training市場地位幾近是居於不可動搖的程度。而Intel雖然長年來在伺服器與資料中心市場擁有領導話語權,但未如NVIDIA一樣以系統級方案的策略推動AI GPU產品搶攻市場。原本Intel受到自家製程延宕拖累,使得資料中心業務的營收表現不佳,再加上NVIDIA也祭出Grace CPU產品,使得Intel在資料中心與伺服器市場的未來發展又蒙上有別於AMD的陰影。而AMD雖然先後收購了Xilinx與Pensando後,也補強了FPGA與DPU戰力,但綜觀來看,其產品線完整度仍遜於NVIDIA,要打造資料中心系統級方案恐怕也力有未逮。
若以市場分析的角度來看NVIDIA為何能在AI晶片市場上獨霸,除了上敘觀以GPU領先的技術發動外,在軟體整合,推出的統一運算架構 CUDA、模擬空間 Omniverse等建構完整平台生態圈更是其競爭關鍵。由於NVIDIA經營CUDA生態系統已有相當長的一段時間,從開發工具、API、函式庫甚至是自有的雲端環境皆一應俱全,加上NVIDIA以CUDA架構投入AI領域的時間也遠早於AMD與Intel,所以縱使AMD收購Xilinx,亦或是Intel旗下亦有Habana等專用的AI加速晶片,仍不易撼動NVIDIA在AI的領導地位。當然,Intel與AMD也明白在軟體面在AI領域的重要性,所以近年來,兩家公司也不斷訴求,客戶所開發的軟體成果能從NIVIDIA平台輕鬆轉移至自家的硬體平台,但以現況來看,其成績仍是差強人意。Intel與AMD要如何趕上NVIDIA腳步進一步搶下其份額? 以自身優勢,建立平台、生態圈會是一個必要的努力,我們也相信這兩家大廠同樣的看到這個痛點,並積極的佈建當中。
隨著生成式AI已是不可避免的趨勢後,AI伺服器產業的議題討論,其重要性只會日漸提升。在PC市場在進入後疫情時代後,其市場熱度已不若當年因應遠距教學與工作的需求般火熱,PC市場在短期內在沒有明確的成長動能的情況下,這三大CPU/GPU業者勢必就得尋求其他的市場來填補整體營收的成長動能,而前述所提及的生成式AI的確是明確的市場需求,以現況而言,仍是以NVIDIA明顯居於領先的優勢。歸根究柢,在於Intel在AI晶片市場的策略過於反覆,不論是在收購上或是自有產品的開發,不時都能看出各產品線頗有定位不明的情況發生,對於客戶自然也會產生一頭霧水的情況。而AMD投入AI領域的時間晚於NVIDIA,在NVIDIA已逐漸站穩腳步後,儘管AMD有不錯的表現,推出MI250/MI300系列產品線嘗試努力追趕,但AMD在GPU領域的生態系統不如NVIDIA的CUDA來得完備且基礎厚實。觀察NVIDIA的產品布局與發布頻率,接替H100的產品應會在2024年發布,屆時AMD倘若還是只有以GPU效能表現跟NVIDIA比拚而沒有其他生態系的亮點,極有可能又會再被拉開雙方的差距。AMD若要想縮短其差距,在軟硬體的投資上勢必要加強力道,方能在未來的競局中窺見勝利曙光。





