一月_Intel AI晶片專題|Intel 在AI 晶片之產品與策略意圖剖析(上)

發佈於: 2024/02/02|分類: 科技(Technology)|

隨著生成式AI在全球掀起一陣旋風,連帶使得AI與運算晶片等相關發展不斷地引起討論。除了依然當紅的NVIDIA仍居於領先地位、AMD努力佈局緊追在後。然而,在CPU一路保持領先的Intel近年來也展現強力搶市的企圖心。以下將針對Intel在高階運算晶片相關佈局做出解析與討論,以此一窺這半導體巨擘在AI領域上接下來的發展。眾所皆知,Intel佈局AI領域已有不少的時間,在Pat Geisger未重返Intel接掌CEO大位前,Intel的策略多採取收購策略、採取從指令集上導入向量與矩陣運算架構,強化處理器在AI與機器學習的表現,以及重回GPU市場競局等多管齊下的方式,搶佔AI晶片市場話語權。在Pat Geisger執掌CEO後,更以IDM 2.0策略,積極擴充自有產能與先進製程能力升級,短期策略以深化與各大晶圓代工業者合作,以彌補自有晶圓廠現今在產能與製程上的不足。雖有傳出美國政府有意想說服Intel 將晶圓廠切割出去,但目前從策略大方向如四年完成五個先進製程節點的量產,以滿足Intel旗下眾多產品與IFS(Intel Foundry Services)部門的產能需求等,得知Intel的IDM 2.0策略大抵不變。若再進一步來看,Intel的IDM 2.0策略恰是Intel在AI晶片市場能否成功的重要基石之一。

 

  • 在伺服器處理器上,加速新品推出速度,力保領先優勢:

資料中心的主要組成來自於眾多伺服器,而眾多的CSP(雲端服務供應商)公司近年來多以提升資料中心的運算能力,來擴大亦或是保持與其他競爭對手的領先距離,所以這也使得算力強大的GPU產品與ASIC晶片等,成為眾多伺服器業者積極搶購的重要產品。持平而論,面對AI運算,中央處理器本身在運算架構上並非是處理AI工作的首選,但以Intel的角度來說,從處理器中所內建的指令集優化,輔以先進製程的搭配,Intel的伺服器處理器也能在AI運算中扮演重要角色。

在2023年底的發表會上,推出第五代Xeon伺服器處理器,標榜是市場唯一內建AI加速功能的主流資料中心處理器。內含NPU,預計2024上半年上市,供雲端公司等大型企業部署。英特爾表示這款處理器處理AI的推論任務表現尤佳,以每瓦電力評估的效能改善36%。觀察Intel近年來在CPU的設計概念,可以說是大致抵定,原則上會分為P-Core(Performance)與E-Core(Efficiency)兩種不同的CPU,在Xeon處理器未來的發展路徑上,也不脫這樣的原則,P-Core負責因應高性能與複雜運算、E-Core聚焦能源效率的工作負載。這兩類CPU各自搭載Scalar(張量)引擎與Vector(向量)引擎,以對應AI與機器學習等運算工作,其中P-Core更進一步搭載Matrix(矩陣)引擎,以處理更為複雜的AI運算工作。Intel也在今年的創新日正式宣布,兩款CPU將會搭載Intel 3製程。Intel聚焦在資料中心的伺服器產品線主要以Xeon Scalable系列為主,分為Platinum、Gold、Silver與Bronze等四種級別,其中尤以Platinum系列鎖定高算力與AI模型訓練和推論等應用為主。大致上,Platinum處理器自2017年推出,截至目前為止,已經在2023年第一季推出第四代處理器(代號為Sapphire Rapids),同年更推出搭載HBM(高頻寬記憶體)版本,進一步拉抬處理器算力,藉此因應生成式AI的暴發性成長。在同年12月14號推出的第五代處理器(代號為Emerald Rapids),此款處理器預期搭載E-Core CPU,如前所述,製程將是Intel 3,2024年進入量產,Intel表示這款處理器處理AI的推論任務表現尤佳,以每瓦電力評估的效能改善36%。第六代處理器(代號為Sierra Forest)則是預計2024年上半年發布,顯而易見,Intel在伺服器處理器的市場策略相較於過往幾年變得較為積極,其主要原因在於避免AMD等其他對手持續蠶食伺服器市佔,同時站穩資料中心與AI高性能運算的領導地位。

 

  • AI模型訓練晶片/加速器晶片- Gaudi系列已略有成效

Intel過去在晶片收購策略上,先是收購FPGA大廠Altera,後期則有收購以色列新創AI晶片者Nervana,在2019年收購另一家新創AI晶片公司Habana,並在2020年取得AWS的採用。至此,Intel可說是完全拋棄Nervana相關產品的開發,全力投入Habana旗下的Gaudi產品,藉此設法拉近與NVIDIA在AI模型訓練市場的差距。

 

表1. Gaudi現有產品簡要規格一覽

Source:Habana官網;智璞產業趨勢研究所整理

 

Gaudi的產品定位是與NVIDIA的H100做競爭,皆是鎖定AI模型訓練、高性能推論與高算力應用,因此也搭載了HBM。就產品策略上,會與Intel的第三代、第四代Xeon Platinum處理器搭配,來滿足客戶需求。截至目前為止,除了美國幾個重要的學術研究單位引進了Gaudi晶片外,AWS也先後採用了Gaudi與Gaudi2,美超微(Supermicro)與戴爾(DELL)也有搭載。Gaudi2為2022年五月所推出,在生成式AI與大型語言模型上,也有相當出色的表現,根據Intel所提供的評測數據顯示,若是處理GPT-J的推論工作上,其性能相較於NVIDIA的H100約為1.09倍。而Intel也在今年的創新日宣布新一代Gaudi 3晶片將會採用5nm製程,預計將於2024年量產,而接續Gaudi 3的下一代產品,代號為Falcon Shores,量產時間則為2025年,詳細規格未定。從Intel收購Habana後,不難看出Intel對於該部門的深切期待,顯而易見。宏觀來說,市場普遍能被大多CSP業者所接受的AI模型訓練晶片,大致上還是以NVIDIA的A100與H100系列產品為大宗。相中這塊市場仍有利可圖的情況下,Intel以收購的Habana所打造的Gaudi,亦或是AMD所推出的MI300X GPU,皆是針對NVIDIA的產品而來。然而,扣除Google等這類也能獨力供應自身的訓練晶片的業者來說,觀察第三方AI模型訓練晶片市場,在NVIDIA過去長年以CUDA所打造的成熟生態系統,已經建立相當深厚的基礎,短時間內要翻盤並非易事,甚至可說難如登天。但換個角度看,畢竟該市場長年也被NVIDIA所壟斷,客戶端在某種程度上的確也需要有第二選擇,促使市場良性發展,所以這也讓AMD 與Intel有機會可以進入戰場的因素。

以2024年的發展走向來看,由於NVIDIA預計將推出接替H100的B100 GPU產品,以進一步因應大型語言模型的成長需求,Intel預計推出的Gaudi 3想必也將是劍指B100而來。以現今Intel在CSP市場所累積的基礎來說,如何有效地再進一步延伸,甚至與國內指標性的伺服器代工業者有更多的合作,應是2024年的觀察指標。

 

圖1. Gaudi發展藍圖路徑規劃

Source:Intel

一月_2024 CES 專題|CES 2024 AI全面啟動以改變人類的生活方式(下)
一月_Intel AI晶片專題|Intel 在AI 晶片之產品與策略意圖剖析(下)
—欲索取更多資訊,請點聯繫我們
現在就立刻分享文章