四月_AI 光通訊專題|全光交換OCS(Optical Circuit Switching)在Scale-across 的機會與物理極限

發佈於: 2026/04/02|分類: 科技(Technology)|

作者:智璞產業趨勢研究所執行副總 林偉智

 

觀察AI 資料中心網路的演進時,越來越明確感受到一件事:產業正在從「頻寬不夠」的問題,轉向「拓樸與物理極限」的問題。當 AI cluster 從單一資料中心的 scale-up,進一步走向跨資料中心的 scale-across,過去依賴 OEO(optical-electrical-optical)交換所建立的網路架構,開始出現結構性的壓力。延遲不再主要由交換節點數量決定,而是逐漸被跨資料中心的傳播距離與拓樸結構所主導;頻寬也不再只是堆疊更多 switch 就能解決,因為功耗與 SerDes 演進速度已經開始落後於 AI 算力的成長。如同之前OCS的研究,我認為光電路交換(OCS)會被重新拿出來討論,其實不是偶然,而是必然。OCS 的核心價值,在於它提供了一種不同於 packet switching 的思維:不是讓流量在網路中競爭,而是直接給它一條確定的路徑。當 GPU 與 GPU 之間

的通信變成高度可預測、且對延遲極為敏感的流量時,將其映射到固定的光通道(例如對應波長)是一個非常直覺的解法。

延續去年的研究,如果從光拓樸的角度來看,這類全光交換架構的本質,其實是將網路拆解成三個彼此正交的資源維度:空間、波長與路徑。

  1. SDM(Spatial Division Multiplexing)負責空間的切分,讓不同 cluster 可以在多芯光纖或多空間通道中各自運行,避免光纖數量隨規模成長而失控;
  2. WDM(Wavelength Division Multiplexing)則在單一光纖內切分頻寬,使不同資料流對應到不同波長並行傳輸;
  3. 而 OCS(Optical Circuit Switching)則負責建立端到端的光路,決定哪些節點之間需要被直接連接。

這三者共同構成一種「先切資源、再連路徑」的網路模型:流量不再共享一個充滿競爭的交換平面,而是被預先映射到特定的空間與波長,再透過 OCS 組合成專屬的光路,如下圖一。這種轉變,等於把網路問題從「壅塞與排隊管理」,轉換成「資源配置與路徑規劃」。

圖一

Source.  AI製圖;智璞產業趨勢研究所

然而進一步往下看時就會發現這條路並沒有想像中那麼「必要」。首先遇到的問題是光訊號本身的物理限制。當光訊號在不同群組之間多次切換時,會經過多個光學元件與放大器,使雜訊逐步累積並放大。這種劣化並非線性,而是在經過一定次數後迅速惡化,最終影響訊號可辨識性。因此系統在設計上必須限制光路徑的切換次數,實際可用的連接方式遠少於理論上的 full-mesh[全互連,每一個節點都可以直接連到所有其他節點],更接近一種受約束的近似拓樸。再往下看,功率預算與光放大器的能力,也會很快浮現為瓶頸。當距離拉長,或是路徑經過更多元件時,光訊號的衰減必須靠 EDFA 等設備補償,但這些設備本身帶來成本、功耗與維運複雜度。當系統從實驗室走向資料中心規模時,這些問題不再只是工程細節,而會直接影響整體架構是否可落地。這也讓我想到,OCS 並不是一個「更簡單」的網路,而可能只是把複雜度從電光層轉移到光層的架構。

另一個更深一層的問題,是延遲與距離的關係。即便使用光直連,訊號傳播的物理時間仍然存在,RDMA(遠端存處) 延遲會隨距離線性增加,進而導致網路裡同時在跑的資料變多了。這會讓網路在某些時刻承受更大的壓力,甚至提高壅塞與資料損失之風險。為了解決這個問題,一種常見的做法是將每一個重要流量對應到專屬的波長,避免競爭。但這其實等於用資源去換穩定性:你不再需要處理塞車與干擾,但你需要更多波長、更多光模組、甚至更多光纖。因此目前的研究認為:OCS 的價值並不在於取代既有的 OEO 架構,而是在特定條件下,提供一種更有效率的「旁路」。它適合用在那些流量模式穩定、需求可預測、且對延遲極為敏感的場景,例如跨兩個資料中心之間的 GPU 訓練流量。但一旦進入多租戶、動態變化、或需要高度彈性的網路環境,packet switching 仍然是不可或缺的。這也意味著,未來的 AI 網路不會走向全光化,而是走向一種混合架構:部分流量走 OCS,追求確定性與低延遲;其餘大部分流量仍然依賴 OEO,提供彈性與通用性。

從產業的角度來看,我認為真正的機會並不在於單一技術突破,而是在於整個系統需求的結構性擴張。當我們選擇用「一條流量對應一個波長」來換取穩定性時,實際上是在放大對光資源的需求,包括波長數量、光模組密度、以及光纖容量。同時,為了支撐這些光路徑,WSS(Wavelength Selective Switch, 波長選擇開關)相干光模組、光放大器等元件的重要性也會同步上升。更關鍵的是,控制平面與調度系統必須能夠理解並管理這些光資源,否則再好的光層能力也無法被有效利用。總結來說,我會把 OCS 視為 AI 網路演進中的一個重要拼圖,而不是終局答案。它解決了部分問題,但同時引入新的限制與成本。真正的趨勢,是整個網路從單一技術主導,走向多層次協同的架構。在這個過程中,光通訊的角色會越來越核心,但它的價值,不在於「取代一切」,而在於「讓整個系統能夠繼續擴張」。

 

三月_AI 光通訊專題|從銅到光 AI 資料中心架構剖析
四月_虛擬貨幣專題|避險神話的破滅與重塑:從美伊戰火看比特幣的革命
—欲索取更多資訊,請點聯繫我們
現在就立刻分享文章