要提高算力,我們通常首先想到提高單個芯片的處理速度,但實際上,芯片之間的通信速度同樣關鍵。在計算機網絡通信中,帶寬和延遲是兩個關鍵衡量指標,而對于 AI 網絡來說,這一點同樣適用。
對于訓練上千億甚至萬億參數的大規模模型來說,單個 GPU 的處理能力已經顯得微不足道,計算任務往往需要由大型顯卡集群協同完成。
然而,當前 GPU 內存容量和性能正在迅速增長,但輸入/輸出(I/O)性能的增長卻相對滯後,這成了 AI 算力提升的重要瓶頸,導致了大量計算資源未被充分利用,造成了資源浪費。
圖丨網絡 I/O 性能跟不上 GPU 計算性能(來源:Enfabrica)
由于傳統 PCIe 協議的發展依然落後于時代需求,英偉達轉而開發專有接口協議 NVLink 來應對這一問題,也借此掌控了行業內的✅話語權。
也有英特爾、AMD、谷歌、微軟等公司開發行業開放標准 Ultra Accelerator Link 與此對抗。
與之不同是,一家名爲 Enfabrica 的初創公司則選擇開發網絡互聯芯片,通過提供一種替代的擴展方式,融入現有 AI 算力體系中,以實現更高效的數據傳輸,從而減少算力閑置,整體上提高算力系統的利用率。
這輪融資由 Spark Capital 領投,ARM、思科、三星等參投等,並得到了現有投資者的支持。
據了解,ACF SuperNIC 芯片采用了一種融合縱向擴展(Scale-Up)和橫向擴展(Scale-Ou✅t)的混合架構,形成了一個多維度的高帶寬域。
傳統網絡架構通常依賴于標准以太網網絡和 PCIe 交換機來實現擴展,但這種方式會遇到帶寬瓶頸和延遲管理的問題。
而 ACF SuperNIC 通過結合高基數的 800、400 和 100 千兆以太網接口、32 個網絡端口和 160 個 PCIe 通道,通過更高效的兩層網絡設計,能夠支持超過 50 萬 GPU 的 AI 集群,從而實現集群中所有 GPU 的最高橫向擴展吞吐量和最低的端到端延遲。
ACF SuperNIC 的設計目標是用其加速計算結構替代傳統的多層網絡基礎設施,實現計算、內存和網絡資源的可組合 AI 結構。
據 Enfabrica 的聯合創始人 Sankar 解釋,該架構充當中心輻射模型,能夠分解和擴展任意計算資源。
無論是 CPU、GPU、加速器、內存還是閃存,它們都可以連接到這個中心,從而使 ACF-S 有效地充當這些計算資源的聚合 I/O 結構設備。
這種集線器式架構爲計算、內存和網絡資源的靈活組合提供了基礎,實現了更高的可擴展性和計算效率。
該芯片基于台積電的 5 納米 FinFET 工藝上制造,采用標准的硬件和軟件接口,包括多端口 800 GbE 網絡、高性能 PCIe Gen5,以及 CXL 2.0+ 接口。
在單個矽片中集成了多太比特交換和異構計算與內存資源之間的橋接,通過集體內存分區,在多個端點之間實現低延遲零拷貝數據傳輸,提供更高效的主機內存管理和突發帶寬,從而共同提高 GPU 服務器群的整✅體效率和每秒浮點運算 (FLOP) 的利用率。
並且,ACF SuperNIC 所采用的標准接口,可以在不改變設備驅動程序和協議的情況下,在 CXL 3.0 到來之前實現內存擴展和共享,同時未來也兼容 CXL 3.0 標准。
這爲數據中心運營商✅提供了巨大的運營效率優勢,使他們可以在由來自多個供應商的 GPU 和加速器組成的 AI 計算隊列中部署通用的高性能後端網絡結構。
與此同時,該芯片所具有的“彈性消息多路徑”(RMM)技術,可大規模提高 AI 集群的彈性、可維護性和正常運行時間,消除由于網絡鏈路故障導致的 AI 作業停滯,從而提高有效訓練時間和 ✅GPU 計算效率,無需更改 AI 軟件堆棧或網絡拓撲。
該芯片將于 2025 年第一季度開始供貨。該公司預計,到 2027 年,其 SFA 芯片的互連市場規模將達到 200 億美元,主要目標客戶包括公有雲和私有雲運營商、HPC 系統制造商和網絡設備制造商。
未來,隨著 AI 模型的規模不斷擴大以及算力需求的提升,AI 芯片互聯市場或將繼續壯大。
根據 DellOro Group 的數據,到 2027 年,人工智能基礎設施投資將使數據中心資本支出增加到 5000 億美元以上。
與此同時,根據 650 Group 的數據,到 2027 年,數據中心在計算、存儲和網絡芯片上的高性能 I/O 芯片支出預計將翻一番,達到 200 億美元以上。
其他競爭對手如 Broadcom 和 Marvell 也在積極研發高性能交換機,博通的 Jericho3-AI 架構甚至可以連接多達 32,000 個 GPU。在中國,國數集聯也于今年 4 月推出了業界首款 CXL 多級網絡交換機參考設計。
特別聲明:以上內容(如有圖片或視頻亦包括在內)爲自媒體平台“網易號”用戶上傳並發布,本平台僅提供信息存儲服務。
蘋果CEO庫克回應DeepSeek AI到來:創新降低成本有利公司發展
首富馬斯克坐不住了!DeepSeek的沖擊波可能超越了華爲和Tiktok!
國星宇航沖擊港股IPO,洪泰基金、深創投等爲股東,成功發射全球首顆在軌AI超分商業衛星
《編碼物候》展覽開幕 北京時代美術館以科學藝術解讀數字與生物交織的宇宙節律
三星新專利顯示未來 Galaxy Buds 耳機有望配備 UWB 技術播放音頻
華碩 Zenfone 12 Ultra 手機正面照曝光:保留 3.5mm 耳機端口
庫克:iPhone的創新遠未結束 DeepSeek大模型提升效率創新是好事
三星 One UI 7.1 升級舊 Galaxy 機型拍攝體驗:複古濾鏡等