科技新聞 – 英特爾推出全新GPU 擴展AI加速器產品組合

英特爾推出針對推論最佳化、代號為「Crescent Island」的資料中心GPU，並公佈Gaudi 3機架級參考設計

新聞重點：英特爾在2025年OCP Global Summit中，公布AI加速器產品組合的重要新增項目

全新代號為「Crescent Island」的英特爾資料中心GPU，專為因應日益成長的AI推論工作負載需求而設計，具備高記憶體容量與高能源效率的運算效能。
全新Intel® Gaudi® 3機架級參考設計，支援高記憶體頻寬區域（HBD）與液冷技術，可實現大型模型與即時推論系統的布署。

英特爾首席技術長Sachin Katti表示：「AI正從靜態訓練轉向即時且無所不在的推論運算，而這股轉變正由『代理式AI（agentic AI）』所驅動。為有效擴展這類複雜的工作負載，需要能讓不同晶片各展所長的異質系統，並以開放的軟體堆疊為基礎。英特爾採用Xe架構的資料中心GPU，將為客戶提供更高效能的運算空間與更高價值，以因應推論運算量的急速成長。」

重要意義

隨著推論成為AI的主要工作負載，成功的關鍵已不僅僅是強大的晶片，而是系統層級的創新。從硬體到調度管理，AI推論需要以工作負載為核心、開放且靈活的架構，能整合多元的運算形式，並以開放、以開發者為中心的軟體堆疊，打造易於布署與擴展的系統。

英特爾在端到端解決方案方面具備獨特優勢，從AI PC到資料中心與工業邊緣，解決方案基於Intel Xeon 6處理器、Intel Gaudi 3和Intel GPU，具備PCIe靈活性與機架級設計，降低企業與雲端服務商的布署障礙。

透過針對效能、能源效率與開發者延續性的協同設計，並與Open Compute Project（OCP）等社群合作，英特爾讓AI推論能在最需要的地方無所不在地運行。

關於GPU

全新代號「Crescent Island」的英特爾資料中心GPU，針對氣冷式的企業級伺服器進行功耗與成本最佳化設計，並具備大量記憶體容量與頻寬，專為AI推論工作流程而打造。

主要特色包括：

採用Xe3P微架構，提供最佳化的效能與功耗比。
配備160GB LPDDR5X記憶體。
支援多種資料類型，非常適合「Token-as-a-Service」供應商與各類推論應用場景。

英特爾針對異質AI系統打造的開放且統一的軟體堆疊，目前正於Arc Pro B系列GPU上進行開發與測試，以便提前進行最佳化與版本迭代。代號為Crescent Island的新款資料中心GPU，預計將於2026年下半年開始提供客戶樣品。

Gaudi 3彈性化的大規模AI推論

Gaudi 3支援從PCIe到機架級（rack-scale）的靈活布署，讓客戶能夠從既有基礎架構擴展至完整機架等級的推論效能。新的參考設計支援每個機架最多64個加速器，配備8.2 TB高頻寬記憶體與液冷系統，針對大型模型與即時推論進行最佳化。

科技新聞 – 英特爾推出全新GPU 擴展AI加速器產品組合

發佈留言 取消回覆

發佈留言取消回覆