英特爾推出針對推論最佳化、代號為「Crescent Island」的資料中心GPU,並公佈Gaudi 3機架級參考設計
新聞重點:英特爾在2025年OCP Global Summit中,公布AI加速器產品組合的重要新增項目
- 全新代號為「Crescent Island」的英特爾資料中心GPU,專為因應日益成長的AI推論工作負載需求而設計,具備高記憶體容量與高能源效率的運算效能。
- 全新Intel® Gaudi® 3機架級參考設計,支援高記憶體頻寬區域(HBD)與液冷技術,可實現大型模型與即時推論系統的布署。
英特爾首席技術長Sachin Katti表示:「AI正從靜態訓練轉向即時且無所不在的推論運算,而這股轉變正由『代理式AI(agentic AI)』所驅動。為有效擴展這類複雜的工作負載,需要能讓不同晶片各展所長的異質系統,並以開放的軟體堆疊為基礎。英特爾採用Xe架構的資料中心GPU,將為客戶提供更高效能的運算空間與更高價值,以因應推論運算量的急速成長。」
重要意義
隨著推論成為AI的主要工作負載,成功的關鍵已不僅僅是強大的晶片,而是系統層級的創新。從硬體到調度管理,AI推論需要以工作負載為核心、開放且靈活的架構,能整合多元的運算形式,並以開放、以開發者為中心的軟體堆疊,打造易於布署與擴展的系統。
英特爾在端到端解決方案方面具備獨特優勢,從AI PC到資料中心與工業邊緣,解決方案基於Intel Xeon 6處理器、Intel Gaudi 3和Intel GPU,具備PCIe靈活性與機架級設計,降低企業與雲端服務商的布署障礙。
透過針對效能、能源效率與開發者延續性的協同設計,並與Open Compute Project(OCP)等社群合作,英特爾讓AI推論能在最需要的地方無所不在地運行。
關於GPU
全新代號「Crescent Island」的英特爾資料中心GPU,針對氣冷式的企業級伺服器進行功耗與成本最佳化設計,並具備大量記憶體容量與頻寬,專為AI推論工作流程而打造。
主要特色包括:
- 採用Xe3P微架構,提供最佳化的效能與功耗比。
- 配備160GB LPDDR5X記憶體。
- 支援多種資料類型,非常適合「Token-as-a-Service」供應商與各類推論應用場景。
英特爾針對異質AI系統打造的開放且統一的軟體堆疊,目前正於Arc Pro B系列GPU上進行開發與測試,以便提前進行最佳化與版本迭代。代號為Crescent Island的新款資料中心GPU,預計將於2026年下半年開始提供客戶樣品。
Gaudi 3彈性化的大規模AI推論
Gaudi 3支援從PCIe到機架級(rack-scale)的靈活布署,讓客戶能夠從既有基礎架構擴展至完整機架等級的推論效能。新的參考設計支援每個機架最多64個加速器,配備8.2 TB高頻寬記憶體與液冷系統,針對大型模型與即時推論進行最佳化。