
Google Cloud 推出全新 AI 芯片 Ironwood 和 Axion
Table Of Contents
近年人工智慧(AI)模型的規模和複雜性呈指數級增長,使得高效能運算的需求成為科技行業的關鍵發展方向。AI 推論的工作負載已超越訓練階段,成為企業部署 AI 的主要挑戰之一。在這個背景下,Google Cloud 近日正式推出三款全新產品,其中包括第七代張量處理單元(TPU)Ironwood 和基於 Arm® 架構的 Axion 執行個體,標誌著 AI 推論應用的新紀元。

Ironwood:效能提升達 10 倍的 AI 核心引擎
作為 Google Cloud 最新一代的 TPU,Ironwood 將在未來數週內全面上市(general available)。該晶片專為應對最嚴苛的工作負載而設計,涵蓋從大規模模型訓練到高效能、低延遲的 AI 推論與模型服務。與前一代 TPU v5p 相比,Ironwood 的峰值效能(以每秒浮點運算數量計)提升了 10 倍;與 TPU v6e(Trillium)相比,每塊晶片的效能更提升了超過 4 倍。此外,Ironwood 還具備卓越的能源效益,使其成為目前 Google 最具競爭力的客製化晶片。
業界對 Ironwood 的初步反應十分熱烈。Anthropic 的運算主管 James Bradbury 表示:「我們的客戶依賴 Claude 執行關鍵任務,隨著需求不斷上升,我們正積極擴展運算資源以應對挑戰。Ironwood 在推論效能和訓練可擴展性方面達到了明顯優化,同時保持了速度和可靠性。」Anthropic 計劃使用多達 100 萬個 TPU,加速其 AI 研究與產品開發。
全新 Axion 執行個體:成本效益領先市場
除了 Ironwood,Google Cloud 還推出了基於 Arm® 架構的全新 Axion 執行個體 N4A。這是目前 N 系列中性價比最高的虛擬機器(Price-Performance 比達 2:1),現已進入預覽階段。N4A 特別適合需要高效能運算的企業用戶。例如,這意味著企業可以以更低的成本獲得更高的運算效能。此外,首款 Arm® 架構裸機執行個體 C4A metal 也即將推出預覽版,進一步擴展 Google Cloud 的產品組合。
這些創新成果得益於 Google 長期以來在客製化晶片領域的深耕,特別是從早期的 TPU 到近期的 Titanium 架構,逐步實現了技術突破。例如,自 2020 年以來,Google 已在百萬瓦(Megawatt)級別規模部署了先進的液體冷卻技術(即 GigaWatt 級別規模)。這項技術確保系統正常運作時間達到約 99.999%。
AI 推論時代的機遇與挑戰
隨著 AI 模型架構的持續演進,以及代理驅動的工作流程(agentic workflows),即由 AI 自主完成的任務流程的興起,企業正逐步將焦點從模型訓練轉向高效實用的模型互動。這種轉變不僅提高了對運算能力的要求,也為客製化晶片和系統架構帶來了新機遇。Lightricks 研究總監 Yoav HaCohen 表示:「我們依靠 Google Cloud TPU 實現開源多模態生成模型 LTX-2 的訓練效率顯著提高。隨著 Ironwood 的推出,我們相信它將協助我們為全球用戶提供更高品質的圖像和影片生成服務。」
Amazon Web Services (AWS) 和 Microsoft Azure 也在持續推出新的 AI 服務和工具,以應對企業對高效能 AI 推論的需求。Google 的 Ironwood 和 Axion 系列將在這場技術競賽中扮演關鍵角色,並進一步拓寬 AI 技術在各行業的實踐場景。
隨著更多企業採用 Ironwood 和 Axion,AI 推論的效能和成本效益將迎來新的里程碑。這場技術革命不僅改變了 AI 的應用方式,亦為各行業開拓更多實踐場景。


