You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

Ironwood|谷歌新TPU出爐 攻推理訓練

By on April 11, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

谷歌(Google)周三(9日)在美國召開年度大會Google Cloud Next,超大規模運算及代理生態系統成為核心主題。現場發表第七代張量處理器(TPU)Ironwood,為谷歌首款專為推理訓練工作而設計的TPU晶片;單單是每顆晶片的峰值運算力,浮點運算速度高達4614萬億次(4614 TFLOPS)。

Ironwood為谷歌首款專為推理工作而設計的TPU晶片。(谷歌網上圖片)
每顆Ironwood晶片的峰值運算力,浮點運算速度高達4614萬億次。(谷歌網上圖片)

集群運算力快最強電腦24倍

大規模部署Ironwood晶片後,每個集群(Pod)將配備9216顆液冷晶片,浮點運算速度達到驚人的4250萬兆次(42.5 ExaFLOPS),運算力比全球最快的超級電腦El Capitan(1.7 ExaFLOPS)快上24倍。高頻寬記憶體(HBM)方面,Ironwood每顆晶片提供192 GB容量,單顆晶片頻寬大幅提升至7.2 Tbps,分別是上代Trillium TPU的6倍及4.5倍。

大規模部署Ironwood晶片後,每個集群將配備9216顆液冷晶片,浮點運算速度達到驚人的4250萬兆次。(YouTube影片擷圖)

谷歌同場介紹新模型Gemini 2.5 Flash,它基於Gemini 2.5 Pro相同的程式碼,惟運行速度更快及便宜,現已登陸AI Studio或Vertex AI平台試用。谷歌為AI代理推出一系列代理開發工具,例如代理開發套件(ADK),讓開發者不到100行代碼構建多代理系統,並透過Model Control Protocol(MCP)外掛工具。

谷歌最新加強Google Agentspace平台功能,讓員工探索、使用及管理公司批准的AI代理,包括與Chrome Enterprise整合(在瀏覽器搜尋框存取企業資源)、Agent Gallery(集中顯示內部可用的代理)、Agent Designer(免程式碼自訂代理介面)功能。這些工具支援全新開放式 Agent2Agent(A2A)協定,跟Anthropic的模型上下文協議(MCP)相輔相成,讓不同生態系統的代理無縫協作。

谷歌在美國賭城Sphere半球體巨屏,示範以AI重塑經典電影《綠野仙蹤》。(谷歌網上圖片)

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們