Google本週發布TPUv8雙軌晶片,聯發科主攻推論、博通負責訓練

Google本週發布TPUv8雙軌晶片,聯發科主攻推論、博通負責訓練

2026/04/21

Google預計於本週正式發布新一代 TPUv8 AI 晶片,並採取創新的雙軌設計策略:聯發科負責推論(Inference)晶片、博通(Broadcom)主打訓練(Training)晶片,此舉進一步反映 Google 在 AI 晶片供應鏈分散化與客製化上的深度布局。

根據科技新報引述 Wccftech 的報導,Google 預計在本週推出其新一代 AI 加速晶片 TPUv8,並採用此前市場尚未見過的雙廠商、雙定位架構:推論晶片由聯發科設計,訓練晶片則交由博通主導。這一安排不僅是技術分工的體現,更是 Google 刻意分散晶片供應商風險、強化供應鏈靈活性的戰略選擇。

理解這一布局,需先掌握訓練與推論在 AI 算力需求上的根本差異。訓練(Training)是讓模型從大量資料中學習參數的過程,需要極高的並行計算能力與記憶體頻寬,功耗高且運算密集;推論(Inference)則是將已訓練完成的模型部署於實際應用中以回應用戶請求,強調低延遲、高吞吐量與能源效率。兩者對晶片架構的要求截然不同,因此由不同廠商分別設計,具有相當的技術合理性。

聯發科近年積極進軍 AI 推論晶片領域,憑藉其在功耗控制與晶片整合設計上的豐富經驗,被 Google 選為推論端的合作夥伴。博通則是全球最大的 ASIC(特定應用積體電路)設計服務商之一,長期為大型科技公司提供客製化訓練加速器,與 Google 已有多年深度合作。兩者的加入,共同構成 TPUv8 生態系的技術底層。

從產業影響來看,此一雙軌策略對 NVIDIA 的間接挑戰意義重大。NVIDIA 的 H 系列與 B 系列 GPU 同時兼顧訓練與推論市場,而 Google 此次刻意將兩者拆開、分別委由不同廠商設計,意味著客製化晶片在特定工作負載上的效能與成本表現,可能開始明顯優於 NVIDIA 的通用解決方案。業界分析人士指出,這種「垂直整合 + 供應鏈分散」的組合策略,或許正是大型科技公司在 AI 晶片採購上逐漸降低對 NVIDIA 依賴的最有效路徑之一。

TPUv8 正式發布後的實際效能表現,以及 Google 是否對外開放雲端使用,將是後續市場觀察的焦點。