Anthropic 傳採購英國新創 Fractile 晶片 自製 AI 推論成本壓力浮現
2026/05/05
AI 大廠 Anthropic 計畫向英國 AI 晶片新創公司 Fractile 採購晶片,目標是降低 Claude 系列模型在大規模商用時的推論(inference)成本。這項合作若落實,將是繼 Google TPU、AWS Trainium/Inferentia 之後,又一家頂尖 AI 模型公司公開採用「非 NVIDIA」晶片方案的代表性案例。
Fractile 是英國半導體新創,主打為大型語言模型推論場景設計的客製化加速器。其架構強調以「In-Memory Computing」概念縮短記憶體與運算單元之間的資料移動距離,理論上可以在相同功耗下提供更高的 token 吞吐量。對於每天要處理數十億次 token 推論請求的 Anthropic 而言,每瓦每元的成本下降都會直接反映在毛利率與訂閱定價彈性上。
從產業趨勢看,Anthropic 此舉並非孤例。OpenAI 已多次傳出與多家新興晶片廠合作開發專屬加速器;Google 全面以自家 TPU 支撐 Gemini 訓練與推論;Meta 也持續推進自研 MTIA 系列。「前沿 AI 公司必須擁有非 NVIDIA 推論方案」已成業界共識,差別只在於時程與規模。Anthropic 過去主要依賴 AWS Trainium 與 Google TPU,本次傳出與 Fractile 接觸,等於進一步擴大其晶片組合的多元性。
對 NVIDIA 而言,這類消息短期內不至於動搖其在 AI 訓練端的絕對地位,但長期將持續壓抑其在「推論市場」的市占率成長空間。NVIDIA 自家也以 Blackwell 系列強化推論性能、推出較低成本的 GPU 變體因應,但客戶分散採購的趨勢已經形成。對於上游台積電而言,多家 AI 晶片新創客戶反而是長期利多——不論最終誰勝出,先進製程訂單都將落在台積電。
對英國科技生態而言,Anthropic 的訂單若成案,將是 Fractile 重要的市場背書。英國長期面臨頂尖 AI 人才與資金外流到美國的壓力,當地具備量產潛力的 AI 晶片新創相對稀少。Fractile 若能藉此突破估值與量產門檻,將為英國半導體產業帶來指標性帶動效應。
未來觀察重點包括雙方是否會公開合作細節、Fractile 晶片的實際量產時程、以及 Anthropic 是否會公開其推論平台的混合架構策略。AI 推論市場正進入「群雄並起」階段,誰能率先做到「成本斷崖式下降」,誰就能在下一輪 AI 應用競爭中拉開差距。