Google Gemini 3.5 Flash 成本暴漲 3 倍,廉價 AI 模型時代正式終結
2026/06/02
Google 旗下生成式 AI 模型 Gemini 3.5 Flash 的定價較上一代調升三倍,引發業界對「廉價 AI 模型時代是否走到尾聲」的廣泛討論。過去兩年由模型廠商以低價策略推動 AI 普及的補貼模式,正面臨成本結構與商業可持續性的根本性挑戰。
Gemini Flash 系列是 Google 在大型語言模型市場的中階產品線,定位於 OpenAI GPT-4o mini、Anthropic Claude Sonnet 等競品之間,主打「能力夠用、定價親民」。過去 Google 為快速搶占開發者市場,將 Gemini Flash 價格壓低至業界最具競爭力的水準。但隨著模型能力大幅升級——包含上下文視窗擴大、推理能力提升、多模態整合更深——後端運算成本同步攀升,原本的低價策略已難以維持。
從產業面看,Gemini 3.5 Flash 的漲價並非個案。OpenAI 過去一年陸續上調 GPT-4o 與 o 系列模型部分使用情境的價格,Anthropic 推出 Opus 系列旗艦則維持較高單價。整體 AI 模型市場正從「擴大用戶基數的低價衝刺期」轉向「以更精細定價結構反映真實運算成本的成熟期」。對開發者而言,這意味著過去依賴大量呼叫低價 API 構建的商業模式,需要重新審視成本結構。
業界分析人士指出,這項轉折對 AI 應用層帶來三重影響:第一,仰賴大量 API 呼叫的 AI 編程助理、Chatbot 服務的毛利結構面臨壓力;第二,企業端對「自建本地推論模型」(如使用 Llama 系列、Mistral 等開源模型)的興趣可能上升;第三,模型供應商之間的價格差異化將更顯著,使用者選擇平台時不再只看能力,也須考量總體擁有成本。
未來 12 個月,AI 推論成本結構將是觀察整個 AI 商業生態能否從「燒錢搶用戶」轉向「可持續獲利」的關鍵指標。