Google Gemini 3.5 Flash 成本暴漲 3 倍，廉價 AI 模型時代正式終結

2026/06/02

Google Gemini 3.5 Flash 對開發者收費較上一代提高三倍，業界開始討論 AI 模型補貼時代是否走到尾聲，廉價 AI 推論成本模式面臨根本性轉折。

Google 旗下生成式 AI 模型 Gemini 3.5 Flash 的定價較上一代調升三倍，引發業界對「廉價 AI 模型時代是否走到尾聲」的廣泛討論。過去兩年由模型廠商以低價策略推動 AI 普及的補貼模式，正面臨成本結構與商業可持續性的根本性挑戰。

Gemini Flash 系列是 Google 在大型語言模型市場的中階產品線，定位於 OpenAI GPT-4o mini、Anthropic Claude Sonnet 等競品之間，主打「能力夠用、定價親民」。過去 Google 為快速搶占開發者市場，將 Gemini Flash 價格壓低至業界最具競爭力的水準。但隨著模型能力大幅升級——包含上下文視窗擴大、推理能力提升、多模態整合更深——後端運算成本同步攀升，原本的低價策略已難以維持。

從產業面看，Gemini 3.5 Flash 的漲價並非個案。OpenAI 過去一年陸續上調 GPT-4o 與 o 系列模型部分使用情境的價格，Anthropic 推出 Opus 系列旗艦則維持較高單價。整體 AI 模型市場正從「擴大用戶基數的低價衝刺期」轉向「以更精細定價結構反映真實運算成本的成熟期」。對開發者而言，這意味著過去依賴大量呼叫低價 API 構建的商業模式，需要重新審視成本結構。

業界分析人士指出，這項轉折對 AI 應用層帶來三重影響：第一，仰賴大量 API 呼叫的 AI 編程助理、Chatbot 服務的毛利結構面臨壓力；第二，企業端對「自建本地推論模型」（如使用 Llama 系列、Mistral 等開源模型）的興趣可能上升；第三，模型供應商之間的價格差異化將更顯著，使用者選擇平台時不再只看能力，也須考量總體擁有成本。

未來 12 個月，AI 推論成本結構將是觀察整個 AI 商業生態能否從「燒錢搶用戶」轉向「可持續獲利」的關鍵指標。

Google Gemini 3.5 Flash 成本暴漲 3 倍，廉價 AI 模型時代正式終結

相關文章

Apple 想複製 Apple Watch 成功劇本，顛覆傳統眼鏡行業

iOS 27 即將登場 5 大新功能搶先看

Bitcoin 崩盤觸發數十億美元清算潮

記憶體模組廠按讚後市，凌航：DDR4 / DDR5 將缺到至少 2028 年