Anthropic 推 Claude Opus 4.8 強化代理任務與程式開發能力
2026/06/02
AI 模型開發商 Anthropic 於 5 月 28 日發布旗艦模型 Claude Opus 4.8,在程式開發、代理式任務、推理與實務知識等多項基準測試上的表現均優於前一代 Opus 4.7。新版模型延續 Anthropic 在大型模型能力與安全性兼顧的設計哲學,並針對企業端應用場景做了多項優化。
過去一年,Anthropic 在前沿模型市場與 OpenAI、Google DeepMind 三足鼎立。Claude Opus 系列定位為公司最頂級的旗艦模型,主要競爭對手包含 OpenAI GPT-5 系列與 Google Gemini Ultra。Opus 4.8 在 SWE-Bench(軟體工程)、Terminal-Bench(命令列代理)、TAU-Bench(工具使用代理)等業界公認的高難度基準測試上取得新高分,特別在多步驟代理任務的長程穩定性表現顯著提升。
技術層面,Opus 4.8 採用 Anthropic 第三代 Constitutional AI 訓練框架,結合大規模強化學習與更深層的工具使用整合。模型在工具呼叫的決策準確度、複雜程式碼修改的正確率、跨文件編輯的一致性上均有明顯改善。同時,Anthropic 也強化了模型的安全護欄,降低提示詞注入與資料外洩風險,這些對企業客戶而言是關鍵採購條件。
從市場面看,Opus 4.8 的發布時間點與 Claude Code 用戶量爆發吻合。Anthropic 旗下 Claude Code 已成為開發者社群最廣泛採用的 AI 編程助理之一,與 Github Copilot、Cursor 等競品形成激烈競爭。Opus 4.8 的能力提升直接帶動 Claude Code 用戶體驗,並可能吸引更多企業客戶從其他 AI 編程平台遷移過來。
對 AI 模型市場而言,Anthropic 維持每數月一次主要版本更新的節奏,反映前沿模型競賽仍處於高速演進階段。預期 OpenAI 與 Google 將陸續推出回應產品,整體市場進入「能力快速迭代、定價策略分化」的新階段。