Anthropic 推 Claude Opus 4.8 強化代理任務與程式開發能力

2026/06/02

AI 模型開發商 Anthropic 發布 Claude Opus 4.8，在程式開發、代理式任務、推理與實務知識多項基準測試上均超越前一代 Opus 4.7，繼續推進前沿模型競爭。

AI 模型開發商 Anthropic 於 5 月 28 日發布旗艦模型 Claude Opus 4.8，在程式開發、代理式任務、推理與實務知識等多項基準測試上的表現均優於前一代 Opus 4.7。新版模型延續 Anthropic 在大型模型能力與安全性兼顧的設計哲學，並針對企業端應用場景做了多項優化。

過去一年，Anthropic 在前沿模型市場與 OpenAI、Google DeepMind 三足鼎立。Claude Opus 系列定位為公司最頂級的旗艦模型，主要競爭對手包含 OpenAI GPT-5 系列與 Google Gemini Ultra。Opus 4.8 在 SWE-Bench（軟體工程）、Terminal-Bench（命令列代理）、TAU-Bench（工具使用代理）等業界公認的高難度基準測試上取得新高分，特別在多步驟代理任務的長程穩定性表現顯著提升。

技術層面，Opus 4.8 採用 Anthropic 第三代 Constitutional AI 訓練框架，結合大規模強化學習與更深層的工具使用整合。模型在工具呼叫的決策準確度、複雜程式碼修改的正確率、跨文件編輯的一致性上均有明顯改善。同時，Anthropic 也強化了模型的安全護欄，降低提示詞注入與資料外洩風險，這些對企業客戶而言是關鍵採購條件。

從市場面看，Opus 4.8 的發布時間點與 Claude Code 用戶量爆發吻合。Anthropic 旗下 Claude Code 已成為開發者社群最廣泛採用的 AI 編程助理之一，與 Github Copilot、Cursor 等競品形成激烈競爭。Opus 4.8 的能力提升直接帶動 Claude Code 用戶體驗，並可能吸引更多企業客戶從其他 AI 編程平台遷移過來。

對 AI 模型市場而言，Anthropic 維持每數月一次主要版本更新的節奏，反映前沿模型競賽仍處於高速演進階段。預期 OpenAI 與 Google 將陸續推出回應產品，整體市場進入「能力快速迭代、定價策略分化」的新階段。

Anthropic 推 Claude Opus 4.8 強化代理任務與程式開發能力

相關文章

Apple 想複製 Apple Watch 成功劇本，顛覆傳統眼鏡行業

iOS 27 即將登場 5 大新功能搶先看

Bitcoin 崩盤觸發數十億美元清算潮

記憶體模組廠按讚後市，凌航：DDR4 / DDR5 將缺到至少 2028 年