Google 也在邊推進邊摸索 AI 安全業界共同面對即時防禦挑戰

2026/05/26

Google 內部坦承 AI 安全議題仍處於即時應對階段，連業界龍頭都在邊推進邊摸索。Prompt injection、資料外洩、模型濫用等新興威脅讓整個 AI 業界共同面對防禦挑戰。

Google 內部坦承，AI 安全議題仍處於「即時應對、邊做邊學」的階段，連業界龍頭都尚未建立完整的防禦框架。從 prompt injection、資料外洩、模型濫用，到深度造假與供應鏈攻擊，新興威脅層出不窮，讓整個 AI 業界共同面對前所未有的防禦挑戰。這個現象反映 AI 安全並非單一公司或產品能夠解決，而是需要全產業協作的長期課題。

prompt injection 是當前 AI 安全領域最棘手的問題之一。攻擊者透過精心設計的輸入內容（可能藏在網頁、文件、圖片中），讓 AI 模型在處理時被「劫持」執行非預期的指令，例如洩漏系統提示、執行未授權操作、生成有害內容。由於大型語言模型的本質是基於統計模式預測，難以從根本上區分「合法指令」與「惡意注入」，目前仍沒有完美解方。Google、Anthropic、OpenAI 等都採用多層防禦策略，但仍持續有新型 prompt injection 被披露。

資料外洩是另一項持續關注的風險。當 AI 模型被部署在企業環境中，可能透過聊天介面、API 整合、自動化工作流接觸大量敏感資料（如客戶資料、財務資訊、智財權內容）。若模型權重、推論記錄或快取機制存在漏洞，這些敏感資料可能被攻擊者透過特定查詢方式提取。Google 近期針對 Workspace 整合的 Gemini 推出多項資料隔離機制，但仍持續發現新型外洩管道。

模型濫用層面，AI 工具被用於詐騙、假訊息傳播、自動化攻擊的案例急速增加。深度造假（deepfake）技術讓影音造假門檻降至接近零，社交工程詐騙因 AI 個人化能力大幅升級。資安業者觀察到的 AI 輔助釣魚郵件、語音複製詐騙、自動化漏洞掃描等攻擊模式都在持續演化，傳統防禦工具難以有效偵測。

業界分析人士指出，AI 安全的核心挑戰在於攻擊面隨技術演進而持續擴大，但防禦工具的開發速度往往跟不上。傳統資安採用「特徵比對」、「異常檢測」、「規則引擎」等方式，但對於 AI 系統的非確定性行為效果有限。新一代 AI 安全工具需結合行為分析、紅隊演練、形式化驗證等多種技術，並透過業界共享威脅情資加速應對。

從監管面看，全球各國對於 AI 安全的規範仍在快速演化。歐盟 AI 法案、美國加州 SB 1047 後續修法、英國 AI 安全研究所的紅隊測試報告，以及國際合作機制如 AI Safety Summit 等，都在試圖建立 AI 系統的最低安全門檻。然而監管落地速度遠跟不上技術發展，業者多採取「自願性最佳實踐」配合「事後補丁」的模式，這也是「邊推進邊摸索」的根本原因。

對企業使用者而言，部署 AI 系統時必須將安全納入設計階段，而非事後補強。具體做法包括：建立明確的 AI 使用政策、實施權限分級與資料隔離、定期進行紅隊測試、建立事件回應流程、以及選擇具備透明安全框架的供應商。同時，員工 AI 安全意識訓練也是不可或缺的環節，特別是對 prompt injection 與社交工程的辨識能力。

短期內，AI 安全事件預計將持續增加，業者與企業使用者必須建立更主動的防禦姿態。中長期觀察重點則在於業界能否建立統一的 AI 安全標準與認證機制、新一代 AI 安全工具的成熟速度、以及監管機構能否找到不扼殺創新但能有效控管風險的平衡點，這些將共同決定 AI 普及化能否在安全前提下持續推進。