美國 AI 創業公司 Anthropic 昨日在其官方 網誌 披露,旗下 Claude 系列模型在 2025 年 9 月遭疑似中國國家支持的黑客組織濫用,向全球多個大型企業及政府機構發動網絡滲透。事件被視為首批「大部分步驟由 AI 自行完成」的網絡間諜攻擊案例,反映 AI 的網絡安全風險急速上升。
Anthropic 表示,事件始於去年 9 月中旬,系統偵測到異常活動後展開調查,發現黑客以「安全測試人員」的偽裝身份,引導 Claude Code 執行一系列具高度攻擊性的指令。Cladue 模型其後極少人為干預地完成超過八成的滲透工作,包括掃描目標系統、編寫利用漏洞的攻擊代碼、竊取憑證、開設後門,以及整理外洩資料等。
據報,受影響目標廣泛涉及不同行業,如科技企業、金融機構、化工製造業及政府部門,被視為具高價值的情報來源。 雖然部份攻擊未能成功取得完整控制權,但整個行動的規模及技術層次,已顯示 AI 能大幅提升黑客的行動效率。
Anthropic 在網誌提到,事件涉及與中國國家背景有關的黑客組織,嘗試以自動化方式滲透,推動攻擊行動「規模化」。

Anthropic 又強調,這次攻擊展示 AI 技術被濫用時的風險。具備代理能力的模型可自行組織任務並持續執行,令傳統網絡防禦機制更難察覺異常活動。Anthropic 亦指出,黑客並非依靠突破模型的安全限制,而是利用「看似正常」的指令逐步誘導模型協助攻擊。
涉事帳戶已被封鎖,並向受影響機構及執法部門通報事件,Anthripic 同時加強內部濫用偵測系統,研發更精細的分類器以辨識惡意行為。 另外,Anthropic 早在 9 月初開始限制中國企業使用旗下服務,以降低被濫用的風險。
Anthropic 又指出,公開事件提醒業界,呼籲建立一致的安全標準,回應 AI 時代的新型網絡間諜風險。


