AI安全 on SunOfficial

Anthropic 執行長親赴白宮公關：Mythos 如何成為華府的通關密碼

Mon, 20 Apr 2026 00:00:00 +0000

就在一個月前，川普政府將 Anthropic 列入「供應鏈風險」名單，總統本人甚至公開表示「不會再與他們往來」。然而本週五，這劇本出現了驚人翻轉——Anthropic 執行長 Dario Amodei 走進了白宮西廂，與白宮幕僚長 Susie Wiles、財政部長 Scott Bessent 進行會談。官方形容對話「有成果且具建設性」。

讓北京當局態度和緩的，並不是公關攻勢，而是一款尚未普遍開放的 AI 工具——Mythos。

Mythos 的駭客級能力

Mythos 是 Anthropic 於本月初低調發布的漏洞掃描模型。根據 Anthropic 当时公布的測試結果，Mythos 在內部評估中發現了幾乎所有主流作業系統與瀏覽器中數以千計此前未知的高危險漏洞——包括一個存在了 27 年的 OpenBSD 漏洞，以及一個在 FFmpeg 中存在 16 年、經過五百萬次自動化測試仍未被發現的缺陷。

美國AI領先神話破滅？史丹佛2026報告揭露中國崛起與安全基準雙重危機

Sat, 18 Apr 2026 00:00:00 +0000

美國AI領先神話破滅？史丹佛2026報告揭露中國崛起與安全基準雙重危機

「美國在AI領域擁有持久領先優勢」——這個支撐華盛頓政策論述的假設，正在被數據一步步瓦解。

史丹佛大學以人為本AI研究所（HAI）發布的2026年《AI Index》年度報告，是一份423頁的AI發展現況評估，涵蓋研究產出、模型表現、投資流向、公開輿論與負責任AI等多個維度。然而，在諸多備受關注的發現之外，有兩個結論尤其值得重視：美中AI實力鴻溝已實質关闭，而AI安全基準測試的落後程度，遠比業界願意承認的更為嚴重。

美中AI差距實質關閉

一直以來，美國在AI發展上領先中國是政策制定者的核心前提。然而根據報告數據，這個前提已不再牢固。

2025年，美國仍產出更多頂級AI模型（50個相較中國的30個），並擁有較高影響力的專利。但在論文數量、引用占比與專利核准數上中國已超越美國。中國在百大被引用AI論文的占比從2021年的33篇成長至2024年的41篇。值得注意的是，南韓在人均AI專利數上領先全球。

這意味著「美國在AI模型性能上擁有持久領先」這個假設，並沒有充分的數據支撐。兩年前存在的差距，如今已收窄至每次重大模型發布都會改變結果的程度。

報告還指出一個更深層的结构性脆弱：美國對中國的晶片出口管制，並未如政策制定者所願阻止中國AI能力的提升。

AI安全基準：大面積留白

幾乎每個前沿模型開發商都會在能力基準上報告成績。但在安全與負責任AI的評估上，情況却大不相同。

報告中安全與負責任AI的基準表格，大部分欄位是空的。只有Claude Opus 4.5在超過兩個負責任AI基準上有報告成績；只有GPT-5.2報告了StrongREJECT。在衡量公平性、安全性與人類代理權的基準上，大多數前沿模型什麼都沒有報告。

這並不意味 Frontier Labs 沒有進行內部安全測試。報告承認紅隊演練與對齊測試確實存在，但「這些努力很少使用共同、可外部比較的基準集來披露」。後果是：大多數模型在AI安全維度上的外部比較，實際上是不可能的。

AI事故持續飆升

根據AI事故資料庫，2025年記錄的AI事故從2024年的233起增至362起。OECD的AI事故與危害監控系統（使用更廣泛的自動化管道）在2026年1月創下每月435起的高峰，六個月移動平均值為326起。

川普官員促銀行測試 Anthropic Mythos 模型：爭議背後的 AI 安全漏洞掃描工具

Mon, 13 Apr 2026 00:00:00 +0000

美國財政部長史考特·貝森特（Scott Bessent）與聯準會主席傑羅姆·鮑爾（Jerome Powell）本週聯合召集銀行高層 exec一場會議，鼓勵他們使用 Anthropic 旗下新型 AI 模型 Mythos 來偵測系統漏洞。根據 Bloomberg 報導，這場會議的召開，讓華爾街各大銀行對這款尚未普遍釋出的模型產生了高度興趣。

Mythos 是什麼？

Mythos 是 Anthropic 於本週稍早發布的安全漏洞掃描模型。Anthropic 表示，雖然 Mythos 並非專門針對網路安全訓練，但在發現系統漏洞方面的能力「太過優秀」，因此決定暫時限制模型存取。部分人士則質疑，這究竟是出於真正的安全考量，還是只是一種精妙的企業銷售策略。