Anthropic 推出新旗艦 Fable 5:寫 Code 速度驚人但安全機制被指過度敏感

Anthropic 推出全新 Mythos 級別人工智能模型 Claude Fable 5 同 Mythos 5,運算能力喺程式開發、金融分析同生物醫療領域創下新高。不過,為咗防範網絡攻擊同生物武器風險,官方加入咗好嚴格嘅安全過濾機制,當偵測到可能同安全相關嘅字眼,就會自動降級至舊模型處理。呢個設定引起唔少網絡安全專家同研發人員抱怨限制過多,甚至連正常嘅代碼審查同安全代碼編寫都會被阻截,令實用性大打折扣。

Anthropic 推出新旗艦 Fable 5:寫 Code 速度驚人但安全機制被指過度敏感
Anthropic 推出新旗艦 Fable 5:寫 Code 速度驚人但安全機制被指過度敏感

Claude Fable 5 與 Mythos 5 正式登場:超強運算力背後嘅安全限制爭議

人工智能研發機構 Anthropic 日前正式推出咗最新一代嘅旗艦級模型,分別係面向公眾開放嘅 Claude Fable 5,以及針對特定安全機構與政府合作夥伴而設嘅 Claude Mythos 5。呢兩款屬於 Mythos 級別嘅全新模型,喺多項基準測試之中都展現出超越以往所有版本嘅效能,特別喺繁複嘅程式開發、科學研究同數據分析方面,進步幅度非常之大。然而,伴隨超強能力而嚟嘅,係官方採取咗極為嚴格且具爭議性嘅安全防護機制。唔少搶先體驗過嘅網絡安全專家同程式員指出,新模型嘅安全過濾過於敏感,甚至會誤攔日常正常嘅工作指令。

技術突破與性能評測

根據 Anthropic 官方公布嘅數據,Claude Fable 5 喺絕大部分測試之中都取得咗領先地位。當面對需要長時間運行、邏輯極為複雜嘅任務時,呢款模型同舊版本或者其他競爭對手嘅差距就會拉得更開。

程式工程效能提升

喺程式工程(Software Engineering)方面,大型企業 Stripe 喺早期測試入面反映,Fable 5 將原本需要幾個月嘅工程進度縮短到幾日之內完成。例如喺一個擁有五千萬行 Ruby 代碼嘅龐大系統入面,呢款模型只係用咗一日時間,就完成咗成個代碼庫嘅遷移工作。如果由一成個工程團隊用人手處理,通常要耗費兩個月以上。此外,Fable 5 喺代碼生成嘅效率上亦有所提升,喺 FrontierCode 嘅高難度編程測試入面,即使喺中等運算投入下,依然攞到業界最高嘅評分,反映出生成出嚟嘅代碼符合高質量生產環境嘅標準。

高階知識工作與金融分析

除咗寫 Code 之外,新模型喺高階知識工作(Knowledge Work)同金融分析領域亦有顯著進步。喺 Hebbia 針對高級決策推理嘅金融基準測試之中,Fable 5 喺文件推理、圖表與表格解讀,以及複雜難題解決等範疇都拿到最高分。量化交易公司 IMC 嘅評測亦顯示,新模型喺交易分析評估入面近乎全勝,包括客觀事實檢索、概念性推理、根本原因分析(Root-cause analysis)以及預期價值分析,表現都非常突出。

技術突破與性能評測
技術突破與性能評測

視覺能力與記憶力嘅全面進化

視覺(Vision)功能亦係呢次升級嘅一大亮點。Fable 5 能夠由極為精細嘅科學圖表入面提取精確嘅數據數字,甚至可以單憑網頁應用程式嘅螢幕截圖,就還原出背後嘅源代碼。官方更展示咗一個有趣嘅測試:以前嘅 Claude 模型如果要玩經典遊戲《寵物小精靈 火紅版》(Pokémon FireRed),必須要依賴複雜嘅輔助工具同導航提示;但係 Fable 5 喺完全無地圖、無額外遊戲狀態資訊嘅情況下,單憑純視覺畫面輸入,就成功通關,證明其視覺理解能力已經可以自主應對複雜嘅動態環境。

係 Fable 5 喺完全無地圖、無額外遊戲狀態資訊嘅情況下,單憑純視覺畫面輸入,就成功通關,證明其視覺理解能力已經可以自主應對複雜嘅動態環境。

喺長期任務嘅記憶力(Memory)方面,Fable 5 喺面對包含幾百萬個 Token 嘅長線任務時,依然可以維持高度專注,仲懂得利用自己記低嘅筆記去改良輸出結果。喺卡牌策略遊戲《殺戮尖塔》(Slay the Spire)嘅測試入面,當允許模型使用文件形式嘅持久記憶時,Fable 5 嘅表現提升幅度係 Claude Opus 4.8 嘅三倍,而且成功打到最後關卡嘅次數亦高出三倍。官方更指出,Fable 5 曾經由物理學基本原理出發,自主建立咗一個太陽系模擬系統,並用嚟準確預測日食,展示出深厚嘅科學邏輯推導能力。

Mythos 5 喺生物醫療與科學研發嘅應用

至於功能完全解鎖、但限制極嚴嘅 Claude Mythos 5,則喺前沿科學領域展現出驚人潛力。官方內部嘅蛋白質設計專家利用 Mythos 5,將藥物研發過程入面嘅特定環節加速咗大約十倍。喺無任何人類協助嘅情況下,Mythos 5 配合生物資訊學工具,表現已經等同甚至超越資深嘅科學家,能夠獨自完成揀選結合位點、執行蛋白質設計工具,甚至喺遇到出錯時自我修正。喺十四個測試嘅蛋白質目標入面,有九個成功設計出具潛力嘅藥物候選分子(研發夥伴包括 Dyno Therapeutics)。

另外,Mythos 5 仲可以喺分子生物學入面自主提出全新且具說服力嘅科學假說。喺雙盲對比測試之中,科學家對 Mythos 5 提出嘅假說滿意度高達八成,遠超 Opus 級別模型。其中一個關於大腸桿菌(E. coli)蛋白質機制嘅假說,更同另外一個獨立研究團隊嘅最新實驗結果不謀而合。喺基因組學研究入面,Mythos 5 喺大約一星期嘅自主工作入面,收集並處理咗跨越 138 個動物物種、涉及數百萬個細胞嘅單細胞數據,仲設計兼訓練出一個自定義嘅機器學習模型。雖然呢個模型嘅體積比頂尖科學期刊《Science》最近發表嘅模型細咗一百倍,但最終預測表現反而更加優秀。

Mythos 5 喺生物醫療與科學研發嘅應用
Mythos 5 喺生物醫療與科學研發嘅應用

爭議焦點:過度敏感嘅安全篩選器與降級機制

雖然技術實力極強,但係 Anthropic 為了防止模型被濫用,引入咗全新嘅安全分類器(Classifiers)。呢啲分類器係獨立運行嘅人工智能系統,專門監控用戶輸入嘅提示詞。一旦系統判定問題涉及網絡安全攻擊、生物化學武器研發,或者企圖竊取模型權重嘅「蒸餾」(Distillation)行為,系統就會即時介入,並將該次對話交由上一代嘅 Claude Opus 4.8 去回應。

官方解釋,由於 Mythos 級別模型具備極強嘅漏洞挖掘同自動化黑客攻擊能力,一旦落入惡意組織手中,可能會大幅降低網絡攻擊嘅成本。因此,官方將安全防護調校得非常保守。雖然官方強調平均只有少於 5% 嘅對話會觸發防護機制,但喺實際應用入面,呢個設定已經引起廣泛不滿。

網絡安全業界專家嘅集體抱怨

根據科技媒體 TechCrunch 嘅報導,新模型推出後,大量網絡安全從業員同研究人員喺社交平台上表達無奈與不滿。IBM X-Force 嘅知名安全研究員 Valentina Palmiotti 指出,Fable 5 幾乎會拒絕任何同網絡安全有間接關係嘅請求,甚至連要求模型閱讀一篇安全博客文章呢類完全無害嘅任務都會被阻截。當防護機制被觸發時,對話就會被中斷,並跳出警告提示。

網絡安全專家 Matt Suiche 亦表示,如果要求 Fable 5 撰寫一段符合安全規範嘅代碼(Secure Code),模型就會誤以為用戶正喺度進行網絡安全相關嘅工作,而唔係將其視為軟件工程嘅良好習慣,結果成個對話就會被直接降級去到舊版模型。佢認為目前嘅過濾機制非常依賴關鍵字匹配,只要字眼踏入網絡安全嘅詞彙範圍,就會觸發封鎖。另外亦有工程師抱怨,單純要求模型進行代碼審查(Code Review)都會引發誤判。

不過,業界亦有理性嘅聲音。Matt Suiche 補充,現時仍然處於新模型推出嘅初期,官方為咗安全起見,採取「寧縱勿枉」嘅策略係可以理解嘅,預計未來隨著 Anthropic 同新一代網絡安全公司增加合作,防護機制會逐漸變得合理同優化。

商業數據保留政策嘅變更

伴隨新模型上線,Anthropic 亦更改咗商業客戶嘅數據處理政策。所有使用 Mythos 級別模型(包括 Fable 5 同 Mythos 5)嘅商業客戶,其對話數據將會被強制保留 30 日,不論係透過官方平台定係第三方介面輸入。官方強調,呢啲數據絕對唔會用嚟訓練新模型,亦唔會用喺安全防護以外嘅用途,同時會嚴格記錄所有人手查閱數據嘅日誌,並喺 30 日後徹底刪除。官方解釋呢個政策係為咗抵禦複雜嘅連環黑客攻擊,同時協助工程團隊分析同減少誤判。

附加事實整理:收費與開放進度

目前 Claude Fable 5 同 Mythos 5 嘅定價相同,每百萬個輸入 Token 收費為 10 美元,每百萬個輸出 Token 收費為 50 美元。相較於之前嘅預覽版,價格便宜咗超過一半。

對於一般香港用家同企業開發者,現時可以透過官方 API 同企業版帳戶即時使用 Fable 5。至於日常嘅個人訂閱用戶,官方則採取咗分階段嘅過渡安排,需要特別留意時間節點:

  • 由即日起至 2026 年 6 月 22 日:Pro、Max、Team 以及按座位收費嘅企業版用戶,可以免費體驗 Fable 5。
  • 去到 2026 年 6 月 23 日:官方將會將 Fable 5 由上述訂閱計劃入面移除。之後若想繼續使用,用戶必須另外購買運算額度(Usage Credits)。
  • 官方承諾,當未來伺服器運算能力足夠支持龐大需求時,目標係將 Fable 5 重新納入為訂閱計劃嘅標準功能,但具體時間仍有待公布。

Fable 5 與 Mythos 5 核心數據與機制對比

項目Claude Fable 5Claude Mythos 5
開放對象全球開發者、企業及一般用戶受限於 Glasswing 夥伴、特定生物學研究員
輸入收費(每百萬 Token)10 美元10 美元
輸出收費(每百萬 Token)50 美元50 美元
網絡安全防護具備嚴格分類器,敏感請求降級至 Opus 4.8解除相關網絡安全限制,容許高階分析
生物化學防護具備嚴格分類器,多數請求降級至 Opus 4.8限制放寬(即將針對受信任研究員解鎖)
數據保留政策用戶數據強制保留 30 日以作安全審查用戶數據強制保留 30 日以作安全審查

總結

新一代人工智能模型嘅推出,確實展示出驚人嘅工程效率同跨學科科研能力,由 Stripe 嘅大規模代碼遷移到生物醫藥嘅自主研發,都睇到技術躍進。然而,如何喺「發揮最強效能」同「防止技術被濫用」之間取得平衡,依然係各大科技巨頭面對嘅難題。對香港嘅開發者或企業而言,引入新模型雖然可以大幅提升生產力,但同時亦需要適應現階段相對繁複嘅安全過濾機制,並喺工作流程上作相應配合。