Cloudflare新政策:迫使 AI 公司為出版商內容付費及聯手大廠推出 PACT 私隱認證
Cloudflare 針對 AI 世代推出兩項重大政策。首先,由 2026 年 9 月起將預設攔截「混合用途」AI 爬蟲,並推動「按使用付費」模式,確保網站擁有者獲得合理報酬。其次,Cloudflare 聯同多個主流瀏覽器開發 PACT 通訊協議,以匿名權杖取代傳統驗證碼,喺保障私隱嘅同時精準區分真人與機械人流量。
Cloudflare 宣佈兩大網絡政策:全面規管 AI 混合爬蟲與聯手大廠推出 PACT 私隱認證
2026年7月2日,全球連通雲端服務供應商 Cloudflare 宣佈咗兩項對全球互聯網生態有深遠影響嘅新措施。第一項針對人工智能(AI)業界,規定從 2026 年 9 月 15 日開始,將會預設攔截所有「混合用途」網絡爬蟲(Mixed-use crawlers),確保網站內容創作者能夠從 AI 訓練中獲得應有嘅報酬。第二項措施則係聯同 Google Chrome、Mozilla Firefox 以及 Microsoft Edge 等主流瀏覽器,共同開發名為「私有存取控制權杖」(PACT)嘅全新通訊協議標準。呢項標準旨在喺唔侵犯用戶私隱嘅情況下,有效分辨真人與惡意機械人流量,從而大幅減少煩人嘅驗證碼,提升整體網絡體驗。
打擊「白食」內容,規管 AI 混合爬蟲
互聯網流量格局大逆轉
近年生成式 AI 技術發展迅速,各大 AI 模型開發商需要依賴海量互聯網數據進行訓練及提供智能服務。Cloudflare 行政總裁 Matthew Prince 喺公佈消息時指出,現時網上大部分流量已經由非人類(即自動化機械人及爬蟲)佔據。呢個「機械人流量超越真人流量」嘅里程碑,比業界原先預期提早咗足足一年發生。面對龐大嘅 AI 爬蟲流量,網站擁有者面臨一個兩難局面:一方面佢哋希望內容能夠透過搜尋引擎或者 AI 助理被廣大讀者發掘;但另一方面,佢哋絕對唔想自己辛苦創作嘅知識產權俾 AI 公司免費提取,直接變成大型語言模型嘅訓練數據。
攔截「混合用途」爬蟲嘅具體措施
為咗解決呢個不平衡嘅生態,Cloudflare 宣佈由 2026 年 9 月 15 日起,將會針對所有含有廣告嘅網頁實施新嘅預設防禦設定。新設定將會自動封鎖所謂嘅「混合用途」爬蟲。呢類爬蟲將傳統搜尋引擎索引、AI 代理(AI Agents)操作以及 AI 模型訓練功能綑綁埋一齊。如果網站擁有者冇主動更改設定,系統就會將呢啲爬蟲拒之門外。呢項新政策適用於所有 Cloudflare 嘅新客戶、現有客戶建立嘅新網站,以及所有現有嘅免費版客戶。
Cloudflare 喺聲明中特別點名提到「全球最大搜尋引擎」(外界普遍認為係暗指 Google),批評其做法令到網站營運者陷入困境。因為呢間搜尋巨頭將各種爬蟲功能混合,令客戶好難喺保留搜尋曝光率嘅同時,又可以有效阻止內容被用作 AI 訓練。雖然 Google 過往曾反駁指旗下有「Google Extended」機械人讓網站選擇退出 AI 訓練(包括 Gemini Apps 及 Vertex API),而唔會影響 Google Search 嘅收錄;但現實係,其旗艦級 Googlebot 依然會為咗 AI 搜尋功能(例如 AI Overviews)而進行網頁抓取。Cloudflare 希望透過預設攔截,迫使 AI 公司將「純搜尋用途」同「AI 訓練及代理用途」嘅爬蟲徹底分開。
推動「按使用付費」模式,創造共贏
為咗建立更公平可持續嘅生態系統,Cloudflare 亦推出咗「按使用付費」(Pay Per Use)機制。呢個機制由早前推出嘅「按抓取付費」(Pay Per Crawl)演變而成。喺新模式下,出版商唔單止可以喺 AI 爬蟲讀取內容時收費;當佢哋嘅內容為 AI 公司創造實際價值時(例如喺 AI 搜尋結果中被引用,或者優質內容被用戶點擊),網站營運者同樣可以獲得分成。
Cloudflare 目前已經聯同 Ceramic.ai 及 You.com 兩間公司展開初步合作。當網站擁有者加入計劃後,只要佢哋嘅內容出現喺 Ceramic 嘅 AI 搜尋結果,或者 You.com 存取咗佢哋嘅付費內容,網站就可以獲得相應報酬。Cloudflare 數據顯示,現時超過 50% 嘅 AI 爬蟲流量其實只係喺度重複讀取完全冇更新過嘅網頁,浪費大量資源。新措施唔單止保障創作者收入,亦將有效為 AI 公司及網站營運者節省伺服器頻寬同運算資源。
PACT 私隱通訊協議,告別煩人驗證碼
自動化濫用行為嘅新挑戰
除咗規管 AI 爬蟲,Cloudflare 亦針對網絡安全驗證帶嚟嘅用戶體驗問題提出革命性解決方案。過去幾十年,為咗防止自動化程式惡意攻擊、濫發垃圾訊息或者大量消耗伺服器資源,網站營運者被迫依賴各種防禦機制,最常見嘅就係強制用戶登入或者彈出繁複嘅驗證碼(CAPTCHA)。隨著生成式 AI 崛起,惡意自動化程式變得愈嚟愈複雜,甚至能夠輕易破解舊有嘅防禦系統。人類同機器人之間嘅界線日漸模糊,令到數碼世界面臨前所未有嘅挑戰。傳統解決方案往往涉及侵入式追蹤,極大程度上損害咗用戶對網站嘅信任。
多方聯手推動 PACT 標準化
有見及此,Cloudflare 全球技術總監 Dane Knecht 宣佈與 Mozilla Firefox、Google Chrome 及 Microsoft Edge 等主流瀏覽器開發商達成合作協議,共同推動「私有存取控制權杖」(Private Access Control Tokens, 簡稱 PACT)嘅標準化。
PACT 嘅核心理念係一套以保障私隱為前提嘅認證系統。運作原理係讓能夠可靠驗證「真人身份」嘅網站發出匿名權杖。當用戶前往其他採用 PACT 標準嘅網站時,瀏覽器就可以自動喺背景提交呢啲權杖,證明當前嘅網絡請求係由真實人類發出,而唔係惡意機械人。最重要嘅係,PACT 嘅底層設計確保咗網站絕對無法利用呢項技術去追蹤用戶嘅真實身份,亦無法得知用戶嘅跨網站瀏覽紀錄。
業界強烈支持,提升整體體驗
多間科技企業及業界領袖對 PACT 計劃表示強烈支持。電子商務巨頭 Shopify 嘅傑出工程師 Ilya Grigorik 強調,喺網購業務入面,每一次額外嘅驗證延遲或者誤判,都好容易導致顧客失去耐性而放棄購物車。商戶固然需要保護機制嚟應對惡意流量,但消費者絕對唔應該因此而承受不必要嘅阻礙或者被侵犯私隱。
Mozilla Firefox 全球技術總監 Bobby Holley 亦指出,互聯網被大量自動化流量湧入,逼使網站採用付費牆、繁瑣身份驗證及侵入式追蹤等粗疏手段。PACT 嘅出現,正正係要打破呢個惡性循環,喺維持最高私隱標準嘅同時,為真實用戶帶嚟無縫順暢嘅上網體驗。Microsoft Edge 網絡平台工程總監 Erik Anderson 同樣表示,健康嘅網絡環境有賴呢類具備互通性且保護私隱嘅工具,各大廠商將會確保 PACT 能夠喺公開網絡上順利部署。
附加基本資料與實用資訊分析
為幫助各華人地區(包括香港、台灣、新加坡等地)嘅讀者及網站營運者更深入理解呢兩項新政策,以下整合咗幾個關鍵影響層面:
1. 對中小型網站及內容創作者嘅影響
對於香港及台灣等地嘅中小型媒體、網誌作者或者獨立內容創作者而言,伺服器頻寬及維護成本一直係一筆沉重嘅開支。AI 爬蟲無間斷嘅重複抓取,往往令網站承擔高昂嘅隱形成本。Cloudflare 嘅預設攔截政策,有助呢啲企業喺唔流失真正讀者嘅情況下,有效阻擋浪費資源嘅無效流量。更重要嘅係,「按使用付費」機制為華文優質原創內容提供咗全新嘅變現途徑,等創作者可以喺 AI 時代中分一杯羹。
2. 對電子商務及零售平台嘅好處
對於依賴 Shopify 或者自家搭建網店嘅亞洲區零售商,棄單率一直係一大痛點。好多時顧客喺結帳或者搶購限量商品時,突然彈出要求分辨「交通燈」或者「斑馬線」嘅驗證碼,極大程度上破壞購物體驗。引入 PACT 標準之後,系統能夠喺背景靜默辨識真人身份,消費者購物時將會暢通無阻,結帳流程更加直接,預期將有助提升整體電商平台嘅生意轉化率。
3. 個人私隱保障邁向新台階
對於一般網民,PACT 嘅普及意味住互聯網朝住「去追蹤化」邁出重要一步。過去部分網站會利用 Cookie 或者指紋追蹤技術(Browser Fingerprinting)嚟判斷訪客係咪真人,變相收集大量用戶私隱。PACT 透過加密匿名權杖機制,徹底斬斷咗身份驗證同個人資料收集之間嘅掛鉤,保障咗網民喺穿梭唔同網站時嘅行蹤保密性。
總結
總括而言,Cloudflare 今次聯同一眾科技巨頭推出嘅兩大政策,反映咗網絡基礎設施供應商正喺 AI 狂潮下重新定義互聯網嘅遊戲規則。由保障內容創作者知識產權、規管「混合用途」AI 爬蟲,到提升用戶體驗及私隱保障嘅 PACT 協議,呢啲措施皆旨在平衡科技發展同業界各方利益。對於一般香港或者其他華人地區嘅用戶而言,未來上網嘅體驗將會變得更加順暢,免受驗證碼干擾,私隱亦得到更好嘅保障;而對於網站營運者嚟講,呢啲新工具將賦予佢哋更高嘅流量掌控權,確保網絡資源用得其所,並為高質素內容爭取合理回報。全球網絡生態正穩步邁向一個更具透明度、公平性及可持續發展嘅新時代。