AI 鑑別技術大拆解:Gemini 與 ChatGPT 如何利用 SynthID 及 C2PA 標示生成內容
而家 AI 生成嘅相片同文字幾乎可以以假亂真,到底我哋可以點樣分辨?其實科技巨頭好似 OpenAI 同 Google 已經著手解決呢個問題,並引入咗 C2PA 元數據標準同 SynthID 隱形水印技術。呢篇文章會深入淺出咁講解呢兩項技術嘅運作原理、實際應用心得,同埋比較兩者點樣互補不足,幫你喺資訊爆炸嘅年代保持清醒,唔再輕易被 AI 內容誤導。
AI 內容氾濫,我哋需要更可靠嘅鑑別機制
喺過去兩三年,生成式 AI(Generative AI)嘅發展速度快到令人難以置信。無論係用 ChatGPT 寫文章、用 Midjourney 畫圖,定係用 Google Gemini 製作影片同音效,AI 生成內容已經滲透入我哋生活嘅每一個角落。對香港、台灣以至新加坡等華人地區嘅網民嚟講,每日喺社交平台接收嘅資訊入面,分分鐘有幾成係由 AI 製作。
雖然 AI 帶嚟極大嘅便利,但同時亦引發咗資訊真偽嘅隱憂。例如一啲幾可亂真嘅假新聞圖片,或者用 AI 仿造名人聲音嘅詐騙錄音,都令一般讀者好難分辨真假。為咗解決呢個問題,各大科技公司開始肩負起責任,開發各種「AI 水印」同內容來源追蹤技術。當中最受注目嘅,就係由 Google 開發嘅 SynthID,以及由多間科技巨頭共同推動嘅 C2PA 標準。最近,OpenAI 更加宣佈會喺佢哋嘅產品入面同時採用呢兩項技術,到底呢兩套系統有咩特別?我哋一齊嚟了解下。
C2PA 與 SynthID 係咩?
要明白 AI 鑑別技術點樣運作,首先要認識目前最主流嘅兩大機制:
1. C2PA(內容來源和真實性聯盟標準)
C2PA 全名係 Coalition for Content Provenance and Authenticity,喺 2021 年由 Adobe、微軟、Intel 同 BBC 等機構共同創立,而家已經成為咗國際 ISO 標準。簡單嚟講,C2PA 就好似一張貼喺數碼檔案上面嘅「出世紙」同「履歷表」。
當一張圖片被創建或者修改嗰陣,C2PA 會將相關嘅來源資訊(例如用咗咩相機影、用咗邊款 AI 工具生成、中途有冇經過 Photoshop 修改)加密並寫入檔案嘅元數據(Metadata)入面。因為呢啲資料係公開透明嘅,用家只要透過支援 C2PA 嘅工具,就可以輕易讀取到檔案嘅前世今生。
2. SynthID(Google DeepMind 開發嘅隱形水印)
如果 C2PA 係貼喺檔案出面嘅標籤,咁 SynthID 就可以理解為融入咗檔案入面嘅「數碼 DNA」。SynthID 由 Google DeepMind 研發,佢唔係將資料寫入元數據,而係直接將隱形嘅水印嵌入去圖片嘅像素、音頻嘅聲波、影片嘅影格,甚至係文字嘅機率分佈入面。
呢種水印對人類嘅肉眼同耳朵嚟講係完全察覺唔到嘅,唔會影響內容嘅質素。更重要嘅係,就算不法之徒嘗試將圖片截圖、壓縮、裁剪,或者將音頻加雜音,SynthID 嘅水印依然可以保存落嚟,俾專用嘅 AI 偵測工具識別得到。
普通用家點樣受惠?
睇完上面嘅技術概念,大家可能會問:呢啲技術聽落好高深,一般市民平時點樣用得著?
其實,科技巨頭已經將呢啲驗證工具慢慢融入我哋日常使用嘅平台。以我近期測試 Google Gemini 同 OpenAI 預覽版驗證工具嘅經驗嚟講,成個過程比想像中簡單直接。
Google Gemini 嘅驗證體驗:
而家如果你登入咗 Gemini,可以直接上傳一張圖片、一段錄音或者短片,然後問 Gemini:「呢個檔案係咪由 Google AI 生成或者修改過?」Gemini 就會自動掃描檔案入面有冇 SynthID 水印。如果搵到,佢會好清晰咁話你知呢個係 AI 作品。不過目前嘅限制係,佢主要只能夠認得由 Google 系統(例如 Imagen、Lyria 或 Veo)生成嘅內容。

OpenAI 嘅雙重驗證工具:
另一邊廂,OpenAI 亦推出咗 openai.com/verify 嘅驗證工具(目前仲係測試階段)。當你上傳一張相上去,系統會同時檢查 C2PA 元數據同埋 SynthID 水印。呢點我覺得非常實用,因為正如之前所講,C2PA 雖然資料詳盡,但好容易因為上傳去社交平台(例如 WhatsApp 或 Facebook 自動壓縮圖片)而流失。呢個時候,SynthID 作為「底牌」就可以發揮作用,話俾你知張相的確係出自 DALL-E 或 ChatGPT。
從實用角度睇,呢啲工具目前對於新聞工作者、企業公關,甚至係想避免網上騙案嘅普通市民嚟講,都係一個好好嘅初步防線。

深入分析:技術設計與深遠影響
技術原理嘅巧妙之處
SynthID 喺唔同媒介嘅應用方式,充分展示咗目前 AI 工程嘅極致。
- 圖片與影片:系統會喺生成像素嘅時候,加入極微細嘅統計學規律變動,呢種變動睇落似普通嘅雜訊,但偵測模型一掃就會認得出。
- 音效:會喺聲波頻率入面隱藏訊號,就算轉成 MP3 或者加快播放速度都洗唔走。
- 文字:呢個係最新亦係最難嘅突破。AI 語言模型(LLM)每次生成一個字(Token)嗰陣,都會根據機率去揀字。SynthID 會喺揀字嘅過程中加入特定嘅演算法微調,令到最終生成嘅文章字眼組合帶有一種隱秘嘅數學規律。
對行業生態嘅影響
OpenAI 選擇同 Google 合作引入 SynthID,呢個舉動喺科技界非常有指標性。過往各大廠商各自為政,但今次反映出業界開始明白,要對抗 AI 濫用,必須要跨企業合作。當越來越多平台(例如 YouTube Shorts 自動標籤 AI 影片、Meta 準備喺 Instagram 引入 C2PA 標籤)加入呢個生態圈,未來「冇來源證明」嘅內容可能會被演算法降低曝光率,變相鼓勵創作者負責任咁標明 AI 使用情況。
C2PA 與 SynthID 比較:點解要雙管齊下?
為咗令大家更清楚兩者嘅分別,我整理咗以下嘅比較表。你可以見到,佢哋兩者係完美嘅互補關係:
| 特性比較 | C2PA (元數據標準) | SynthID (隱形水印) |
|---|---|---|
| 運作原理 | 喺檔案附加加密嘅履歷資料 | 將隱形訊號直接嵌入像素/音波/文字中 |
| 資訊豐富度 | 非常高(顯示時間、工具等) | 較低(主要只用作確認係咪 AI 生成) |
| 耐用度 | 較低(截圖或壓縮容易令數據流失) | 極高(能夠抵禦裁剪、濾鏡、壓縮等修改) |
| 透明度 | 高(任何支援軟件都可以讀取) | 較隱密(需要專用模型去偵測) |
| 互補優勢 | 提供詳盡嘅「身世證明」 | 作為元數據被破壞後嘅「最後防線」 |
簡單總結,C2PA 話俾你知檔案經歷過咩事,而 SynthID 就確保就算張出世紙唔見咗,驗血(掃描水印)都仲可以驗得出佢嘅真身。OpenAI 同時採用兩者,正正係為咗填補互相嘅漏洞。
讀者常見問題 Q&A
根據上文嘅分析,我整理咗 10 個大家最關心嘅問題,幫你快速解開對 AI 水印嘅疑問:
1. 咩係 C2PA?
答:C2PA 係一個國際標準,簡單講就係一份數碼檔案嘅「履歷表」,記錄咗張相或者條片嘅來源,同埋有冇俾 AI 修改過。
2. 咩係 SynthID?
答:SynthID 係由 Google DeepMind 開發嘅隱形水印技術。佢將肉眼睇唔到嘅記號直接打入檔案入面,用嚟標示呢個係 AI 生成嘅作品。
3. 點解 OpenAI 要同時用 C2PA 同 SynthID?
答:因為兩者可以互補。C2PA 提供詳細資料但容易流失,SynthID 難以被抹走但提供嘅細節較少。雙管齊下可以大大提高識別嘅準確度。
4. 如果我將一張 AI 圖截圖(Screenshot),AI 水印會唔會消失?
答:截圖會令 C2PA 嘅元數據消失,但 SynthID 嘅隱形水印被設計成可以抵抗截圖同基本裁剪,所以依然有機會被偵測得到。
5. 我點樣可以自行檢查一張相係咪 AI 整嘅?
答:你可以使用 Google Gemini 上傳圖片進行驗證,或者去 OpenAI 嘅 verify 網站(測試中)檢查圖片有冇包含佢哋嘅專屬訊號。
6. SynthID 可以應用喺咩類型嘅檔案?
答:目前 SynthID 已經全面覆蓋文字、圖片、錄音以及影片四種主要媒介。
7. 亞洲地區嘅用家,例如中港台星,可以點樣應用呢個技術?
答:用家喺網上見到可疑嘅新聞圖片或錄音時,可以利用上述提到嘅驗證工具做交叉比對,特別係處理涉及金錢投資或者未經證實嘅重大消息時,多一重把關。
8. 中文或廣東話生成嘅文字都可以俾 SynthID 偵測到嗎?
答:SynthID 嘅文字水印技術係基於語言模型生成字詞嘅機率分佈,只要該模型喺生成時有啟動功能,理論上唔同語言都可以支援。但如果將文章進行大幅度嘅翻譯或重寫,偵測準確度就會下降。
9. 呢啲技術會唔會降低 AI 生成圖或者影片嘅畫質?
答:唔會。SynthID 嘅設計原則就係「人類無法察覺」,佢只會改變極微細嘅像素或數據,完全唔會影響最終成品嘅視覺或聽覺質素。
10. 如果一張相查唔到有 C2PA 或者 SynthID,係咪代表一定係真人影?
答:唔係。查唔到訊號可能因為張相係由未加入標準嘅其他 AI 工具生成,又或者檔案經過嚴重破壞令水印失效。所以就算冇 AI 水印,都唔代表張相一定百分百真實。
總結
AI 技術發展得越快,我哋鑑別資訊真假嘅難度就越高。OpenAI 同 Google 牽頭採用 C2PA 及 SynthID 技術,絕對係向正確方向邁出咗重要嘅一步。呢套「元數據加隱形水印」嘅雙重保險機制,為防止 AI 內容被惡意濫用提供咗強而有力嘅基礎。
不過,目前呢啲技術仍然有局限,特別係網上仲有大量冇採用呢啲標準嘅開源 AI 模型。技術只係一種輔助工具,最核心嘅防線,始終係我哋自己嘅批判性思考。喺轉發任何驚人嘅消息或者圖片之前,停一停,諗一諗,善用手頭上嘅驗證工具查證一下,先至係喺 AI 時代保護自己嘅最佳方法。希望今次嘅分享幫到大家更清楚了解呢啲新技術,日後上網吸收資訊時可以更加得心應手。