教學|Mac機離線跑Gemini!Google AI Edge Gallery實測Gemma 4與Eloquent語音助理

近年AI發展迅速,但下下要連網兼擔心私隱外洩?Google最新為Mac機用家推出AI Edge Gallery及Eloquent應用程式,俾大家可以喺本地離線運行Gemma 4 12B等多個AI模型。呢篇文章會同大家詳細拆解本地AI嘅優勢、手把手安裝教學,以及同Ollama等平台嘅客觀比較,助你打造最安全嘅私人AI助理。

教學|Mac機離線跑Gemini!Google AI Edge Gallery實測Gemma 4與Eloquent語音助理
教學|Mac機離線跑Gemini!Google AI Edge Gallery實測Gemma 4與Eloquent語音助理

Mac機本地AI教學:Google AI Edge Gallery及Eloquent應用全指南

近年人工智能技術發展極快,唔少人都習慣依賴ChatGPT、Claude或者Gemini等大型語言模型嚟處理日常工作。不過,隨住技術成熟,AI應用已經開始由「雲端」走向「本地」。Google最近正式宣佈,將AI Edge Gallery同埋語音應用程式AI Edge Eloquent帶到macOS平台,同時釋出專為個人電腦設計嘅Gemma 4 12B模型。

到底本地運行AI有邊啲優勢?Mac機用家又應該點樣設定同應用?呢篇文章會為大家提供詳盡嘅背景資料、概念解析同埋手把手教學。

0:00
/0:40

Mac機本地AI教學:Google AI Edge Gallery及Eloquent應用全指南

甚麼係本地AI模型?雲端與本地嘅分別

喺進入教學之前,我哋首先要理解雲端模型同本地模型嘅核心差異。

目前市面上主流嘅AI工具,絕大部份都係建立喺科技巨頭嘅伺服器上面。呢類雲端模型擁有數以萬億計嘅參數,能力非常強大,但同時伴隨住三個主要限制:第一,必須保持互聯網連線;第二,每次對話都需要將數據傳送去伺服器,對於需要處理機密文件嘅商業用家嚟講,存在私隱風險;第三,生成速度往往受制於網絡穩定性同埋伺服器負載。

相比之下,本地模型(Local Models)顧名思義就係將整個AI模型下載到用家自己部電腦入面,運用電腦本身嘅處理器(CPU、GPU或NPU)去進行運算。雖然本地模型受制於個人電腦硬件,參數量通常只有幾十億到幾百億,能力未能完全媲美頂級雲端模型,但佢具備以下無可取代嘅優勢:

  • 絕對私隱保護: 所有數據運算都喺自己部電腦入面進行,對話內容同埋輸入嘅文件資料絕對唔會離開裝置,完全符合嚴格嘅商業保密要求。
  • 離線運作能力: 就算喺飛機上或者網絡訊號差嘅地方,依然可以隨時隨地召喚AI協助工作。
  • 零訂閱費用: 只要硬件規格達標,大部份開源本地模型都可以免費無限次運用,唔需要每個月繳交訂閱費。
  • 反應速度穩定: 生成速度完全取決於你部Mac機嘅晶片效能,唔需要同全球數以百萬計嘅用家爭奪雲端算力。

Google AI Edge Gallery基本資料整理

Google AI Edge Gallery原本只提供Android同iOS版本,而家終於正式推出macOS版本。同其他開放式平台唔同,Google AI Edge Gallery目前專注於提供自家研發嘅模型。

以下係現時macOS版本支援嘅5款重點模型資料:

模型名稱 核心定位與特色 適合對象與硬件建議
Gemma-4-12B-it 最新發佈嘅旗艦級本地模型,具備多模態處理能力。 需要處理複雜邏輯、編程及多媒體分析;建議配備16GB RAM或以上。
Gemma-4-E4B-it 40億參數版本,平衡效能與硬件要求。 日常文書處理、文章總結;適合8GB至16GB RAM機種。
Gemma-4-E2B-it 20億參數版本,極致輕量化。 簡單問答、低耗電運作;適合入門級硬件。
Gemma-3n-E4B-it 上一代架構嘅40億參數優化版。 需要特定舊版本兼容性嘅開發者。
Gemma-3n-E2B-it 上一代架構嘅20億參數輕量版。 測試用途或入門級硬件用家。

(註:名單中嘅「it」代表Instruct Tuning,即係模型已經經過指令微調,能夠理解並服從用家嘅對話指令,而唔係單純進行文字接龍。)

重點功能解析:Gemma 4 12B有幾強大?

喺今次發佈入面,最受注目嘅肯定係Gemma 4 12B模型。對於一般消費級本地模型嚟講,參數量通常維持喺20億到90億之間。Gemma 4採用咗120億參數設計,Google官方指出,佢嘅實際效能足以媲美260億參數嘅混合專家(Mixture-of-Experts)模型。

Gemma 4 12B具備幾個值得留意嘅實用特點:

  1. 多模態處理(Multimodal): 佢唔單止識得處理純文字,仲具備視覺同音訊處理能力。用家可以直接交畀佢分析圖像或者圖表,從中提取有意義嘅數據見解。
  2. 進階編程能力: 對於需要撰寫程式碼或者進行數據分析嘅用家,12B模型喺邏輯推演上比細參數模型準確得多。
  3. 硬件門檻合理: 儘管能力大幅提升,Google依然將佢壓縮到可以喺具備16GB RAM嘅消費級手提電腦上流暢運作,對於近年升級咗Apple Silicon晶片嘅Mac用家嚟講,門檻相當合理。

語音轉文字利器:Google AI Edge Eloquent

除咗大型語言模型,Google今次亦將早前喺iOS推出嘅Google AI Edge Eloquent帶到Mac平台。呢款係一個完全免費、並且喺裝置本地端運作嘅語音聽寫應用程式。

一般市面上嘅語音轉文字工具往往只係死板地記錄聲音,遇到用家口吃、重複字眼或者思考停頓時,就會得出一段冗長又語意不通嘅文字。Eloquent嘅最大賣點在於「AI潤飾」。當佢捕捉你嘅語音時,會同步過濾走無意義嘅停頓音,並且進行輕度編輯,令最終輸出嘅文字更加流暢清晰,直接達到可以直接寫入電郵或者文章嘅水平。

此外,Eloquent容許用家加入自訂詞庫(Custom Words)。對於香港人嚟講呢個功能非常實用,因為我哋日常工作經常會用到特定嘅品牌名稱、專有名詞甚至中英夾雜嘅術語。預先將呢啲詞彙加入去,就可以大幅減低語音辨識錯誤嘅機會,慳返事後校對嘅時間。

語音轉文字利器:Google AI Edge Eloquent
語音轉文字利器:Google AI Edge Eloquent

手把手應用教學:點樣喺Mac機設定AI Edge Gallery?

如果大家想即刻體驗本地AI嘅威力,可以跟住以下步驟進行設定。整個過程完全唔需要具備編程背景,普通用家都可以輕鬆掌握。

第一步:檢查Mac機硬件規格

本地運行AI極度依賴統一記憶體(Unified Memory)。點擊畫面左上角嘅蘋果圖案,選擇「關於這部Mac」。如果你部電腦配備Apple Silicon(M1/M2/M3/M4晶片),而且記憶體有16GB或以上,你就可以流暢運行最高級別嘅Gemma 4 12B模型。如果只有8GB RAM,建議選擇2B或4B版本以免拖慢系統。

第二步:下載及安裝應用程式

由於目前AI Edge Gallery及Eloquent針對macOS推出,大家可以前往Google官方提供嘅專屬下載頁面,或者透過Mac App Store搜尋下載(具體上架情況視乎地區而定)。下載完成後,將應用程式圖案拖入「應用程式」資料夾即完成安裝。

Google AI Edge Gallery | Google for Developers

Google官方提供嘅專屬下載頁面

第三步:挑選及下載合適模型

打開AI Edge Gallery後,主介面會列出可供下載嘅模型清單。由於模型檔案體積龐大(12B模型可能需要超過10GB儲存空間),請確保Mac機內置硬碟有足夠容量。揀選你想用嘅模型(例如Gemma-4-12B-it),點擊下載,並等待進度條完成。

第三步:挑選及下載合適模型
第三步:挑選及下載合適模型

第四步:輸入提示詞與測試

下載完成後,你可以直接喺軟件介面內開啟對話視窗。試下輸入一啲日常工作指令,例如:「幫我總結以下呢篇關於市場推廣嘅文章重點,並用點列方式列出」,然後觀察電腦嘅生成速度同埋風扇聲。呢個時候,所有運算都係喺你部Mac機內部進行,完全離線。

對本地AI有研究嘅朋友可能會問,市面上已經有Ollama同LM Studio,點解仲要用Google AI Edge Gallery?以下為大家進行客觀比較:

比較項目 Google AI Edge Gallery Ollama / LM Studio
模型選擇 暫時只限Google自家Gemma系列(共5款)。 極度豐富,可連接Hugging Face下載成千上萬款開源模型(包括Llama, Qwen等)。
系統整合度 由Google官方開發,對自家模型優化極佳,介面簡單直接。 需要用家自行調整參數,LM Studio介面較專業複雜,Ollama則偏向命令行操作。
多模態支援 原生支援Gemma 4 12B嘅多模態功能(視、聽、文字)。 視乎下載嘅第三方模型是否支援,設定上相對繁複。
適合對象 追求「一按即用」、想體驗最純粹Google AI技術嘅普通用家。 鍾意測試唔同廠商模型、具備一定技術背景嘅進階玩家。

總括而言,如果你只係想搵一個穩定、安全、容易上手嘅本地AI工具處理日常文書,Google AI Edge Gallery絕對係一個極佳嘅入門起點。如果你想試玩世界各地唔同團隊研發嘅最新模型,Ollama或者LM Studio就會提供更大嘅自由度。

應用本地AI嘅注意事項

雖然本地AI好處多多,但喺實際應用時都有幾點需要特別留意:

  • 電池消耗速度: 運行大型AI模型會動用大量晶片算力,如果MacBook冇插住電源,電池消耗速度會比平時睇網頁或打字快好幾倍,亦有可能導致機身發熱。
  • 儲存空間管理: AI模型檔案體積閒閒地幾GB至十幾GB起跳,如果你部Mac機只有256GB硬碟空間,下載多幾個模型就好容易爆滿。建議定期清理冇用嘅模型。
  • 常識與幻覺問題: 雖然Gemma 4 12B效能強勁,但本地模型嘅知識庫依然有局限,對於最新資訊(因為無法連網搜尋)或者太冷門嘅知識,依然有機會產生「幻覺」(即一本正經地提供錯誤資訊),用家必須自行核實重要數據。

常見問題 (Q&A)

整理上文各項重點,以下係10個關於Mac機使用Google AI Edge及本地模型嘅常見疑問:

1. 甚麼係Google AI Edge Gallery?

呢個係由Google推出嘅應用程式,俾用家可以將AI模型下載到個人裝置(如Mac機)入面,進行完全離線嘅本地運算。

2. 點解要放棄雲端AI改用本地模型?

最大原因係私隱保護同離線運作。本地模型處理機密商業文件時,數據唔會上傳到任何外部伺服器,安全性極高。

3. Gemma 4 12B對Mac機有咩硬件要求?

Google官方建議配備至少16GB RAM嘅消費級手提電腦,先可以發揮120億參數模型嘅順暢效能。

4. 如果我部Mac機只有8GB RAM,用唔用到呢個軟件?

可以用到,但建議下載參數量較細嘅版本,例如Gemma-4-E2B-it或E4B-it,以避免系統出現嚴重卡頓。

5. Edge Eloquent同Mac機內置嘅語音輸入有咩分別?

一般語音輸入只負責逐字聽寫,而Eloquent具備AI潤飾功能,可以自動刪除口吃、停頓位,並輕微修改文法,令句子更加通順。

6. 本地模型會唔會好食電同令部機發熱?

會。生成內容期間,晶片需要全速運作,會加速消耗電量。建議進行大量生成任務時,將MacBook接上電源。

7. 安裝及使用Google AI Edge Gallery使唔使收費?

目前下載應用程式以及運行Gemma模型都係完全免費嘅。

8. 可唔可以喺AI Edge Gallery安裝ChatGPT或者Claude?

唔可以。ChatGPT同Claude屬於封閉源碼嘅雲端模型。AI Edge Gallery目前只提供Google自家研發嘅Gemma系列開源模型。

9. 本地模型嘅回答質素同雲端旗艦級模型比較係點?

雲端模型(如GPT-4o或Gemini 1.5 Pro)參數極龐大,處理複雜邏輯依然佔優;但對於一般文書總結、電郵撰寫或基本編程,Gemma 4 12B嘅表現已經非常接近日常工作所需標準。

10. Eloquent支唔支援中英夾雜嘅香港常用語境?

Eloquent內置「自訂詞庫」功能,用家可以預先輸入特定嘅專有名詞或中英文術語,大幅提升系統對混合語言或專業字眼嘅辨識準確度。

總結

Google將AI Edge Gallery同埋Eloquent帶入macOS生態圈,並且推出效能強大嘅Gemma 4 12B模型,標誌住AI技術進一步由雲端普及至個人裝置。對於重視資料保密、需要離線工作,又或者想充分利用部Mac機硬件效能嘅用家嚟講,呢套完全免費嘅本地AI方案確實提供咗一個極具價值嘅選擇。大家可以因應自己部電腦嘅規格同埋實際工作需要,去發掘本地AI助理帶來嘅工作效率提升。