By 5News編輯部 — 31 5月 2026

Gemini 運算量計法大改引發爭議　Google 急推優化方案：Flash-Lite 全免、單次指令設封頂上限

Google 喺 I/O 2026 大會後將 Gemini 改用「運算量」計費，引發用家因配額極速耗盡而強烈不滿。Google 副總裁 Josh Woodward 隨即預告多項改善措施，包括設立單一指令用量上限、系統出錯唔扣額度，並將 Gemini 3.1 Flash-Lite 改為完全免費，以重拾用家信心。

回應全球用家不滿　Google 調整 Gemini 運算量限額機制　推出多項優化措施改善體驗

喺剛過去嘅 I/O 2026 大會裏面，Google 為旗下嘅生成式人工智能（AI）模型 Gemini 注入咗唔少新功能。不過，隨之而來嘅用量計算機制大改動，就意外引發咗全球用家嘅廣泛批評。Google 將以往按照不同層級功能設定次數限制嘅做法，改為好似競爭對手 Anthropic 旗下 Claude 咁樣，以「運算量」（Compute-used）嚟進行計費同埋限制配額。

呢個新機制推出咗無耐，好多日常依賴 Gemini 處理工作、編寫程式或者進行學術研究嘅用家就發現，一啲平時好習慣嘅操作，竟然會導致可用額度喺極短時間之內完全耗盡，令到整體嘅使用體驗大不如前。面對排山倒海嘅負面反饋，Google 管理層迅速作出回應，由副總裁率先透露將會推出多項具體嘅改善措施，試圖修補用家對平台嘅信心。

We’ve heard your feedback about hitting limits too quickly on @GeminiApp. We're rolling out several fixes to make your quota stretch further and feel more predictable… 🧵
— Josh Woodward (@joshwoodward) May 29, 2026

副總裁率先透露將會推出多項具體嘅改善措施，試圖修補用家對平台嘅信心。

新制改用運算量計費　用家頻頻「踩雷」迅速用盡限額

喺現行嘅全新機制之下，Gemini App 嘅配額係以用家所消耗嘅實際運算資源嚟計算。呢個系統每 5 個鐘頭就會更新一次，直至達到每週嘅總上限為止。根據 Google 官方先前嘅改動解釋，運算量嘅計算基準非常之廣泛，當中涵蓋咗用家輸入提示詞（Prompt）嘅複雜程度、背後所調動嘅工具類別（例如進行 Deep Research 網絡搜索、分析大數據或生成多媒體內容），以及成個對話嘅歷史長度等等。

Google 原本嘅企劃概念，係認為咁樣做比較公平。因為簡單嘅純文字對話，背後動用嘅伺服器資源比較少，自然消耗較少額度；而複雜嘅編程任務、需要長時間推理嘅任務，或者生成影片，先會快速消耗大量運算力。

然而，問題就在於呢個計算機制嘅透明度非常低。喺實際應用場景裏面，好多用家反映，有時只係輸入咗一個稍微複雜少少嘅指令，或者喺對話裏面附帶咗一個大檔案，系統就會一次過扣晒成個時段嘅所有額度。最令用家感到沮喪嘅係，一旦限額用盡，用家喺跟住落嚟嘅幾個鐘之內，都完全無辦法繼續跟進同一項工作，成個工作流程被逼中斷，造成極大不便。

Google 副總裁預告改善措施　四大核心調整回應民意

面對用家嘅強烈不滿，Google 副總裁 Josh Woodward 透過社交平台 X（前稱 Twitter）發表連續帖文，承認現行機制喺面對複雜提示詞同大型檔案時，確實存在令配額過快耗盡嘅問題。為此，佢預告咗多項即將推行嘅改善方針，旨在提升 Gemini 3.1 Pro 以及其他模型嘅使用彈性與合理性。

1. 單一指令設用量上限　防止一次過清空配額

針對用家最關注嘅「一次指令抽乾配額」問題，Josh Woodward 表示，當用家使用 Gemini 3.1 Pro 輸入較為複雜嘅提示詞，尤其是當附帶大型檔案嘅時候，目前嘅系統確實會令到限額極速見底。為咗解決呢個痛點，Google 決定為單一提示詞所能消耗嘅額度設定一個「頂限」（Cap）。

呢個舉措意味住，無論用家輸入嘅指令有幾複雜、涉及嘅檔案有幾大，系統都唔會容許單一次操作就清空成個時段嘅配額。咁樣可以確保用家喺使用高級嘅 Pro 模型時，依然可以獲得更多持續對話同埋微調結果嘅空間，而唔會因為一次嘗試就無緣後續嘅溝通。

2. 系統出錯唔扣額度　承諾提供更詳細用量分頁

過往另一個被用家詬病嘅地方，就係當 Gemini 系統出現內部錯誤、無辦法正常提供解答結果嘅時候，運算所消耗嘅額度依然照樣扣除，令用家白白蒙受損失。

Google 喺呢次聲明裏面明確澄清，未來用家絕對唔需要為系統嘅錯誤買單。如果任何請求失敗或者因為系統問題而未能完成指令，嗰次對話將會完全唔計入用量。Josh Woodward 強調：「我哋嘅系統出錯由我哋自己承擔，而唔係由用家承擔。」

另外，針對目前用家無辦法掌握具體消耗數據嘅問題，Google 計劃優化現時設於 [gemini.google.com/usage](https://gemini.google.com/usage) 嘅用量資訊主頁。目前呢個分頁只提供好高層次嘅大槪數據，未來將會加入更詳細嘅分項數據同埋即時通知，等用家可以好具體咁知道自己喺邊啲任務上消耗咗幾多運算量，從而更有效咁管理剩餘配額。

3. Gemini 3.1 Flash-Lite 完全免費　自動鎖定用家偏好模型

除咗對高級 Pro 模型進行限制優化之外，Google 亦帶來咗一個營運方向上嘅調整。由即日起，用家使用 Gemini 3.1 Flash-Lite 作為運算模型嘅對話，將會改為完全免費，唔再計入每週嘅可用配額。

對於日常只需要進行簡單問答、翻譯、摘要或者文字整理嘅用家嚟講，呢個輕量級模型已經足夠應付。將其完全免費化，可以有效分流用家嘅日常需求，避免浪費高級模型嘅額度。

同時，為咗配合用家嘅習慣，系統依家會自動記住用家上一次選擇嘅特定模型。舉個例，如果你手動選擇咗 Flash-Lite 模型，未來所有新開啟嘅對話都會預設沿用呢個模型，直到用家自己手動切換，或者因為高級模型嘅用量觸及上限而被逼自動降格為止。呢個小改動免除咗用家每次開啟新視窗都要重新選擇模型嘅繁瑣步驟。

4. 修正 Omni 生成影片 Bug　AI Ultra 訂戶配額翻倍

至於最新推出嘅 Omni 模型，有部分訂戶反映，有時只係生成咗一至兩段影片，配額就已經完全耗盡。Google 指出呢個其實係系統內部嘅一項 Bug（錯誤），目前已經完成修復，並承諾未來會持續尋求提升用家生成影片配額嘅機會。

作為補償與分級福利嘅調整，由即日起，AI Ultra 嘅訂戶喺生成 Omni 影片同相關內容時，所獲得嘅生成次數將會直接翻倍，以滿足專業用家對高階多媒體生成嘅高強度需求。

實用資訊：Gemini 現行與優化後新機制對比

為咗方便香港讀者清晰了解呢次改動嘅前後分別，以下將相關核心政策整理成對比表格：

機制項目	舊有 / 現行機制	優化後全新措施
運算量扣減方式	根據提示詞複雜度、工具及對話長度扣減，單次指令無上限。	設定單一提示詞（Prompt）最高消耗上限，防止一次扣盡。
系統錯誤處理	即使運算失敗或系統出錯，已用額度依然會被扣除。	請求失敗或系統出錯完全唔扣配額，用量僅計成功完成嘅指令。
Gemini 3.1 Flash-Lite	納入運算量計算，會消耗每週嘅可用配額。	改為完全免費使用，不計入任何限額。
模型選擇記憶	每次開啟新對話可能需要重新選擇，或由系統自動指派。	自動記住用家上次選擇嘅模型，並作為未來所有新對話嘅預設值。
用量透明度	Dashboard 只顯示概括嘅高層次數據，難以預算。	承諾提供更詳細嘅分項數據與即時配額通知。
Omni 影片生成	容易觸發 Bug 導致一兩次生成就耗盡用量。	修正 Bug，並為 AI Ultra 訂戶提供雙倍生成次數。

香港用家應對策略：點樣喺新機制下極大化 AI 工具效益？

喺呢個全新嘅「按運算量計費」時代，不論係初創企業、自由職業者定係一般辦公室職員，喺日常應用 Gemini 嘅時候，都需要微調一下使用策略，以求喺限額之內發揮最大嘅工作效益。

實施任務分流： 既然 Gemini 3.1 Flash-Lite 已經改為完全免費而且唔扣配額，用家喺處理行政庶務，例如撰寫日常電子郵件、修改錯別字、或者做一般嘅外語文字翻譯時，應該主動將模型切換去 Flash-Lite。將珍貴嘅 Pro 模型額度，留返嚟處理大數據分析、長文本閱讀、編寫程式代碼或者進行 Deep Research 等需要高度推理嘅高級任務。
注意檔案與提示詞結構： 雖然 Google 即將為單一指令設立用量上限，但上傳超大型檔案（如數百頁嘅 PDF 報告或長影片）依然會觸及單次消耗嘅天花板。建議用家可以將大型任務拆解，分段上傳或者先將資料做初步截取，避免一次過輸入過於冗長嘅上下文（Context），咁樣做有助於維持對話嘅延續性。
善用即將推出嘅詳細用量分頁： 當新嘅數據分項功能上線之後，用家應該定期檢查自己喺邊一類型嘅任務上消耗最多運算量。透過了解自己嘅用量模式，可以更精準咁規劃每週嘅工作進度。另外，Google 亦計劃喺未來推出「隨買隨用」（Pay-as-you-go）嘅額外 AI 點數充值機制，對於偶然需要處理超大型項目嘅用家，呢個亦會係一個靈活嘅預算選項。

總結

總結嚟講，Google 呢次迅速回應市場與用家嘅反饋，反映出生成式 AI 市場嘅競爭依然非常激烈。從原本單純按次數限制，走向精細化嘅運算量計費，係各大科技巨頭為咗平衡伺服器成本與商業營利嘅必然趨勢。不過，計費機制嘅透明度同埋合理性，直接影響到用家嘅黏著度。

Google 呢次推出嘅限額封頂、錯誤免收費以及輕量模型免費化等措施，喺一定程度上修補咗新制推出初期嘅體驗漏洞。對於一般讀者而言，理解呢啲底層機制嘅轉變，並且靈活切換唔同級別嘅模型，將會係未來使用 AI 工具必不可少嘅日常技能。

Gemini 運算量計法大改引發爭議　Google 急推優化方案：Flash-Lite 全免、單次指令設封頂上限

回應全球用家不滿　Google 調整 Gemini 運算量限額機制　推出多項優化措施改善體驗

新制改用運算量計費　用家頻頻「踩雷」迅速用盡限額