Google 全新 AI 工具 Nano Banana 2 Lite 登場:4秒出圖,打通 Gemini Omni Flash 影片生態圈

Google 宣佈推出全新 AI 圖像生成模型 Nano Banana 2 Lite,主打極速出圖同埋低成本,只需4秒就可以生成圖像,每千張成本低至0.034美元。同步擴大 Gemini Omni Flash 影片生成模型嘅測試範圍,容許開發者用自然語言剪片。Google 更加推出咗三款示範應用程式,展示點樣將兩隻模型結合,一條龍完成由圖像到影片嘅創作,大幅度降低企業同創作者嘅運作成本。

Google 全新 AI 工具 Nano Banana 2 Lite 登場:4秒出圖,打通 Gemini Omni Flash 影片生態圈
Google 全新 AI 工具 Nano Banana 2 Lite 登場:4秒出圖,打通 Gemini Omni Flash 影片生態圈

成本更低、速度更快!Google Nano Banana 2 Lite 同 Gemini Omni Flash 登場,重塑 AI 視覺創作

科技巨頭 Google 日前正式推出全新嘅內部 AI 圖像生成模型 Nano Banana 2 Lite,主打超高生成速度同埋極低嘅運作成本。根據官方公佈嘅資料,呢隻新模型只需4秒就可以生成一張圖像,專為需要喺短時間內進行大量圖像測試、或者需要極速工作流程嘅開發者而設。同時間,Google 亦都宣佈擴大 Gemini Omni Flash 影片生成模型嘅開放範圍,令開發者可以將圖像生成同影片製作無縫結合。呢次更新標誌住 Google 喺生成式 AI 媒體領域嘅佈局更加完整,進一步降低企業同埋創作者使用 AI 工具嘅門檻。

Nano Banana 2 Lite 嘅效能先決策略

喺目前嘅 AI 圖像生成市場入面,其中一個最大嘅痛點就係出圖速度慢,影響咗實際工作嘅效率。Google 今次推出嘅 Nano Banana 2 Lite,顧名思義就係 Nano Banana 2 嘅輕量化版本,官方將佢定位為整個 Nano Banana 家族入面速度最快、成本效益最高嘅模型。

速度與成本分析

新模型將生成時間大幅度縮短到只有4秒。根據 Google 官方提供嘅示範例子,當舊版模型啱啱先生成完一張圖片嘅時候,Nano Banana 2 Lite 已經成功生成咗五張圖片。呢種極高嘅吞吐量,對需要進行 A/B 測試、製作大量廣告草圖、或者需要喺短時間內預覽多個設計方案嘅用家嚟講,可以話係大幅度提升咗工作效率。特別係對香港、台灣同埋新加坡呢啲生活節奏急促、講求商業效率嘅華人地區,行銷團隊往往需要喺極短時間內因應社會熱話去「抽水」出宣傳圖,4秒出圖嘅優勢就變得非常明顯。

0:00
/1:20

根據 Google 官方提供嘅示範例子,當舊版模型啱啱先生成完一張圖片嘅時候,Nano Banana 2 Lite 已經成功生成咗五張圖片。

喺成本方面,Nano Banana 2 Lite 同樣具備好大嘅競爭力。官方定價係每1,000張圖像只需要0.034美元。呢個價錢對需要處理大批量圖像生成嘅企業,例如中國內地龐大嘅電商市場、或者香港同台灣嘅大型廣告公司,可以有效控制營運成本。相比起每次都要花費大量金錢購買圖庫,或者重新聘請插畫師畫草圖,低成本 AI 生成提供咗一個更務實嘅商業選項。

效能與品質嘅平衡

雖然呢隻模型主打速度同埋低成本,但係 Google 強調佢喺圖像品質方面依然保持一定水準。官方指出,Nano Banana 2 Lite 喺理解指令、保持角色一致性、以及喺圖片入面生成清晰文字方面,都有相當可靠嘅表現。值得一提嘅係,對大中華地區嘅用戶嚟講,文字渲染能力一直都係一大痛點,雖然官方未有詳細說明支援中文字體嘅程度,但根據以往 Gemini 系列嘅表現,預計佢喺處理簡單嘅中文字元排版上會有一定嘅基礎能力。不過,Google 亦都講明,如果用家需要最高品質、最精細嘅專業級圖像控制,依然建議使用定位為「全能型」嘅 Nano Banana 2,或者更加高階嘅 Nano Banana Pro 模型。

效能與品質嘅平衡
效能與品質嘅平衡

深入探討:點解 AI 生成速度咁重要?

喺過去幾年,雖然 AI 圖像生成技術發展得好快,但係由輸入指令到完全生成一張高像素嘅圖片,往往需要十幾秒甚至半分鐘嘅時間。對普通用家嚟講,等幾十秒可能唔算係咩大問題;但係對商業機構嚟講,當要處理成千上萬張圖片嘅時候,呢啲等候時間就會積少成多,變成龐大嘅伺服器成本同埋時間成本。

Google 推出 Nano Banana 2 Lite 嘅核心邏輯,就係要解決呢個「運算樽頸」。將出圖時間壓縮到4秒以內,意味住開發者可以將呢項技術無縫整合去各種實時應用入面。例如,當一個顧客喺網店瀏覽緊某一件衫嘅時候,系統可以即時因應顧客嘅喜好,喺4秒內生成出呢件衫喺唔同天氣、唔同場合下嘅穿搭示範圖。呢種即時互動嘅體驗,喺以往出圖速度慢嘅年代係好難做到嘅。加上低廉嘅收費,令到中小型企業都有能力負擔得起呢種高科技營銷手段,對整體商業生態有深遠嘅影響。

降低影片生成門檻:Gemini Omni Flash 嘅多模態優勢

除咗圖像生成,Google 亦都宣佈 Gemini Omni Flash 影片生成模型將會向更加多開發者開放。呢隻模型最初喺今年嘅 Google I/O 大會上亮相,主要賣點係將 Gemini 嘅多模態理解能力同影片生成技術結合。

0:00
/0:19

Gemini Omni Flash 嘅多模態優勢

核心功能與定價

Gemini Omni Flash 支援對話式影片剪輯,即係話用家可以直接用日常傾偈嘅自然語言輸入指令,要求 AI 修改或者微調影片內容。另外,模型支援多模態輸入,用家可以同時提供文字、圖片同埋影片片段作為參考,令到生成出嚟嘅影片更加符合預期。

,令到生成出嚟嘅影片唔單止畫面靚,仲具備合理嘅敘事邏輯。
,令到生成出嚟嘅影片唔單止畫面靚,仲具備合理嘅敘事邏輯。

目前,Gemini Omni Flash 嘅定價係每秒影片輸出0.10美元。官方強調,模型結合咗現實世界嘅常識,例如物理法則、歷史背景或者生物學邏輯,令到生成出嚟嘅影片唔單止畫面靚,仲具備合理嘅敘事邏輯。文字同動作嘅同步處理亦係呢隻模型嘅強項之一,用家可以輕易將圖形或者文字同影片入面嘅動作對齊。

傳統嘅影片剪輯軟件,需要用家逐個畫面去調整顏色、角度或者特效。但係透過 Gemini Omni Flash,用家只需輸入好似「將畫面左邊嘅燈光調暗少少,然後將背景轉做黃昏」呢類自然語言指令,系統就可以自動理解並執行。

目前嘅限制

作為一款仲喺預覽階段嘅產品,Gemini Omni Flash 現時依然有一定嘅限制。首先,模型目前最多只可以生成10秒嘅影片片段。其次,透過 API 輸入音頻參考或者延長影片長度嘅功能,目前仲未支援。至於場景轉換或者鏡頭移動時嘅角色一致性,官方坦言依然有進步空間。喺鏡頭大幅度移動或者場景切換嘅時候,角色嘅樣貌或者服裝細節依然有機會出現「走樣」嘅情況,呢個亦係整個 AI 業界目前積極嘗試克服嘅技術瓶頸。

兩大模型結合:打通視覺創作生態圈

Google 今次發佈嘅重頭戲,並唔單止係兩隻獨立嘅模型,而係展示咗點樣將兩者結合成一個完整嘅工作流程。用家可以先利用 Nano Banana 2 Lite 嘅速度優勢,極速生成大量草圖,揀好心水圖片之後,再將圖片交畀 Gemini Omni Flash,將靜態圖片轉化成高質素嘅動態影片。

為咗具體展示呢種玩法,Google 推出咗三款示範應用程式:

  1. Anywhere:一款主打虛擬旅遊嘅應用程式。用家只需要上傳一張自拍照,程式就會用 Nano Banana 2 Lite 將用家「傳送」到世界各地嘅著名地標。當用家點擊圖片,Gemini Omni Flash 就會將呢個場景變成一段生動嘅動畫短片。
  2. Space Lift:針對室內設計嘅示範程式。用家上傳一張房間相片後,系統會生成多個唔同風格嘅室內設計方案。揀好心儀嘅設計後,就可以生成一段充滿電影感嘅預覽影片,等用家喺現實裝修前可以「睇到」實際效果。
  3. Omni Product Studio:專為電子商貿而設嘅工具。佢可以將 Nano Banana 2 Lite 生成嘅靜態商品圖片,轉化成可以用喺網店或者社交媒體嘅宣傳影片。對香港嘅網店老闆、台灣嘅代購賣家、或者中國內地經營電商嘅商家嚟講,呢個功能可以大大節省拍攝同埋後期製作嘅時間同金錢。商家只要輸入簡單嘅產品資料,系統就可以一條龍生成宣傳短片。

其他附加基本資料與事實整理:Nano Banana 家族全線比較

為咗令讀者更加清晰了解 Google 呢次發佈嘅產品定位,以下為大家整理咗目前 Nano Banana 圖像生成模型家族嘅各個版本,方便大家根據自己嘅商業需求作比較:

  • Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image)
    • 主打賣點:速度極快、成本極低。
    • 適用情境:需要近乎實時生成圖像嘅工作流程、大批量生成廣告草圖、快速原型製作。
    • 效能表現:超低延遲(大約4秒出圖),適合需要極速反應嘅應用程式。
  • Nano Banana 2 (Gemini 3.1 Flash Image)
    • 主打賣點:全能實用型。
    • 適用情境:一般商業用途、社交媒體圖像創作、需要平衡品質同埋時間成本嘅日常設計工作。
    • 效能表現:提供最好嘅效能同埋成本平衡,圖像質素比 Lite 版本更加高。
  • Nano Banana Pro (Gemini 3 Pro Image)
    • 主打賣點:專業級細節控制。
    • 適用情境:需要高度精準嘅專業級設計、複雜場景建構、對光影同細節要求極高嘅商業廣告。
    • 效能表現:雖然生成時間最長,但可以提供最強大嘅推論能力同埋準確度。
  • Nano Banana (Gemini 2.5 Flash Image)
    • 主打賣點:舊代基礎模型。
    • 官方建議:Google 已經將呢個版本標記為「傳統模型」,而且強烈建議目前使用緊呢個版本嘅開發者,直接升級去 Nano Banana 2 Lite 去獲取更好嘅效能。

產業影響:好萊塢與 AI 嘅角力及內容透明度

隨住 Nano Banana 2 Lite 同 Gemini Omni Flash 呢類工具變得越嚟越普及,AI 喺創意產業嘅角色亦變得越嚟越具爭議性。

一方面,科技公司積極推銷 AI 工具點樣可以幫廣告商同內容創作者提高效率;但另一方面,傳統影視製作圈子對 AI 嘅廣泛應用依然充滿疑慮。近期,Google 同獨立電影製作公司 A24 達成咗一份價值7,500萬美元嘅合作協議,引起咗唔少電影愛好者同埋創意工作者嘅強烈反對。部分人擔心,AI 技術會逐步取代人類嘅創意工作,甚至會令到市場上充斥大量粗製濫造嘅「AI 垃圾」。

為咗應對大眾對 AI 生成內容泛濫嘅擔憂,Google 表示兩隻新模型都有內置 SynthID 水印技術。呢種技術可以喺圖像同影片入面加入肉眼睇唔到嘅數碼標籤,等其他平台或者用家可以識別出內容係由 AI 生成,提升資訊嘅透明度。

總結

Google 推出 Nano Banana 2 Lite 同埋擴展 Gemini Omni Flash 嘅應用範圍,明顯係針對企業同開發者喺「時間」同「預算」上嘅考量。Nano Banana 2 Lite 以4秒嘅極速生成能力同埋極低嘅成本,解決咗大批量圖像測試嘅痛點;而 Gemini Omni Flash 則進一步降低咗影片製作嘅技術門檻。兩者嘅結合,為電子商貿、廣告設計以及多媒體創作提供咗一套務實嘅技術支援。面對創意產業對 AI 技術嘅擔憂,科技公司點樣喺推動技術普及嘅同時,保障內容質素同埋建立完善嘅認證機制,依然係未來需要持續關注嘅客觀課題。