Google 最近發佈了其最新的 Gemini 圖像模型 Nano Banana 2,承諾提供更快的圖像生成速度,並增強智能功能、優化文字渲染及強化創意控制。這個新系統正式命名為 Gemini 3.1 Flash Image,結合了 Gemini Flash 的速度和 Nano Banana Pro 先前提供的高品質推理與世界知識,目的是在不犧牲速度的情況下,呈現工作室級的視覺效果。Nano Banana 去年首次受到廣泛關注,因其圖像編輯和生成能力而迅速走紅。數月後,其更先進的 Pro 版本隨之推出,提供了改進的事實基礎和創意精確度。隨著 Nano Banana 2 的推出,Google 表示將這兩者的優勢融合成一個更快的模型,以便更廣泛地應用。
這個模型基於 Gemini 的現實世界知識庫,能夠使用即時信息和網絡搜索中的圖像,更準確地渲染特定主題。擴展的上下文使其能夠生成信息圖,將筆記轉換為圖表,並創建更可靠的數據可視化。Nano Banana 2 專注於速度的同時,並不妥協於圖像質量。Google 表示,該模型顯著縮小了快速生成與視覺真實性之間的差距。這個模型引入了改進的主題一致性,使用戶能夠在單一工作流程中保持多達五個角色的相似性,以及保留多達十四個物體的真實性。
Nano Banana 2 的發布使得用戶能夠以更快的速度創建具現實準確性的圖像,並能在多種語言中添加文字,將最狂野的想法以更生動的光影、豐富的紋理和更清晰的細節實現。這項功能支持故事板和多場景敘事,且無視覺漂移。指令遵循的功能也得到了升級,系統對於複雜提示的遵循更加嚴格,旨在捕捉細微的請求,而不是模糊地解釋它們。
用戶可以控制從 512 像素到 4K 的長寬比和解析度,使其適合於垂直社交媒體帖子或大型顯示屏。文字渲染和翻譯也是一大重點,Nano Banana 2 可以生成適合市場模擬、賀卡和設計原型的可讀、準確的文字。它還能直接在圖像內翻譯和本地化文本,支持全球內容工作流程。
Nano Banana 2 將在多個 Google 平台上推出,取代 Gemini 應用中的 Nano Banana Pro 版本,並將其整合進 Search 的 AI 模式和 Lens、AI Studio、Gemini API、Google Cloud 上的 Vertex AI、Flow、Google Ads 及 Google Antigravity。在 Flow 中,它成為用戶可用的默認圖像生成模型,並且不收取信用費用。
除了創意升級外,Google 也在擴展其來源系統。該公司繼續將 SynthID 水印技術與 C2PA 內容證書相結合,以澄清 AI 生成內容的創建和修改過程。自去年十一月推出以來,Gemini 應用中的 SynthID 驗證功能已經報告使用超過 2,000 萬次,來識別 Google AI 生成的圖像、視頻和音頻。Google 表示,C2PA 驗證也將很快直接添加到 Gemini 應用中。
隨著 Nano Banana 2 的推出,Google 將快速且基於事實的圖像生成定位為標準功能,而非高級附加功能,這顯示出在高速 AI 創意工具領域競爭的加劇。

