0
這兩天,谷歌又悄咪咪有了新動作。(雷峰網(公眾號:雷峰網)雷峰網雷峰網)
就在2月26日晚間,谷歌在Gemini App中上線Nano Banana 2(技術代號Gemini 3.1 Flash Image)。這款圖像模型已全面接入Gemini App、Google Search及開發者API。這一全新模型融合了此前 Nano Banana Pro 的高階能力與 Gemini Flash 的極速性能,更像是一次從“酷炫秀”向“生產級工具”的戰略轉移。
相比此前 Nano banana pro帶來的驚艷感,這次更新在速度和價格上有極大優勢。
一位資深AI產品經理麥莉表示,Nano Banana 2 的圖像生成速度比上一代 Pro 模型明顯更快,成為這次升級的核心優勢之一,只是亮點確實談不上。
據Google DeepMind官方博客披露,Nano Banana 2的核心賣點是"將Nano Banana Pro的高級能力融入Flash速度"。

首先,Nano Banana 2最直觀的沖擊來自原生4K輸出。
前代Nano Banana(基于Gemini 2.5 Flash)的畫質在復雜場景下會有涂抹感,banana 2 在保持同等響應速度的前提下,支持512px至4K的原始分辨率輸出,皮膚紋理、褶皺、遠景細節不再主要依賴后期放大來提升清晰度。
一位AI圈內人士認為,這次Banana 2 的光影邏輯更符合真實世界,核心是推理層的升級。
我們測試了一下輸出一張4k的高分辨率人像,果然在光影和水珠的處理上肉眼可見的提升:

更實用的是,本次banana 2 支持單 workflow 追蹤最多5個角色與14個物體,可基于14張參考圖進行元素融合,這對系列插畫、故事板制作等需要角色一致性的場景較為實用。
比如我們將這張電影海報進行換臉處理后:
()
再根據prompt的關鍵詞設置后,就會得到這樣一組分鏡頭畫面:

也難怪這次有博主稱設計行業要變天了,我們隨意上傳了一款產品,讓Nano banana 2 設計出一套視覺方案,沒想到細節都很到位:
其次,來自Nano Banana 2 增強的世界知識與文本渲染。
文字生成一直是AI繪圖的行業病,Banana 2 在這方面進步明顯:海報標題、屏幕UI、白板手寫體均可清晰呈現,中文支持度達標。
我們試了下,在prompt中包含明確文本的相關場景測試中,Nano Banana 2 對指定中文和英文文本的還原準確度較高
不過,我們發現,雖然中文顯示基本可用,但也別塞太多字,不然生成的圖片就會出現模糊和粘連的問題。
此外,Nano Banana 2 得益于 Gemini 系列強大的世界知識基礎,能夠調用實時網絡信息來提升圖像生成效果和細節準確性。
為此,谷歌做了一個‘Window Seat"(靠窗座位)的展示秀,意味著Nano Banana 2結合全球各地的真實場景和實時天氣數據,生成當下最符合現實世界的窗外照。
我們正好結合北京剛剛下過雪的天氣,體驗一下谷歌引以為傲的‘Window Seat"(靠窗座位)的演示:
在更復雜的指令理解場景下,Nano Banana 2 的穩定性也有所提升。
我們設置了包含具體地理位置、室內視角和極端天氣條件的提示。Nano Banana 2 能夠較好地理解“船艙內靠窗視角”這一空間約束,并生成符合德雷克海峽海況特征的畫面,整體光影和物理邏輯較為合理。

最后則是老生常談的“性價比”。
以 1K 分辨率計算,Nano Banana 2 的價格僅為 0.067 美元,約為 Pro 版的一半。谷歌用更低的成本,換來了畫質接近Pro版、更快的生成效率,以及獨占的 4K 輸出能力。在價格與性能同時下探的情況下,直接挑戰 Midjourney 和 DALL·E 在性價比上的短板。
另外,谷歌已將 Nano Banana 2 設為默認圖像生成模型,并整合進 Gemini、Google Search、Google Lens 及 Flow 等核心產品,同時通過 Gemini API 和 Vertex AI 向開發者開放。
這意味著,無論是普通用戶、內容創作者還是企業級開發者,都可以在日常使用與生產流程中更早、更廣泛地享受到這項技術。
總體來看,Nano Banana 2的升級路徑偏向"去炫技化"——將重心放在生成效率、跨平臺協同與成本控制上,試圖將AI圖像生成從演示場景推進至常規工作流。
從資本市場角度出發,谷歌此次更新暫未激起明顯波瀾。一位二級市場投資經理認為,前一晚美股行情主要受“軟件壓制硬件”的結構性因素主導,相關影響是否釋放,仍需等待后續交易時段的市場反饋。(作者持續跟蹤 AI 應用與模型更新,歡迎加微信Who123start交流)
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。