Nanobanana 2 上线,在这几个场景比 Pro 版还强!

昨天Nanobanana 2 上线了,

正式名称叫 Gemini-3.1-Flash-image

看名字就知道了,

它的特点就是:快,好,省。

在 Image Arena 中Score目前第一。

先说说生图之外的参数吧:

生成速度显著提升,价格约为 Nano Banana Pro 的一半。画面质量与之前基本持平甚至在某些场景更好,

Nanobanana 2 支持的画质也和 Pro 持平,也能生成4k画质,性价比极高。

目前我发现有这几个场景,

banana2的出图效果是比 banana Pro 好的。


多参

Nanobanana2 的一致性更好,

最多能一口气加入五个参考角色进行生图。

这图真的太抽象了。。。

多比例

传统的 16:9, 3:4, 21:9,啥模型都能干。

那像4:1,8:1 这种刁钻比例,banana2 居然也支持。

比如这张图,就是用 Nanobanana2 做出来的,

Nanobanana Pro 无法做出来。

(不知道发到小黑盒会不会压缩画质,我这里看是小字很清晰的)

生成这种长条海报真是有手就行,连裁剪都不需要了。

Prompt:生成一张中学生遇到心理问题正确处理方式的纵轴介绍图,科普风格,方便中学生学习接纳,1:8。

长图警告⚠

纵轴图生成好之后,咱再来试试横轴全景图

Prompt:一张用我手机拍摄的4:1 全景照片,我住在日式双层公寓中,星空美丽,日式二次元街景,令人惊叹的星夜,新海诚《你的名字》风格。

还有一个我超喜欢的进化演变图,之前只能用 21:9 比例来做,现在 8:1 的效果超好。

这张图提示词有几千词,避免影响观感就不在文中发了。

如果有需求的盒友需要,我发评论区喵。

细节更好

Nanobanana2 对细节的把控也增强了,

试试用它一口气生成电影级分镜。

效果是真不错。

焚诀提示词附上:

Prompt:
<role>
You are an award-winning trailer director + cinematographer + storyboard artist. Your job: turn ONE reference image into a cohesive cinematic short sequence, then output AI-video-ready keyframes.
</role>

<input>
User provides: one reference image (image).
</input>

<non-negotiable rules - continuity & truthfulness>
First, analyze the full composition: identify ALL key subjects (person/group/vehicle/object/animal/props/environment elements) anddescribe spatial relationships and interactions (left/right/foreground/background, facing direction, what eachis doing).
Do NOT guess real identities, exact real-world locations, or brand ownership. Stick to visible facts. Mood/atmosphere inference is allowed, but never present it asreal-world truth.
Strict continuity across ALL shots: same subjects, same wardrobe/appearance, same environment, same time-of-dayand lighting style. Only action, expression, blocking, framing, angle, and camera movement may change.
Depth of field must be realistic: deeper in wides, shallower inclose-ups withnatural bokeh. Keep ONE consistent cinematic color grade across the entire sequence.
Do NOT introduce new characters/objects not present in the reference image. If you need tension/conflict, imply it off-screen (shadow, sound, reflection, occlusion, gaze).
</non-negotiable rules - continuity & truthfulness>

<goal>
Expand the image into a 10–20second cinematic clip with a clear theme and emotional progression (setup → build → turn → payoff).
The user will generate video clips from your keyframes and stitch them into a final sequence.
</goal>

<step 1- scene breakdown>
Output (with clear subheadings):
Subjects: list each key subject (A/B/C…), describe visible traits (wardrobe/material/form), relative positions, facing direction, action/state, andany interaction.
Environment & Lighting: interior/exterior, spatial layout, background elements, ground/walls/materials, light direction & quality (hard/soft; key/fill/rim), implied time-of-day, 3–8 vibe keywords.
Visual Anchors: list 3–6 visual traits that must stay constant across all shots (palette, signature prop, key light source, weather/fog/rain, grain/texture, background markers).
</step 1- scene breakdown>

<step 2- theme & story>
From the image, propose:
Theme: one sentence.
Logline: one ********ed trailer-style sentence grounded in what the image can support.
Emotional Arc: 4 beats (setup/build/turn/payoff), one line each.
</step 2- theme & story>

<step 3- cinematic approach>
Choose and explain your filmmaking approach (must include):
Shot progression strategy: how you move from wide toclose (or reverse) to serve the beats
Camera movement plan: push/pull/pan/dolly/track/orbit/handheld micro-shake/gimbal—and WHY
Lens & exposure suggestions: focal length range (18/24/35/50/85mm etc.), DoF tendency (shallow/medium/deep), shutter “feel” (cinematic vs documentary)
Light & color: contrast, key tones, material rendering priorities, optional grain (must match the reference style)
</step 3- cinematic approach>

<step 4- keyframes for AI video (primary deliverable)>
Output a Keyframe List: default9–12 frames (later assembled intoONE master grid). These frames must stitch into a coherent 10–20s sequence with a clear 4-beat arc.
Each frame must be a plausible continuation within the SAME environment.

Use this exact format per frame:

[KF# | suggested duration (sec) | shot type (ELS/LS/MLS/MS/MCU/CU/ECU/Low/Worm’s-eye/High/Bird’s-eye/Insert)]
Composition: subject placement, foreground/mid/background, leading lines, gaze direction
Action/beat: what visibly happens (simple, executable)
Camera: height, angle, movement (e.g., slow 5% push-in/1m lateral move / subtle handheld)
Lens/DoF: focal length (mm), DoF (shallow/medium/deep), focus target
Lighting & grade: keep consistent; callout highlight/shadow emphasis
Sound/atmos (optional): one line (wind, city hum, footsteps, metal creak) to support editing rhythm
Hard requirements:
Must include: 1 environment-establishing wide, 1 intimate close-up, 1 extreme detail ECU, and1 power-angle shot (low or high).
Ensure edit-motivated continuity between shots (eyeline match, action continuation, consistent screen direction / axis).
</step 4- keyframes for AI video>

<step 5- contact sheet output (MUST OUTPUT ONE BIG GRID IMAGE)>
You MUST additionally output ONE single master image: a Cinematic Contact Sheet / Storyboard Grid containing ALL keyframes inonelarge image.
Default grid: 3x3. If more than 9 keyframes, use 4x3 or5x3 so every keyframe fits intoONE image.
Requirements:
The single master image must include every keyframe as a separate panel (one shot per cell) for easy selection.
Each panel must be clearly labeled: KF number + shot type + suggested duration (labels placed in safe margins, never covering the subject).
Strict continuity across ALL panels: same subjects, same wardrobe/appearance, same environment, same lighting & same cinematic color grade; only action/expression/blocking/framing/movement changes.
DoF shifts realistically: shallow inclose-ups, deeper in wides; photoreal textures and consistent grading.
After the master grid image, output the full text breakdown foreach KF inorder so the user can regenerate any single frame at higher quality.
</step 5- contact sheet output>

<final output format>
Output in this order:
A) Scene Breakdown
B) Theme & Story
C) Cinematic Approach
D) Keyframes (KF# list)
E) ONE Master Contact Sheet Image (All KFs inone grid)
</final output format>

最后生成出来的电影分镜,可直接放到 Seedance2.0 中生成。

(黑盒文章没法插入视频呜呜呜

这个 Case 就当做课堂作业,朋友们可以自己去试试~

(如果你是用 Lovart 的话,每天会赠送免费积分,生成几张 Nanobanana2 图片是没问题的)

我还发现一个邪修,众所周知,

Nanobanana Pro生图很牛逼,但就是慢。

我在 Lovart 上传了一整部小说,让它用 Nanobanana 2 一口气生成50 张图片。

文字清晰,人物一致性稳定,没毛病。

最后就是最近 Skill 这个概念超火,原本是 Claude code 上,本质上是语义封装

没想到 Lovart 也整了个,

Nanobanana2生图模型搞 Skill,太抽象了。。。

用 Skill 一键生成电商产品套图,emmm 确实比以前方便一点。

个人感觉Nano Banana 2 最大的突破,

在于它将 Pro 版本的 4K 高清输出和复杂空间推理能力,

下放到了 Flash 架构中。

有点像你不再需要在 Gemini 中“Fast”和“Thinking”两种模式之间做选择。

毕竟小孩子才做选择,我全都要。

至于其他的部分,

banana Pro 已经做得非常好了,

Nanobanana 2 也没啥提升空间。

晓风乾丨 大四 Base北京 AI产品在职

想缩小科技带来的信息差 分享很酷的AI玩法。

希望得到您的点赞转发爱心三连支持。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com