即梦4.5发布:美学满分,跟香蕉打的有来有回

AI圈子最近有点让人目不暇接。


还没有彻底玩明白 Sora 2,感叹视频生成终于跨过了“恐怖谷”;也没有彻底玩明白 nanobanana Pro,字节跳动昨晚又悄没声地在火山引擎上端出了一盘硬菜:图像创作模型——即梦4.5。


这一波更新真的挺值得看看。


咱们都知道,国产大模型在“语言”上卷得差不多了,现在战火终于烧到了“视觉”这个更直观、也更吃算力的领域。


我看了一圈官方演示和各路大神的实测,感觉字节这次的策略非常清晰:不整虚的,先在“好看”和“能用”这两个方向上下大功夫。


颜值的胜利

首先得承认,即梦4.5 在“文生图”这个老本行上,确实有点东西。


它最大的杀手锏其实源自它的“出身”。


背靠抖音这个巨大的内容池,即梦4.5 显然“阅片无数”。这就导致它生成的人像,不仅五官端正,更有一种很难用数据量化的“网感”。


你输一段关于美女的提示词,它给你的不是那种一眼假的油光皮肤3D人,而是光影、妆容、穿搭都极其符合当下审美的“即梦脸”。


在实际的商业落地时,这种讨好眼球的“美学滤镜”往往比所谓的真实感更管用。

官方宣称这次模型整体进行了scaling,细节质感全方位提升。


但如果你以为它只会画美女,那就小看它了。这次Seedream 4.5真正的杀手锏,在于它能像个漫画家一样“讲故事”。

比如上面这张图,这是一组科普“可控核聚变”的漫画。


以前的AI虽然也能画,但经常第一张主角是圆脸,第二张就变方脸,衣服颜色还能变个别的颜色。


但即梦4.5 展现出了极强的角色锁定能力,图里的红发小孩和罗小黑,在四个分镜里长得一模一样(除了最下面眼睛变黄了,莫非体内核聚变?),连表情神态的连续性都非常到位。


更重要的是文字。


注意看漫画里的对话气泡,虽然是AI生成的,但字迹清晰,排版工整。官方特意强调了这一点,它强化了海报等密集文字的排版渲染能力。

以后做电商海报、Logo设计,它能直接出成品,不用苦哈哈地去PS里贴字研究了。


与谷歌“纳米香蕉”的不同

看到这,你可能觉得即梦4.5 已经无敌了。


且慢。


知乎上有位叫Trisimo的网友做了一组非对比测试,找来了谷歌的Nano Banana Pro 跟即梦4.5 对比了一下,结果发现,事情没那么简单。


这就类似于一个是美术学院的高材生,一个是4A公司的创意总监。


在“画一张好看的图”这件事上,即梦4.5做得很漂亮,但一旦涉及到图像编辑,就似乎没那么优势明显了。


比如在设计“二次元长腿 Waifu 绿茶饮料”时,nano banana Pro 画出来的 Waifu 娘不仅细节拉满,画面和谐,光看图就想买一瓶尝尝味儿。

但豆包就不太行了,纯粹的脑子烧糊了乱画👇。

谷歌的Nano Banana Pro虽然画工可能没那么惊艳,但显然脑子转得更快。


在同样的绿茶包装任务里,它不仅识别出了中国元素,还在服装设计上融入了更多巧思,甚至把瓶身上的“低糖”卖点都准确保留了下来。


更绝的是在一个“漫画改Cosplay”的测试里。

Seedream 4.5看到提示词,直接把角色搞成了一个“精致的”3D高模——虽然好看,但它没理解“Cosplay”是指“真人扮演”。

而谷歌的Nano Banana Pro一眼看穿本质,生成的是真人穿着Cos服的照片,甚至懂怎么把人物自然地融合进现实场景里。


小小总结一下

其实这就是两者的根本上区别。


即梦4.5 继承了字节系产品一贯的强项:懂用户喜欢看什么,懂流量密码,懂怎么把画面做得吸睛。


对于需要快速出图、做自媒体封面、搞电商海报,需要那种特别吸睛的美女图的人来说,它是神器,母庸置疑,好用。


而谷歌的Nano Banana Pro,骨子里流淌着搜索巨头的血液。


它更擅长“语义理解”和“逻辑编辑”。


它不光是在画画,更是在思考你这句话背后的逻辑。它知道Cosplay是真人,知道绿茶包装需要卖点,知道康师傅牛肉面得有“唐人街风格”才对味儿。


这场仗打到现在,其实没有谁把谁按在地上摩擦。


如果你是颜值党,需要高质量素材,即梦4.5 绝对首选;如果你是设计师,需要AI帮你理解抽象逻辑,那谷歌可能更“聪明”一点。


不过,就像知乎答主担心的那样,如果全网都用即梦,那种标志性的“即梦脸”会不会像当年的“网红脸”一样,看多了让人审美疲劳?


这就留给时间去验证了。


反正对于我们用户来说,手里多几个好用的工具,总归是好事。


我是 CyberImmortal,关注我们,带你畅游AI世界!

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com