大模型让P图师也失业了 留给人类的职业真不多了

几天不见,大模型又有新玩法了。世超最近发现了两个在 P 图界超强的文生图模型:FLUX 和即梦 3.0。

它们各有各的优势,FLUX 在生成一致性方面没有敌手,而即梦在中文修图方面理解更佳。

 这么说吧,如果上一次 4o 的出现让设计师失业,这回它们就要让 P 图师失业了。

下面世超就带大家伙儿看看,这两个模型具体有啥区别,方便差友后续挑选使用。

咱先说说啥叫生成的一致性?简单来讲,就是你给模型一张图和提示词,让它改东,它就不能改西。改的风格还得和原图一样,不能带 AI 味。

比如这会儿世超想魔改一下公司的灯牌,把 “差评” 改成 “X.PIN”。我们分别用 FLUX、GPT-4o 和即梦对灯牌进行修改,它们给出的结果是这样的:

1 原图,2 FLUX,3 GPT-4o,4 即梦

GPT-4o 改的这张图吧,单独看只是有点平面,但和其它模型放一起对比就很惨烈了。很明显,对于灯牌的颜色、支架、墙面材质和窗户的样式,4o 有它自己的主见。

即梦夹在中间,属于单看不错,和 FLUX 相比还有差距的程度。窗户稍微魔改了一点,外墙材质也变光滑了。

 只有 FLUX,不该动的一笔没动,该细节的地方,连灯牌支架在 X 的哪个位置都安排的明明白白,前后一致性、对物理世界的理解都强的可怕。

而且 FLUX 可能因为用户不多,速度超快。基本半分钟使命必达,体验极佳。

FLUX 生成过程

既然 FLUX 改图这么好用,我有一个大胆的想法。。。

我宣布,秦始皇来了,这也是原图。

出去旅游总是人山人海景色不好?不如来试试真 · 一键消除功能。

虽然人在的时候都没看见这样的景,至少回家以后能拥有一张发朋友圈的好片。

 “我要让所有人知道,今天的长城,被我承包了。”

有一说一,下面这两张图,放在找茬游戏里也只能有一处不同。

世超把整的活儿发到群里,立刻向大家伙儿成功安利了 FLUX。于是有了下面的群友返图:

上面是原图,下面是 FLUX(手动狗头)

本着财不外露的原则,很少有差友知道我们的真正实力。没错,这就是差评在海外的。。。

 其实在进行图片编辑时,世超测试过的绝大部分模型,都对提示词存在理解偏差,能按照指示把分内事做好就不错了,对不该改的地方瞎发挥一通那是很常见的。

而 FLUX 就是能根据提示词精准定位到需要修改的位置,其它地方一点不动,非常神奇。

看眼睛,有彩蛋。

但是别看 FLUX 一致性做得好,一到需要中文创作的环境,它直接原地宕机。

让 FLUX 把 “差评” 改成 “好评”

所以做中文修图,魔改设计的活儿,还是得即梦来。

比如世超想做个表情包,这要求大模型不但要对图片内容理解到位,还要懂中文语境,才可能 P 对 P 好。

 不知道最近某位蔡姓顶流的新歌各位差友听没听,为表这么多年做小黑子的歉意,世超直接掏出编辑部特供表情包,原地爆改坤坤粉丝包。

左上原图,右上即梦,下 FLUX

可以看到,即梦不仅编辑前后字体保持一致,还在背景上补充了很多小星星和小心心。放到别的场景下这属于一致性缺点,但在这里,世超觉得即梦改得很有情绪。

反观 FLUX,在中文理解上做的简直是一坨,原图裁一下就返回来了,一点没动。

 另外,有的老差友可能知道,差评最近迎来十周年啦。世超立刻用即梦生成了一组十周年表情包,平均每张图耗时一分钟,再也不用先抠后 P 了。

而在这种创造性的活儿上,肯定少不了一些艺术加工,这时候一致性就没那么重要了。前后图片不一样没关系,如果猫猫眼睛变圆变亮可以更好地传递情绪的话,这属于优点。

再看看下面这一组 slogan 设计,不得不说,即梦 AI 的审美实属超前。

总的来讲,在修图方面,这些大模型确实干得又快又好。不过好工具得用在对的场景,才能发挥出最强实力。

 在这里世超建议大家,P 图拯救旅游废片找 FLUX,中文表情包制作和字体修改设计找即梦。

比较过 FLUX 和即梦,世超觉得现阶段的文生图还是不能既要又要。FLUX 和即梦在一致性和创造力之间,很难兼得。和语言大模型类似,来点幻觉才有创造力,发挥却会变得不稳定。

目前,Black Forest Labs 开源了一部分 FLUX.1 版本,但最新最好用的 FLUX.1 Context [pro] 还是收费的,即梦则是闭源。

 好消息是,现在 FLUX 官网新用户注册就送 200 积分。每生成或者编辑一张图片消耗 4 点积分,填充或者扩展图片一张消耗 5 点,200 分还是够咱玩一阵的。

即梦每天都送 60 积分,每次生成图片消耗 1 积分,编辑图片 2 积分。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

相关文章