数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 1203|回复: 20

[科技] 12亿参数轻装上阵!FLUX开源神器5秒改图,显卡不炸也能玩转AI修图

[复制链接]
发表于 2025-6-30 11:35:09 | 显示全部楼层 |阅读模式
本帖最后由 Meise 于 2025-6-30 11:36 编辑

嘿,听说了没?那个搞图像的Black Forest Labs最近干了件大事!他们居然把看家模型​​FLUX.1 Kontext[dev]​​给开源了。别小看这玩意儿只有​​120亿参数​​(比动辄千亿的大模型苗条多了),但能耐可一点不含糊——电脑不用专业卡,普通显卡就能跑得动,重点是不用等半天,​​平均5秒搞定一张图​​!

具体能干啥?举个栗子:

想删掉照片里乱入的狗子?​​一句话指令秒消失​​
给仓鼠P个爱因斯坦同款爆炸头?​​鼠标一圈立马加上​​
网红咖啡店招牌字拼错了?​​敲行字替换就行​​
甚至能像玩游戏一样​​连环操作​​:先给小哥换身西装,再调个酒吧背景,最后打上光影,硬生生把路人甲变成夜店焦点!(当然最后效果你说了算)

关键这模型特懂用户需要什么:

​​精准到头发丝​​:指哪改哪,背景人物各修各的
​​认人认物超在行​​:同一角色反复出场,衣服换十套脸也不崩
​​不怕越改越歪​​:连续修图十几次,画风还能稳住不跑偏
​​NVIDIA用户狂喜​​:专门为新一代​​Blackwell显卡​​优化,速度飞起

模型刚放出来,网友就玩嗨了:
有给青蛙戴墨镜穿毛衣,cos旅行博主的(蛙:本打工蛙下班勿扰)
有复刻动漫名场面的,连头发丝分叉都还原
更神的是配合LoRA工具,直接搓出个​​AI证件照生成器​​!

现在去官网试玩区传张图,马上就能体验。国外论坛已经炸锅,都说这是​​图形界的DeepSeek​​(懂的都懂),开源社区总算有个能打的图像编辑模型了!

硬核真相(给技术控划重点):
底层用的还是FLUX那套​​整流流Transformer架构​​,简单说就是让AI学习图片"内在规律"。这次升级主要在三点:

图片拆解成密码似的​​视觉标记​​,方便定位修改区域
用上​​三维空间定位技术​​(3D RoPE),像GPS锁定像素位置
靠​​对抗蒸馏技术​​(LADD)压缩步骤,才实现5秒出图
官方拉了个1026张图的测试集(KontextBench),把友商虐了个遍:

字节跳动的Bagel:​​局域编辑输得明显​​
HiDream-E1:​​批量改图一致性被吊打​​
OpenAI家的GPT-image-1?​​在风格移植上照样被超车​​

成本真心感人:

云端平台Replicate跑一次​​不到0.007美元​​(每1美元能玩149次)
但苹果党注意:MacBook Pro上跑​​要等1分钟/次​​(建议蹭朋友显卡玩
附传送门:GitHub搜 ​​FLUX.1 Kontext[dev]​​,嫌麻烦的先去官网在线版练手~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-8-24 06:25 , Processed in 0.124800 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表