刚发布就刷屏!FLUX.1 Kontext 成最强AI修图神器,角色一致性超高!


刚发布就刷屏!FLUX.1 Kontext 成最强AI修图神器,角色一致性超高!

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

⭐关注硬核AIGC丨打破AI信息差⭐
公众号后台回复“666”送你一份AI大礼包
AI图像圈来了个实力派选手。
黑森林工作室发布最新AI图像模型:FLUX. 1Kontext,直接对标ChatGPT-4o的图像能力。
一句话就能让AI自动修图,指哪修哪精准定位,角色/主体一致性超高,生成效果和生成速度,明显要优于现有的AI图像工具。
官方介绍与我的个人感受:
1. 统一的编辑与生成能力:FLUX. 1Kontext使用单一模型即可完成多种任务。包括在保留背景的情况下修改物体(局部编辑),以及根据一张参考图将角色置于全新场景中(上下文生成)。
2. 出色的角色一致性:能在连续、多轮的编辑中保持人物或物体外观的高度一致性。这对于创作故事板、系列图片或任何需要角色连贯性的应用来说,可以说是重大利好了。根据评估数据以及我的实际测试,在人物、物体相似度保持方面,它的表现对比其他工具确实很不错。
3. 交互级的生成速度:FLUX. 1Kontext的速度非常快,生成一张1024x1024分辨率的图片仅需3-5秒。我这次使用的AppleM4Max的MacStudio,测试每张图出图速度平均在10秒左右。
4. 支持迭代式工作流:用户可以通过连续的指令对一张图片进行多次“微调”,而不会出现明显的质量下降或视觉漂移,从而实现更精细的创意控制。但迭代多了细节上还是有伪影,和图像质量和细节的损失。
总的来说,它现在可以直接修改主体和细节,可以将图片变成其他风格,可以将这种风格作为参考应用在生图中,可以替换背景不改变主体,可以修改文本内容但是保持文字风格一致(目前只支持英文),可以将前面我列举的功能结合起来使用。并且它能保持很好的一致性和很强的风格迁移能力。
我们可以在这里免费体验(外国网站),有赠送200积分:
https ://playground. bfl.ai/image/edit
接下来,我们通过一些经常遇到的修图场景,来测试它的性能,看看到底有没有大家说的那么神。
官方提示建议:将[ 物体]改变为[ 新状态],保持[ 保留内容]不变
改变汽车的颜色,人物主体还还是不错的,不过直接把虚化模糊的车都变清晰了怎么回事:
📝
Characterremainunchanged,thecarsinthebackgroundremainunchanged,changethecar‘scolortored.
角色保持不变,背景中的汽车保持不变,将汽车的颜色改为红色。
这里我修改了人物手中的物体和文字部分,可以看到首先一致性保持得不错,然后字体也是完全还原了原始字体,可惜目前不支持汉语。
📝

将左侧主角手中的牙刷替换为麦克风,让角色看起来像在唱歌。将文字内容改为\“唱歌,更大声,更多噪音。\“
这里我将一个卡通盲盒IP的角度让它进行修改,注意看整体的细节,无论是面部、珍珠数量细节,海底背景,泡泡,甚至左上角的AI标志都很好地保持了原样没有改变。最后更换发色也非常和谐,除了发色其他地方基本没有改变。
📝
1. 原图
2. Keepthebackgroundunchanged,thecharacterissidewaysfacingtheaudience. 保持背景不变,角色侧向观众
3. Maintainthebackgroundasis;thecharacterisfacingawayfromtheaudience.
保持背景不变;角色背对观众。
4. Maintainthebackgroundasis;Themermaid’shairchangestored.
保持背景不变;美人鱼的头发变成红色。
一致性保持得好可以做的就比较多了,比如帮你去掉不喜欢的同事:
📝

如果你不喜欢人,可以帮你全都去掉(假期游客照有救了),再替换个热情似火的背景。
📝
Removeallpasserbyfromthebackground,changethebackgroundtoavolcaniccrater.
从背景中移除所有路人,将背景更改为火山口。
官方提示建议:转换为[ 特定风格],同时保持[构图/角色/其他]不变
首先试一下将一张图片迁移为其他风格。在这方面我个人认为细节上还是稍稍不如4o的,但是也还不错。
📝

或者我给一张指定风格的照片,Kontext参考风格,迁移风格,生成其他场景。一致性细节真的很好,比如我第一张图肩膀上有奇怪的肩带,这个人物身上的带子在延展其他图片的时候依然存在哈哈哈:
📝
1. 原图
2. 保持原始画面风格,清晨的江南小巷,刚被雨水冲刷过。一个纸鸢缠绕在电线杆上,屋檐下挂着一个竹篮,巷尾的茶馆刚刚开门,温暖的灯光从里面洒出。
3. 保持原始画面风格,一位穿着深绿色旗袍的女子撑着伞走进雨中的小巷,脸上带着淡淡的思索表情。她穿过灰砖和瓦屋顶,雨滴轻轻地拍打着她的伞,路旁的灯笼随风轻轻摇曳。
4. 保持原始画面风格,镜头拉近到屋檐的一角,那里有一只小鸟,给小鸟一个特写镜头。
5. 保持原始画面风格,她经过一家裁缝店,橱窗里挂着未完成的布料。一只猫在门旁的踏板上打盹,而店内,一位老人专注地缝制着,每一针都一丝不苟。
6. 保持原始画面风格,镜头拉近,给左下角睡着的猫一个特写镜头。【镜头拉近这个效果很好用,后续可以在首尾帧或者连续镜头中使用。】
7. 保持原始画面风格,她在老街尽头的一家邮局前停下,从包里取出一封旧信。背景是潮湿的格子窗和一个斑驳的门牌;信封的边缘有些破损。
8. 保持原始画面不变,环境变成夜晚。
或者为角色图延展相同风格的环境图(下方上面这张是Midjourneyy生成的,我个人感觉美学和质感上Kontext比起来还是稍微有一些差距的):
📝

使用这种风格,描绘海底发光的草地,充满柔软的海葵和梦幻般的气泡,通过螺旋光线上升。地面点缀着古老的石环和光滑的白色鹅卵石,微弱地闪烁着色彩。在背景中,一群银鱼游过时形成完美的螺旋,留下闪闪发光的粒子轨迹。
官方提示建议:将背景改为[ 新背景],保持主题在完全相同的位置和姿态
原本只想做背景替换,但是感觉有点无趣,就把人物一致性一起放里面测试了,每次可以改动,但是不能改动太多,调整次数也不能太多,到后面面部整体细节会有影响。
📝
1. 原图

5.(参考图4)Thecharactersettingandbackgroundremainunchanged,ThepersonHoldingabottleofcolauptothecamera.

(这段内容太多了就不翻译了,大家需要可以自行翻译)
📝
1. 原图

角色保持相同的面部特征和发型,带着陷入恋爱中的甜蜜微笑。(这里直接给我加了个女孩哈哈哈)
3.(参考图1)ThebackgroundchangestoaTokyonightscene,andthecharacteriswearingawhiteT-shirt.
背景改为东京夜景,角色穿着白色T恤。
4.(参考图5)Thecharacterhasacleanfaceandlaughsoutloudatthecamera.
角色面部干净,对着镜头大笑。
5.(参考图6)Maintainthebackgroundunchanged,thecharacterturnsaround,leavingabackview.
保持背景不变,角色转身,留下背影。

保持背景不变,角色骑着摩托车,戴着一顶带有可爱胡萝卜贴纸的粉色摩托车头盔。
再比如大家比较熟悉的老演员毛毛小狗的快乐一天,这次色调和材质都对上了,也没有发黄(没错,我在阴阳4o):
📝
1. 原图
2.(参考图1)Keepthebackgroundunchanged,thecharacterisfacingawayfromthecamera. 保持背景不变,角色背对镜头。

官方提示建议:将’[原文]’替换为’[新文]’,保持相同的字体样式
保持相同字体样式它是做得很好的,但是考虑它只能延伸英语的,这里就不做过多展开了,大家可以看看效果,字体样式确实保持得很好。
📝
Replace\“fief\“with\“Irene.\“Keepthesamefontstyle.
将\“fief\“替换为\“Irene.\“保持相同的字体样式
📝
Keepthefontstyleunchanged,replace\“RedefineYourWeekend\“with\“ProcrastinateProfessionally\“;

然后还想补充一点例如产品和IP方面的。比如,假设我有个可乐素材(仅供学习交流,内容与品牌无关)可以做一些背景和文字的改变。但是目前似乎做不了风格过于明显和突出的,如果这样做就会被频繁报错,说改动幅度太大:
📝
1. 原图

1950年代的美式复古餐厅场景,黑白格子地板砖,闪亮的红色皮革卡座,背景中有一个发光的霓虹灯牌写着\“ColdDrinks\“。阳光透过大玻璃窗洒进来,在放置于光亮镀铬柜台上的玻璃可口可乐瓶上形成反射。这瓶未开封的瓶子表面布满凝结的水珠,旁边放着一个开瓶器和一张红白相间的餐巾纸。温暖的环境光线营造出怀旧而诱人的氛围。

保持饮料瓶不变。瓶子立在龟裂的土地上,而浮空岛屿在上方的天空中缓缓漂移。
4. Thesubjectremainsunchanged,thetextstyleremainsunchanged,andthetextismodifiedto\“CoolIrene\“.
主体保持不变,文字样式保持不变,文字修改为\“CoolIrene\“.
或者当我有一张人物着装照片,可以直接让Kontext提取出服装为平铺效果,也可以在平铺效果的基础上再将镜头拉更近体现织物细节。
📝
1. 原图

3.(参考图2)showmeanextremecloseupofthefabric给我展示布料的极近特写
IP方面,可以让它直接输出三视图(这里的三视图是一次性成功的):
📝
1. 原图

3. Outputfrontview,sideview,rearview. 输出正视图、侧视图、后视图。这里输出图的比例为设置为了4:1,设置3:1也可以,但是也不会是非常规矩的三个正方形,比较随机。
目前比较难直接多图参考,但是有个妙计,先把需要的多图拼起来。谢谢@AI炼丹师忠忠教我的技巧哈哈。
比如下面图一是原图(两张图的拼图),图二是输出图。但是这招目前出现问题的几率比较大。
📝

保持上图的场景不变,让下图的人物出现在上图的场景中。
链接(有200积分免费额度可体验):https ://playground. bfl.ai/image/edit
生成功能:这个和一般工具的生成功能基本是一样的。这里不展开讲了。
编辑功能:
BatchSize批处理大小
值:1-4张数值越大,一次输出的图越多。节约积分建议可以为1-2。
SafetyTolerance安全容错
值:0-6含义:模型的安全策略容忍度,通常控制对不当内容的敏感程度,数值越大生成内容范围越广,数值更小可防止生成NSFW或冒犯性图像。
PromptUpsampling提示上采样
含义:指增强关键词影响力或提升对prompt的理解分辨率。开启后可能会使提示词中的主元素更突出,但也可能导致图像构图过度集中。
OutputFormat输出格式
输出格式:PNG/JPEG
点击小箭头图标发送,稍等一会儿就可以看到输出的图片:
可以看到皮肤细节和整体色调稍微有所改变(可能是为了适应环境),但是人物整体和面部细节保持得非常好,和环境融合也很自然。
填充功能:
选择要填充的位置,然后在下方描述填充位置的元素:
扩图功能:
比如上传一张图,调整这张图的大小,然后在下方可以加入对扩展部分的描述。
📝
关于FLUX. 1Kontext的pro与max版本怎么选:
FLUX. 1Kontext[ pro]:速度更快,质量细节略逊于max版,单张0. 04美金(ComfyUI客户端价格),性价比更高。
FLUX. 1Kontext[ max]:耗时更长,图片质量更好,图像保真度和细节表现力更优秀,单张0. 08美金(ComfyUI客户端价格)。
总的来说,目前存在的问题与不足如下,在黑森林实验室的论文中也提到了目前模型的局限性:
1. 多轮编辑后质量退化。在进行过多的、连续的多轮编辑后,模型生成的图像可能会出现视觉瑕疵或伪影,导致图像质量下降。
2. 指令遵循的准确性。少数情况下,模型可能无法完全准确地遵循用户的指令,有时会忽略或误解提示中的特定要求。
3. 世界知识有限。模型的“世界知识”仍然有限,这可能会影响它生成特定上下文或事实性内容时的准确性。
4. 蒸馏过程引入的瑕疵:模型训练中采用的蒸馏技术(distillationprocess)本身也可能引入一些视觉上的瑕疵,从而影响输出图像的最终保真度。
建议:如果要你的目的是既要改变场景又要改变角色动作,可以先跑一次换一个部分,然后再换另一部分,比如先换场景再换动作。另外,提示词不要太长,修改的地方多了就容易报错。如果原图比较规规矩矩,就可能比较难做出视觉冲击比较大的修改。
下面是官方给出的提示词输出建议(这里翻译成中文版了):
###1. 基本修改-简洁直接:`\“将汽车颜色改为红色\“`-保持风格:`\“改为白天场景,同时保持画面的同一风格\“`###2. 风格迁移原则:-明确命名风格:`\“转换为包豪斯艺术风格\“`-描述特征:`\“转换为有可见笔触的油画,厚重的油漆质感\“`-保持构图:`\“改为包豪斯风格,同时保持原始构图不变\“`###3. 角色一致性框架:-具体描述:`\“短发黑发的女人\“`而不是\“她\“-保持特征:`\“同时保持相同的面部特征、发型和表情\“`-步骤修改:先改变背景,然后是动作###4. 文本编辑-使用引号:`\“将’快乐’替换为’BFL’\“`-保持格式:`\“替换文本,同时保持相同的字体样式\“`##常见问题解决方案###角色变化过大❌错误:`\“将人物变成维京人\“`✅正确:`\“改变服装为维京战士,同时保持面部特征不变\“`###构图位置变化❌错误:`\“把他放在海滩上\“`✅正确:`\“改变背景为海滩,同时保持人物在完全相同的位置、比例和姿态\“`###风格应用不准确❌错误:`\“使其成为素描\“`✅正确:`\“转换为铅笔素描,具有自然的石墨线条、交叉阴影和可见的纸张质感\“`##核心原则1.具体明确-使用精确的描述,避免模糊的术语2.逐步编辑-将复杂的修改分解成多个简单的步骤3.明确保留-说明应保持不变的内容4.动词选择-使用\“改变\“、\“替换\“而不是\“转换\“##最佳实践模板物体修改:`\“将[ 物体]改变为[ 新状态],保持[ 保留内容]不变\“`风格迁移:`\“转换为[ 特定风格],同时保持[构图/角色/其他]不变\“`背景替换:`\“将背景改为[ 新背景],保持主题在完全相同的位置和姿态\“`文本编辑:`\“将’[原文]’替换为’[新文]’,保持相同的字体样式\“`>记住:越具体越好。Kontext在理解详细指令和保持一致性方面表现卓越。
前面特别多记不住,那就记得三点:
📝
1. 提示词的核心:输入哪些不要变,哪些要变。
2. 一次变不了太多,每次改变一部分。
3. 提示词使用英语。
#FLUX#黑森林工作室#AI生图
-END-
以上是本期全部内容,欢迎点赞转发!
为了方便大家交流,我建了个粉丝群,欢迎对AI感兴趣的小伙伴,进群一起分享AI知识。
🔎扫码加我微信,邀请你进群👇
-更多精彩内容-
🔥更多热门AI教程&实用工具,点下方蓝字查看。
🚀AI数字人系列教程
免费克隆123数字人(极速版)
免费使用数百个AI数字人公模
如何本地部署HeyGem开源数字人
如何使用DUIX数字人实时交互平台
单张照片克隆数字人手持物品
如何使用数字人做橱窗带货
如何使用数字人制作英语教学视频
如何使用数字人做PPT讲解视频
盘点十大国产AI数字人平台
🌈好用的AI工具推荐
一个插件,免费使用GPT-4o
100个即梦AI生图提示词
30个好用的AI工具合集
10个好用免费的声音克隆工具
9款教师必备的AI工具(效率翻倍)
豆包AI云盘无限容量不限速完全免费
自媒体爆款选题批量采集神器
免费AI抠图工具,5秒去除照片背景
⭐强大的宝藏网站推荐
万能维修网站iFixit
全球实况摄像头监控网站Skyline
DeepSeek官方AI工具箱
10个国家级免费平台(建议收藏)
3个彻底消除AI信息差的门户网站
5个全网视频无水印下载网站
视频去字幕神器(手机小程序)
抖音视频高清无水印下载
-粉丝福利-
✅后台回复关键词,免费获取AI资料包:
回复“数字人”领全网最全的数字人克隆知识库
回复“工具箱”领飞书官方推荐的硬核AI工具箱
回复“提示词”领1000+AI生图提示词模版
回复“运营”领自媒体运营干货教程(新手必备)
回复“DS”领全套DeepSeek资料包(含PPT)
🚩关注我,了解更多AI知识👇
🧡记得点赞推荐分享👍


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录