重磅!黑森林实验室开放 FLUX.1 Kontext [dev]权重,120 亿参数黑科技,重塑图像编辑格局!
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
迄今为止,所有功能强大的生成式图像编辑模型都只能作为专有工具使用。如今,黑森林实验室发布了FLUX. 1Kontext[ dev],这是FLUX. 1Kontext[ pro]的开发者版本,它在一个120亿参数的模型中提供专有级别的图像编辑性能,并且可在消费级硬件上运行。
根据编辑指令更改现有图像。
具有特征、风格和对象参考,无需任何微调。
强大的一致性允许用户通过多次连续编辑来优化图像,同时最大程度地减少视觉漂移。
采用指导蒸馏进行训练,FLUX. 1Kontext[ dev]效率更高。
开放权重以推动新科学研究,并授权开发创新工作流。
生成的输出可用于个人、科学和商业目的,如FLUX. 1[ dev]非商业许可证中所述。
FLUX. 1Kontext[ dev]专注于编辑任务。该模型支持迭代编辑,擅长在各种场景和环境中保留角色,并支持精确的局部和全局编辑。
为了验证FLUX. 1Kontext[ dev]的性能,在多个图像编辑基准测试中进行了广泛的评估。
实验室与NVIDIA合作,专为新的NVIDIABlackwell架构设计了优化的TensorRT权重,这大大提高了推理速度并降低了内存使用量,同时保持了高质量的图像编辑性能。
除了原有的FLUX. 1Kontext[ dev]权重外,还在HuggingFace代码库中提供了BF16、FP8和FP4TensorRT变体,让开发者能够根据自己的用例灵活地平衡速度、效率和质量。
论文:https ://arxiv. org/pdf/2506. 15742
主页:https ://bfl. ai/announcements/flux-1-kontext-dev
模型:https ://huggingface. co/black-forest-labs/FLUX. 1-Kontext-dev
ComfyUI:https ://github. com/comfyanonymous/ComfyUI
代码:https ://github. com/black-forest-labs/flux
API文档:https ://docs. bfl.ai/quick_start/introduction
自助服务门户:http ://bfl. ai/pricing/licensing
帮助台:https ://help. bfl.ai
论文展示了FLUX. 1Kontext的评估结果,这是一个统一图像生成和编辑的生成流匹配模型。该模型通过整合文本和图像输入的语义上下文,生成新颖的输出视图。FLUX. 1Kontext采用简单的序列连接方法,在一个统一的架构中同时处理局部编辑和生成上下文任务。与当前在多轮编辑过程中字符一致性和稳定性下降的编辑模型相比,论文观察到FLUX. 1Kontext改进了对象和字符的保存,从而提高了迭代工作流的鲁棒性。该模型的性能与当前最先进的系统相当,同时生成时间显著缩短,支持交互式应用程序和快速原型设计工作流。
为了验证这些改进,论文引入了KontextBench,这是一个全面的基准测试,包含1026个图像-提示对,涵盖五个任务类别:局部编辑、全局编辑、字符引用、样式引用和文本编辑。详细评估表明,FLUX. 1Kontext在单轮质量和多轮一致性方面均表现出色,为统一图像处理模型树立了新的标准
FLUX. 1Kontext是一个流匹配模型,它将上下文图像生成和编辑功能整合到一个框架中。通过简单的序列连接和训练方案,FLUX. 1Kontext实现了最佳性能,同时解决了一些关键限制,例如多轮编辑过程中的字符漂移、推理速度慢和输出质量低。
感谢你看到这里,也欢迎点击关注下方公众号并添加公众号小助手加入官方读者交流群,一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、StableDiffusion、Sora等相关技术,欢迎一起交流学习💗~