高质量开源二次元风格图像生成模型Neta Lumina,从Furry到国风,全方位赋能动漫创作新体验!


高质量开源二次元风格图像生成模型Neta Lumina,从Furry到国风,全方位赋能动漫创作新体验!

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

NetaLumina是由Neta. art实验室开发的高质量动漫风格图像生成模型。基于上海人工智能实验室Alpha-VLLM团队发布的开源Lumina-Image-2. 0,利用大量高质量动漫图像和多语言标签数据对该模型进行了微调。初步成果是一个引人注目的模型,它拥有强大的理解和解释能力(得益于Gemma文本编码器),非常适合插画、海报、故事板、角色设计等应用。
针对多样化创作场景进行优化,如Furry、国风、宠物等
支持众多角色与风格,包括热门和冷门设定
准确理解自然语言,具备优秀的复杂提示词遵循能力
原生支持多语言,推荐优先使用中文、英文和日文
基础模型(BaseModel)
数据集:约1300万张二次元风格图像
主要目标:通用知识学习、二次元风格优化
美学微调模型(AestheticModel)
基于基础模型进一步微调
数据集:精选数十万张高质量动漫风格图像
主要目标:提升美学表现、肢体结构精准度与画面细节
该模型采用基于DiffusionTransformer的Lumina2框架,与StableDiffusion模型不同,请务必按本文档进行配置。
环境要求(Environment)目前NetaLumina仅支持在ComfyUI平台使用:
安装最新版ComfyUI
至少8GB显存
NetaLumina-Beta

文件格式:.safetensor
存放路径:ComfyUI/models/unet/
文本编码器(Gemma-2B)

文件格式:.safetensors(约5. 23GB)
存放路径:ComfyUI/models/text_encoders/
VAE模型(16通道FLUXVAE)
下载链接:https ://huggingface. co/neta-art/Neta-Lumina/blob/main/VAE/ae. safetensors
文件格式:ae. safetensors(约300MB)
存放路径:ComfyUI/models/vae/
对应工作流:lumina_workflow. json(在ComfyUI中加载该JSON文件即可)

UNETLoader:加载模型文件
VAELoader:加载ae. safetensors
CLIPLoader:加载gemma_2_2b_fp16. safetensors
TextEncoder:输出分别连接采样器的正向/负向条件
采样器:res_multistep-调度器:linear_quadratic
采样步数:30
CFG(提示词引导强度):4~5. 5
EmptySD3LatentImage:推荐分辨率为1024×1024、768×1532或968×1322
全书深入剖析具体的案例,展示AIGC技术在不同工业领域中的实际应用。通过分析成功应用案例中的挑战和解决方案,提供实战经验,便于读者在实际工作中更好地应用AIGC技术。
感谢你看到这里,也欢迎点击关注下方公众号并添加公众号小助手加入官方读者交流群,一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、StableDiffusion、Sora等相关技术,欢迎一起交流学习💗~


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录