阿里 Qwen3 模型更新，吉卜力风格get

发布日期: 2025-06-28

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

大家好，我是Ai学习的老章
冷知识：阿里单Qwen系列不同参数、不同格式、不同用途的开源模型已有321个
这还没有算上阿里其他团队放出的模型，比如之前我介绍过的超长上下文大模型QwenLong就是阿里通义智文开源的
刚刚，阿里新模型+1，这次是#QwenVLo
截止发文，QwenVLo并未开源，我理解它应该不是一个单独的模型，其对应的应该还是Qwen3-235B-A22B，但也未更新模型
QwenVLo以一种渐进式生成方式，从左到右、从上到下逐步清晰地构建整幅图片。在生成过程中，模型会对预测的内容不断调整和优化，从而确保最终结果更加和谐一致。这种生成机制不仅提升了视觉效果，还为用户带来了更灵活、更可控的创作体验。
直接访问：https ://chat. qwen.ai/
模型中选择第一个就行了
官方介绍的用法：
1、直接生成图像，并对其进行修改，例如替换背景、添加主体、进行风格迁移，甚至可以完成基于开放指令的大幅修改，包括检测和分割等视觉感知任务，比如将卡通变为写实、将形象变成气球
2、一次性完成多重任务，例如生成海报、组合物体
3、对已有信息的标注，比如检测、分割、边缘检测等
4、支持多张图像的输入理解和生成，不过这个还没有上线
5、支持文本到图像的直接生成，包括通用图像和中英文海报等
6、支持动态长宽比的图像生成，对于长宽比高达4:1，1:3等细长类型图像
7、对生成的内容进行再分析和理解，例如识别生成图片中的狗和猫的品种
这里就不多图杀猫了，大家可以去https ://qwenlm. github.io/zh/blog/qwen-vlo/查看
就像GPT-4o一样，大家可能最喜爱的还是风格转化吧？
比如我把Qwen-VLo的海报转成了吉卜力风格
效果还可以
当然了，它也很懂事儿，知道什么事儿不该做😂
我试了几次，感觉瑕疵也有
人物类型的图片，转换风格后图像N多细节会丢失
画面元素过多时，很多物体会扭曲变形
还有老生常谈的手指细节问题
总体感受：阿里，好样的！👍
官方博客也说了：
QwenVLo还属于预览阶段，有很多不足的地方，在生成的过程可能存在不符合事实、不完全和原图一致、指令不遵循、在识别生图和理解的意图不够稳定的问题，还请谅解。
制作不易，如果这篇文章觉得对你有用，可否点个关注。给我个三连击：点赞、转发和在看。若可以再给我加个🌟，谢谢你看我的文章，我们下篇再见！
搭建完美的写作环境：工具篇（12章）图解机器学习-中文版（72张PNG）ChatGPT、大模型系列研究报告（50个PDF）108页PDF小册子：搭建机器学习开发环境及Python基础116页PDF小册子：机器学习中的概率论、统计学、线性代数史上最全！371张速查表，涵盖AI、ChatGPT、Python、R、深度学习、机器学习等