2025-07-11
图像定制大一统?字节提出DreamO,支持人物生成、 ID保持、虚拟试穿、风格迁移等任务,有效解决多泛化性冲突。
2025-07-11
ZejunCao
CVPR 2025 | 字节提出个性化多人图像生成新方法ID-Patch,可生成多人合影、姿势可控。
2025-07-11
ZejunCao
手机上实时跑3D数字人?阿里开源MNN-TaoAvatar,打造本地离线智能数字人新标杆。
2025-07-11
ZejunCao
达摩院提出ReSpace!自回归文本驱动3D室内场景合成与编辑新框架!
2025-07-10
ZejunCao
TMM 2025 | 超越SOTA!AdaMesh用10秒视频生成个性化语音动画,表情生动性提升40%。
2025-07-10
ZejunCao
字节推出统一多模态模型 BAGEL,GPT-4o 级的图像生成能力直接开源了!
2025-07-10
ZejunCao
阿里开源 30 亿参数统一模型 Ovis-U1,多模式理解、文生图、图像编辑样样精通,多项学术基准测试领先。
2025-07-10
ZejunCao
OmniGen2:支持视觉理解、文生图、图像编辑等任务,探索高级多模态生成!
2025-07-08
ZejunCao
DreamActor-H1,让产品与模特“一键生成”高保真交互视频。
2025-07-08
ZejunCao
高质量开源二次元风格图像生成模型Neta Lumina,从Furry到国风,全方位赋能动漫创作新体验!
2025-07-08
ZejunCao
OmniAvatar:让静态照片“活”过来,音频驱动全身动态视频生成新纪元!
2025-07-08
ZejunCao
重磅!黑森林实验室开放 FLUX.1 Kontext [dev]权重,120 亿参数黑科技,重塑图像编辑格局!
2025-07-07
ZejunCao
清华大学&IDEA推出GUAVA:单幅图像生成实时可动画3D上半身,渲染速度突破0.1秒,表情与动作实时同步。
2025-07-06
ZejunCao
多领域SOTA诞生!Vid2World:打通视频扩散到世界模型的“任督二脉”|清华、重大
2025-07-06
ZejunCao
ICIR2025 | CubeDiff:无需考虑失真,重新利用基于扩散的图像模型来生成360°全景图
2025-07-06
ZejunCao
集成 R1 后的 GroundingDINO 究竟强在哪?一文带你看清 DINO-R1 的性能变革
2025-07-05
ZejunCao
ICLR 2025 | 解锁虚拟试衣新姿势!智象未来提出SPM-Diff,大幅提升真实性、可控性,让衣服“贴身”又自然!
2025-07-05
ZejunCao
多模态图像生成新宠 Janus-4o?ShareGPT-4o-Image 打造数据集新标杆,将图像生成与 GPT-4o 对齐。
2025-07-05
ZejunCao
从文本到3D动画:AnimaX 前馈 3D 动画框架,解锁任意骨骼动画无限可能。
2025-07-04
ZejunCao
南洋理工力作Sparc3D:开启三维重建可微分优化与高效生成新纪元。
2025-07-03
ZejunCao
SyncTalk++:高斯泼溅技术赋能,101帧/秒实时渲染逼真说话人头像
2025-07-02
ZejunCao
海报设计师福音!微软联合清北提出Glyph-ByT5-v2,支持10国语言图文海报生成,效果惊艳!
2025-07-01
ZejunCao
一键生成高质量美学海报!港科大&美团提出PosterCraft,文字渲染与艺术融合,从创意到成品只需一步!
2025-07-01
ZejunCao