仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
前几天,谷歌在I/O2025大会上正式发布了其最新一代AI视频生成模型Veo3,在生成高质量视频的同时首次实现了音画同步。对于Veo3的震撼效果,有人高度评价称,「它会是不亚于OpenAISora的跨时代产品」,标志着AI视频进入到了真正的「有声时代」。
从中可以发现,虽然当前AI社区已有的大模型已经足够惊艳,但得益于架构的创新、算力集群的投入,仍然会「卷」出一些新东西来。比如视频生成领域,从最初的无声进化到如今的有声,提升明显;再比如多模态领域,逐渐朝着理解与生成大一统的方向演进。
因此,为让从业者全面了解AI社区涌现的最新创新成果和发展趋势,机器之心计划6月8日在北京举办「CVPR2025论文分享会」,围绕着多模态、视频生成等热门主题邀请顶级专家、论文作者与现场参会观众共同交流。
作为计算机视觉领域中最重要的国际会议之一,CVPR具有极高的含金量,每年都会吸引大量研究机构和高校参会。今年,CVPR2025共收到13008份论文投稿,最终接收2878篇论文,整体接收率为22. 1%。
作为一场为国内AI人才打造的盛会,本次论文分享会设置了Keynote、论文分享、圆桌对话、Poster交流及企业展位交流等丰富环节。今天,论文分享会的全日程、Keynote分享嘉宾、演讲主题以及圆桌嘉宾正式公布,感兴趣的读者可以继续扫描文中二维码报名,截止日期到6月7日12:00。
Keynote嘉宾及演讲主题
【上午Keynote】高林基于混合表达与生成模型的可视媒体合成与编辑方法
分享人介绍:高林,中国科学院计算技术研究所研究员、中国科学院大学岗位教授。研究方向为计算机图形学、三维计算机视觉。在SIGGRAPH、TPAMI、TVCG等期刊会议发表论文100余篇。现任或者曾任亚洲图形学学会秘书长,作为项目负责人承担国家重点研发计划、基金委优青等项目,曾获得亚洲图形学会青年学者奖等奖励。
分享摘要:在本次报告中,我们将分析最近几何表征发展的特点,分析内在的规律,介绍几何表征的挑战和相关应用。介绍高斯泼溅的最新进展,包括如何对高斯泼溅进行大尺度变形、解耦和重光照,以及如何对基于高斯泼溅表征的数字人进行实时重光照。同时,生成模型不仅在影响三维重建的方法,还给渲染带来了新的求解思路。其中,视频生成模型给生成式渲染带来了全新的思路。我们将介绍基于生成模型的视频编辑与合成方法,将介绍基于线稿交互的视频编辑方法,和基于点云几何先验的大视角视频编辑与合成方法。
【下午Keynote】黄雷从表征和学习视角议多模态大模型的统一之路
分享人介绍:黄雷,北京航空航天大学人工智能学院副教授。本科和博士均毕业于北京航空航天大学,曾在美国密歇根大学访学和阿联酋IIAI工作。研究主要集中在深度神经网络架构、训练技术及理论分析,出版首部关于DNNs中Normalization技术的英文专著,主导训练发布TinyLLaVA系列模型及TinyLLaVAFactory开源项目,曾以一作兼通讯作者身份获CVPR2020最佳论文提名奖。
分享摘要:大语言模型以离散化词汇表示和上下文建模学习统一了各类自然语言理解和生成任务。过去几年,这类统一建模思想也蔓延至视觉、语音以及其它非结构化类数据,促进了「统一」的多模态大模型发展。本报告首先从表征和学习视角,以抽象的形式探讨了条件概率模型在建模任意问题的可行性,然后以统一建模为指导思想,概述了近年来语言和多模态建模的主要发展路线,最后介绍了报告人课题组在针对该议题研究中一些基础问题的研究进展和相关展望。
圆桌讨论嘉宾
这场分享会中,我们特别设置了一场「迈向理解与生成统一的多模态大模型」主题圆桌,邀请了三位专家学者现场探讨。
主持人:张群英ICT产业观察家,黄大年茶思屋科技网站总编
对话嘉宾:
黄雷,北京航空航天大学人工智能学院副教授。本科和博士均毕业于北京航空航天大学,曾在美国密歇根大学访学和阿联酋IIAI工作。研究主要集中在深度神经网络架构、训练技术及理论分析,出版首部关于DNNs中Normalization技术的英文专著,主导训练发布TinyLLaVA系列模型及TinyLLaVAFactory开源项目,曾以一作兼通讯作者身份获CVPR2020最佳论文提名奖。
黄思远,北京通用人工智能研究院(BIGAI)研究科学家、通用视觉实验室主任。他在加州大学洛杉矶分校(UCLA)统计系获得博士学位,导师是朱松纯教授。他的研究旨在构建一个能够理解和与三维环境交互的类人通用智能体。为实现这一目标,他在以下方向做出了研究贡献:(1)开发可泛化的视觉表征以用于三维重建和语义落地,(2)建模并模仿人类与三维世界的复杂交互,(3)构建擅长与三维世界和人类交互的具身智能体。他的研究发表于五十余篇会议及期刊论文,并曾获得ICMLNeural-SymbolicWorkshop最佳论文,UCLA优秀博士论文等奖项。他致力于开发能理解三维物理世界的具身智能体和视觉机器人。
Poster
在本次论文分享会中,将会有一批论文作者进行论文分享与Poster展示,感兴趣的读者可以通过下图了解具体信息:
此次论文分享会也将在机器之心视频号以及黄大年茶思屋科技网站两个平台进行直播,欢迎大家关注、预约。
合作伙伴介绍
黄大年茶思屋科技网站
黄大年茶思屋科技网站是致力于推动科学与技术交流的开放平台。我们汇聚全球科学家、研究人员和技术专家,共同探讨最前沿的学术话题,分享最新的科研成果,激发创新思维的火花。在这里,您可以看到学术热点、精选论文、学术峰会、技术难题、专利、开源和科技赛事等内容。茶思屋科技网站,汇聚全球科研智慧,推动科技创新,让科技百花园更加繁荣。
网址:https ://www. chaspark.com
腾讯青云计划
腾讯青云计划聚焦AI大模型等十大技术领域,面向全球招募顶尖实习生和毕业生,提供上不封顶的职级薪酬、全面定制化的培养方案,并开放核心业务工作机会、解锁前瞻性技术课题培养中国未来的科技人才。
今年腾讯将继续深度参与多场全球顶级学术会议,并组织群星未来之夜系列活动。关注「腾讯招聘」公众号了解相关报名信息。
加入青云计划,不负少年意气!
青云官网:https ://join. qq.com/qingyun. html
京东TGT计划
TGT(TechGeniusTeam)是由京东发起的「顶尖青年技术天才计划」,面向全球高校本硕博在校生、应届生及毕业两年内的技术人才开放招募。
TGT计划聚焦技术突破和有社会价值的前沿课题,依托京东在零售、物流、科技、健康、工业、产发等领域丰富的产业布局,研究涵盖包括多模态大模型与应用、机器学习、搜索推荐广告、空间与具身智能、高性能与云计算、大数据、AIInfra、安全等方向。
除了不设上限的薪资以外,京东还将提供完备的福利体系、充足的算力资源保障、「技术导师+业务导师+成长导师」三导师的培养机制,保障TGT能够心无旁骛投身技术突破并迅速成长为领军人物。
TGT网址:https ://campus. jd.com/home#/talentProject?tabKey=3
联系我们
机器之心联合多个合作伙伴,成功举办云帆・ICLR2025AITalentMeetup、CVPR2024论文分享会、NeurIPS2024论文分享会、ACL2024AITalent晚宴等多场活动,助力合作伙伴吸纳人才,提升品牌影响力。
如您/您所在的企业对参与「机器之心2025学术顶会活动」感兴趣,欢迎参与合作及共建,具体合作方式欢迎联系:
陈女士
18206218056
chenyinyi@jiqizhixin. com