仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。
在近期由a16z普通合伙人ErikTorenberg主持的一场访谈中,李飞飞和WorldLabs早期投资者MartinCasado围绕「世界模型」和「空间智能」的话题探讨了她对AI技术的理解,并在创业项目启动一年后重新介绍了WorldLabs的任务和愿景。
目录
01. 创业一年后,李飞飞如何阐述WorldLabs的愿景?
成立一年的WorldLabs发布过什么进展?WorldLabs的愿景有变化吗?空间智能终于有望解锁了?…
02. 为什么没有空间智能的AI是不完整的?
LLM更流行,但李飞飞为什么选空间智能?世界模型于空间智能如何弥补LLM的天然缺陷?…03. 空间智能如何解锁从「单一现实」到「多元宇宙」的未来?
「多元宇宙」的愿景具体指什么?为什么李飞飞没有更早重视3D表征?什么是技术的反直觉发展?…
04. 数据驱动并非易事,空间智能距离实现世界模型的愿景还有多远?
哪些前置技术的发展让世界模型迎来发展时机?李飞飞和Cadaso下一步要做什么?
01创业一年后,李飞飞如何阐述WorldLabs的愿景?
自2024年5月媒体报道创业计划,而后在9月官宣,李飞飞的初创公司WorldLabs快速完成了两轮融资,累计募资2. 3亿美元,估值突破10亿美元,成为AI领域备受瞩目的独角兽企业。在团队成立后,WorldLabs目前陆续发布了「世界生成」模型、Forge渲染器等工作。在最新的访谈中,李飞飞从不同的角度阐述了她对AI未来的看法。
1、李飞飞从强调空间智能和世界模型的重要性开始,完整阐述了WorldLabs的技术愿景、数据驱动AI的哲学、个人创业历程与投资人选择、空间智能的技术突破与应用场景、立体视觉缺失的个人经历以及未来多元宇宙的愿景。
2、李飞飞指出当前语言模型在描述和理解三维物理世界方面存在明显的局限性,空间智能则超越语言模型成为智能的关键组件,是世界模型理解、重建和生成物理世界的核心能力。
①语言虽然是思想和信息的强大编码,但对3D物理世界而言是「有损的编码方式」,无法有效描述和操作三维空间。而空间智能代表着更为古老和根本的智能形式,是AI的关键组成部分。
3、在这一认知框架下,WorldLabs试图构建能理解3D物理世界的AI系统,使人类能创造无限虚拟宇宙,进而应用于机器人、设计、社交等多个领域。
①2024年12月,该公司推出「世界生成」技术,仅需单张图片即可生成可交互的3D物理世界。[2-1]
②今年6月,WorldLabs开源了3D高斯泼溅渲染器Forge,支持Web端实时渲染AI生成的3D场景。[2-2]
4、根据李飞飞的描述,WorldLabs要解决的不是一个技术问题,而是智能的核心组件之一。其团队的进展和当前技术发展时机促使空间智能的技术突破正在成为可能。
①目前,LLM的成功为空间智能提供了方法论(如数据驱动、神经网络),但真正的突破需要跨学科整合(AI+计算机图形学等)。
②同时,随着算力、数据和工程能力的不断提升,集中攻关「世界模型」已经具备了现实的可能性。
02为什么没有空间智能的AI是不完整的?
该场谈话的主要议题之一是李飞飞对技术路线的选择。当前AI领域主要集中在大语言模型(LLM)上,但李飞飞选择了一条不同的道路,专注于让AI理解3D物理世界的运作方式…
关注👇🏻「机器之心PRO会员」,前往「收件箱」查看完整解读
更多往期专题解读内容,关注「机器之心PRO会员」服务号,点击菜单栏「收件箱」查看。