模型下载量 12 亿,核心团队却几近瓦解:算力分配不均、利润压垮创新?


模型下载量 12 亿,核心团队却几近瓦解:算力分配不均、利润压垮创新?

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

整理|冬梅
Meta重组AI团队

AI产品团队将专注于面向消费者的工作,例如Facebook、Instagram和WhatsApp中的AI功能,以及Meta的新独立AI应用程序。
AGIFoundations部门将专注于更多更宏观的技术,例如改进其Llama模型。
值得一提的是,该公司的人工智能研究部门,即FAIR(基础人工智能研究),仍然独立于新的组织结构,不过一个专门从事多媒体工作的团队正在转移到新的AGI基础团队。
言外之意是:虽然公司从其他部门调入了一些领导,但此次变动不会造成任何高管离职,也不会裁减任何职位。
此次重组AI团队,是因为Meta希望将一个大型组织拆分成更小的团队,以加快产品开发速度,并在增加更多技术领导者时为公司提供更大的灵活性。
Cox在备忘录中表示:“我们的新架构旨在赋予每个团队更多自主权,同时尽可能减少(但明确界定)跨团队的依赖性。”
随着OpenAI、谷歌和Anthropic等公司在AI领域壮举频频,Meta正竭尽全力与竞争对手保持同步。该公司最近推出了“LlamaforStartups”计划,鼓励早期公司使用其产品进行生成式人工智能应用。与此同时,Meta在4月份的LlamaCon活动上,也主要致力于展示其与OpenAI的竞争实力。
然而,随着Llama4发布后批评声此起彼伏,外界对开源人工智能领域的信心大幅下滑。
Meta似乎正逐渐沦为人们眼中的“昨日黄花”——这种看法并非没有缘由:曾被视为Meta人工智能开发的皇冠上的明珠FAIR如今已分崩离析,14位核心成员中有11位相继离职。
核心团队出走,
MetaAI沦为追赶者
2023年,Meta通过一篇具有里程碑意义的论文首次将Llama模型推向世界。
同年7月,Meta公司发布了人工智能模型LLaMA2的开源商用版本,意味着大模型应用进入了“免费时代”,初创公司也能够以低廉的价格来创建类似ChatGPT那样的聊天机器人。
在当时,Meta是开源AI大模型领域的开拓者和领跑者。
如今两年过去了,将Llama被推向世界的14位作者中,只有三位仍在Meta工作:研究科学家HugoTouvron、研究工程师XavierMartinet和技术项目负责人FaisalAzhar。其余11人都离开了公司,其中许多人加入了该公司或创立了其新兴竞争对手。
Meta的人才流失在Mistral身上表现得最为明显。Mistral是一家总部位于巴黎的初创公司,由前Meta研究员GuillaumeLample和TimothéeLacroix(Llama的两位核心架构师)共同创立。他们与几位Meta校友一起,构建了强大的开源模型,与Meta的旗舰AI项目直接竞争。
随着时间推移,这些人才的流失引发了人们对Meta能否留住顶尖AI人才的质疑,尤其是在它面临新一轮内外部压力之际。
据《华尔街日报》报道,由于内部对其性能和领导力的担忧,该公司正在推迟其史上最大规模的AI模型Behemoth的发布。Meta的最新版本Llama4并未受到开发者的热烈欢迎,许多开发者现在将目光转向DeepSeek和Qwen等发展更快的开源竞争对手,以寻求尖端功能。
Meta内部的研究团队也经历了一次人事变动。领导公司基础人工智能研究小组(FAIR)八年的乔尔·皮诺(JoellePineau)上个月宣布辞职。她的继任者将是罗伯特·弗格斯(RobertFergus)。弗格斯于2014年与他人共同创立了FAIR,之后在谷歌的DeepMind工作了五年,本月才重返Meta。
JoellePineau
此次领导层改组之前,FAIR经历了一段悄无声息的人员流失期。自发表里程碑式论文以来,许多促成Llama最初成功的研究人员已经离开了FAIR,尽管Meta仍将该模型系列定位为其AI战略的核心。随着许多最初的架构师相继离职,以及竞争对手在开源创新领域的步伐加快,Meta现在面临着如何在失去最初团队的情况下捍卫其早期领先地位的挑战。
这一点尤为重要,因为2023年的Llama论文不仅仅是一个技术里程碑。它帮助使开放式大型语言模型合法化,这些模型的底层代码和参数可供其他人免费使用、修改和构建,成为当时专有系统(如OpenAI的GPT-3和谷歌的PaLM)的可行替代方案。
Meta仅使用公开数据训练模型,并进行效率优化,使研究人员和开发者能够在单个GPU芯片上运行最先进的系统。Meta一度看似可以引领开放前沿。
Meta首席产品官ChrisCox在2025年LlamaCon上发表演讲。美联社照片/JeffChiu
如今,领先优势已经下滑,Meta不再引领潮流。
为什么会这样?
短短两年时间,Meta内部发生了什么?为什么会导致如今的局面?
Meta的人才流失危机其实潜藏已久,只是在JoellePineau突然宣布离职后彻底暴露在公众视野中。
Pineau辞职的时机引人质疑。就在她辞职几天后,Meta在一个不同寻常的周末推出了Llama4模型,随后引来无数谩骂。新模型因被认为发布仓促、缺乏透明度、性能指标可能虚高,以及表明Meta未能跟上DeepSeek等开源人工智能竞争对手的步伐而遭到研究界批评。
FAIR是“基础人工智能研究”(FundamentalAIResearch)的缩写,由CEO马克・扎克伯格和杨立昆于2013年12月创立,曾是Meta人工智能开发的皇冠上的明珠。但在过去两年里,随着马克・扎克伯格将公司转向生成式人工智能产品,这个备受推崇的实验室在公司内部已变得有些像孤儿,日益被公司内部更注重商业的人工智能团队挤出聚光灯之外。
例如,最新的Llama模型是Meta独立的生成式人工智能团队的产品,而非FAIR的产品。
据《金融时报》报道,FAIR目前拥有约1000名员工。该实验室最初设立于加州门洛帕克的Facebook总部、伦敦和曼哈顿,2015年扩展至巴黎,并在西雅图、匹兹堡、特拉维夫和蒙特利尔设立了小型卫星实验室。
但到2022年,Meta将FAIR团队并入RealityLabs(专注于所谓元宇宙的增强现实和虚拟现实技术的部门),这一调整促使许多FAIR研究人员离职。
尽管看似被“降职”,FAIR在2023年重新成为焦点,在Meta被视为令人瞩目的生成式人工智能“逆袭”中扮演了核心角色。
2022年11月下旬OpenAI的ChatGPT推出时,外界认为Meta在生成式人工智能领域已远远落后于OpenAI、Anthropic和谷歌。但FAIR通过开发首个可与其他公司产品竞争的免费生成式人工智能模型,帮助Meta重返赛场。这款名为Llama(源自大型语言模型英文缩写LLM的谐音)的模型,正是驱动ChatGPT等创新的AI类型,它在人工智能领域掀起了轩然大波。
FAIR在2023年7月迅速推出了第一代Llama模型的迭代产品Llama2。其发布引发了一波开源大型语言模型的开发热潮,并使Meta在大型语言模型领域成为不可忽视的竞争者。
但到当年9月,问题出现了:《TheInfomation》报道称,许多参与Llama最初研发的FAIR研究人员因与Meta另一支研究团队在计算资源上的内部争夺而离职,后者当时正在开发一款Meta最终放弃的竞争模型。
两名离职研究人员随后创立了法国初创公司MistralAI(目前估值60亿美元);Llama论文作者、FAIR研究总监阿尔芒・茹兰(ArmandJoulin)则跳槽至苹果公司。
几个月后的2024年1月,FAIR再次经历重组。随着生成式人工智能热潮加速,Meta加大力度与OpenAI、谷歌和埃隆・马斯克的xAI等公司竞争,FAIR与艾哈迈德・阿尔达勒(AhmadAl-Dahle)领导的Meta生成式人工智能产品团队GenAI被合并为一个部门。一位前FAIR负责人称此举是一次“打击”。
这一打击也与Llama的研发相关:Llama4由Meta的GenAI产品部门主导,生成式人工智能副总裁艾哈迈德・阿尔达勒担任负责人。Pineau和FAIR曾开发了最初的Llama模型和Llama2。但此后,由Meta副总裁马诺哈尔・帕卢里(ManoharPaluri)领导的新成立的GenAI部门团队接管了Llama的研发工作,使FAIR基本处于边缘地位。
前员工表示,自FAIR并入产品部门以来,Meta已逐渐降低了该实验室所擅长的开放式探索性研究的优先级,转而将资源投向GenAI旗下以产品为导向的项目。
“说实话,这让我很难过,”一位2023年离职创办初创公司的前FAIR研究员说,“2019年前后处于巅峰期的FAIR是一个非常特别的地方。”他补充道,他认为扎克伯格“显然在现阶段更重视GenAI而非FAIR”。
另一位2021年离职的前FAIR研究员回忆说,FAIR传统上对探索广泛AI子领域的项目更为开放——生成式AI只是其中之一。“过去,你可以向经理提出一个项目设想,然后就去执行,”他说,“你可以说‘我想研究机器人技术’‘我想研究计算机视觉’‘我想研究语音识别’……而且团队协作也非常紧密。”
他表示,如今他看到FAIR以及微软、谷歌等其他公司的AI研究实验室,对学术思维的支持越来越少。“这是全行业的趋势,”他说,“越来越多的人被迫转向生成式AI领域。”例如,谷歌将旗下两家AI研究机构DeepMind和GoogleBrain合并为“GoogleDeepMind”,该部门如今更专注于助力开发谷歌的GeminiAI模型,而非像此前两家实验室那样从事基础AI研究。
利润和创新如何平衡?
Meta在给《财富》杂志的书面评论中表示,公司对FAIR的承诺依然坚定。“我们的战略和计划不会因近期动态而改变,我们仍致力于引领AI研究,”该公司写道,“我们的FAIR和GenAI团队密切合作,能够更好地协调跨团队工作并加快决策速度。我们对未来的新机遇感到兴奋,其中包括FAIR继续专注于高级机器智能(AMI),这将使我们能够攻克雄心勃勃的长期研究目标。”
但前员工们表示,FAIR无疑已经发生了变化,而且并非向好的方向。一位前员工说,如今一切都围绕着构建AI驱动的产品,而非推动AI领域发展的研究型技术。他补充说,扎克伯格并不关注研究,而是关注AI对Meta利润的承诺。
据一位曾接受《财富》杂志采访的前Meta员工称,该实验室一直在“缓慢死亡”,其他前FAIR团队成员也表达了同样的看法。从这个角度来看,Pineau的离职可以被视为该实验室的临终哀鸣。
《财富》杂志前段时间采访了七名前Meta员工,其中一些人因未获授权谈论前雇主而要求匿名。许多员工(包括前FAIR研究人员)表示,近年来,随着大型科技公司内部的“蓝天”研究(即寻求新知识而不一定关注即时实际应用或商业收益的基础研究)放缓,该组织一直在缓慢但肯定地萎缩。他们说,FAIR的项目获得的计算能力也比专注于生成式人工智能的团队少——不过Meta既不证实也不否认这一点,在一份声明中表示,它不评论计算资源分配。
即便内部已经问题重重,但Meta追逐在AI领域领导权的野心从未停止。
Meta渴望赢得这场人工智能战争,并已在自身人工智能项目上投入巨资。早在年初,扎克伯格就宣布,仅在2025年,Meta将在人工智能项目上投入约650亿美元,该公司计划在其人工智能数据中心启用多达1. 3块NVidiaH100GPU。Meta最近还启用了位于亚利桑那州的“梅萨”数据中心,同时还在建设另一个新的2GW数据中心,以扩大其容量。
但遗憾的是,尽管Meta在人工智能领域投入了如此大,但它仍然没有一个专门的“推理”模型——一个专门用于处理需要多步思考、解决问题或调用外部工具来完成复杂命令的任务的模型。随着谷歌和OpenAI等其他公司在其最新模型中优先考虑这些功能,这种差距变得更加明显。
Meta离职的11位作者平均任职超过五年,这表明他们并非短期聘用,而是深度参与Meta人工智能工作的研究人员。有些人早在2023年1月就离开了;其他人则一直留守到Llama3周期结束,还有一些人在今年才离开。
他们的离职标志着这支曾帮助Meta将其AI声誉建立在开放模型上的团队的悄然瓦解,也说明了Meta在这场AI竞赛中正逐渐掉队。
参考链接:
https ://www. reddit.com/r/LocalLLaMA/comments/1hzp789/mark_zuckerberg_believes_in_2025_meta_will/
声明:本文为AI前线整理,不代表平台观点,未经许可禁止转载。
InfoQ老友!请留步!极客邦1号客服上线工作啦!
后续我将通过微信视频号,以视频的形式持续更新技术话题、未来发展趋势、创业经验、商业踩坑教训等精彩内容,和大家一同成长,开启知识交流之旅欢迎扫码关注我的微信视频号~
今日荐文
“炸穿”英伟达财报!因H20“滞销”痛失300亿,老黄气晕:DeepSeek、Qwen用美平台就赢了
21页PDF实锤Grok3“套壳”Claude?Grok3玩自曝,xAI工程师被喷无能!
印度国家级大模型上线两天仅300余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!
顶刊论文“飙脏话辱骂第二作者”,期刊回应;刚上线就卡塞?昆仑万维:已限流;马斯克宣布回归7x24小时工作状态|AI周报
用印度程序员冒充AI的“独角兽”彻底倒闭了!伪AI烧光5亿美元,连微软和亚马逊都被“坑”了
你也「在看」吗?👇


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录