细扒字节Seed 逆天招人要求!这5%本地顶级大脑做出了首个跨7大语言代码修复基准,让大模型成本狂降83%!


细扒字节Seed 逆天招人要求!这5%本地顶级大脑做出了首个跨7大语言代码修复基准,让大模型成本狂降83%!

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

作者|冬梅
字节TopSeed启动
2026届招聘,瞄准顶尖博士
4月27日,字节跳动Seed在其官微上发布了一则招聘启示,宣布正式启动2026届TopSeed大模型顶尖人才校招计划,研究课题包括大语言模型、机器学习算法和系统、多模态生成、多模态理解、语音等方向,基本覆盖大模型研究各个领域,计划招募约30位顶尖应届博士。
值得一提的是,本届TopSeed强调不限专业背景,更关注研究潜力,希望寻找具有极强技术信仰与热情、具备出色研究能力、富有好奇心和驱动力的年轻研究者。
除了匹配研究价值的回报外,TopSeed计划还将给予人才一流的科研环境和充分的自由度进行研究探索,鼓励不拘泥既有技术、探索智能上限,同时依托字节跳动丰富的应用场景,研究成果也将有广阔的落地空间。
InfoQ了解到,TopSeed人才计划是字节跳动去年5月发起的面向应届博士毕业生的招聘,同年7月,字节推出针对在校博士生的TopSeed研究实习生专项,共同为旗下豆包大模型团队筛选人才。
在字节跳动去年发布的该项目宣传视频中,该计划公布了希望招聘到的人才“一定是最顶尖的5%的人”,并希望他们去做95%的人做不到的事情。
在该段视频中,TopSeed团队成员表示:“TopSeed希望人才能够具备的最关键的能力是创造力,要敢于打破我们现在的认知,有坚定的目标和信念,对技术有极大热情,有想象力,有扎实的功底,动手能力强,有较强的好奇心,有探索欲,能够承受挫折。”
应届生已在重要项目中崭露头角
无留学背景的人才很能打
值得注意的是,字节跳动在此次招聘启事中还透露了几位刚毕业的同学已经做出了一些有影响力的研究。
比如,Z同学构建并开源了首个多语言代码修复基准Multi-SWE-bench,在SWE-bench基础上,首次覆盖Python之外的Java、TypeScript、C、C++、Go、Rust和JavaScript七种编程语言,1632个真实修复任务,是真正面向“全栈工程”的评测基准,其数据均来自GitHubissue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。
具体而言,这个Multi-SWE-bench到底能干什么用?答案是可用于评估和提升大模型“自动修Bug”能力。
作为该篇论文的一作,昝道广就是上述提到的Z同学。
据领英信息,昝道广是中科院计算机科学与技术博士生,研究方向为大数据分析技术和人工智能技术应用研究、网络安全分析、威胁情报分析、系统安全、知识图谱、云计算技术,参与发表了34篇与大模型相关的学术论文,曾在中国科学院软件研究所担任高级工程师。
济南校区电气信息系计算机科学与技术专业1班的昝道广是师生眼里典型的“学霸”。在大学学期,昝道广学习成绩稳居专业第一,8次获奖学金;获发明专利1项、软件著作权2项,发表学术论文5篇;多次担任队长参加大学生数学建模、软件设计、算法设计、程序设计等各级竞赛,获省级以上奖项9项,获得Java高级工程师、IBM软件工程师等证书……
去年,昝道广加入字节跳动并在短时间内构建并开源了首个多语言代码修复基准Multi-SWE-bench。
另一位Q同学主导并开源了可以在虚拟世界中高效执行各类任务的多模态智能体项目深受开发者群体欢迎,Desktop版本GitHubStar数破万。
UI-TARS能够在虚拟世界中高效执行各类任务。目前,UI-TARS-1.5已在7个典型的GUI图形用户界面评测基准中取得SOTA表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。
综合上述信息,InfoQ推测,Q同学是该论文的一作者秦禹嘉。
秦禹嘉专注于LLM/VLM类代理。于2024年从清华大学获得计算机科学博士学位,师从刘知远,2020年于清华大学获得电子工程学士学位,导师为吴冀。
研究生期间,他曾在腾讯微信模式识别组担任实习生,导师为李鹏博士和林彦凯博士。他也曾创办了一家AI公司SeqAIInc.,后又于去年7月份通过TopSeed计划入职字节跳动。
最后是H同学。他作为一作发表超稀疏模型架构UltraMem研究,有效解决MoE推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。
在Transformer架构下,模型的性能与其参数数量和计算复杂度呈对数关系。随着LLM规模不断增大,推理成本会急剧增加,速度变慢。
字节跳动提出的这款全新的稀疏模型架构UltraMem有效解决了MoE推理时高额的访存问题,还揭示了新架构的ScalingLaw,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。
实验结果表明,训练规模达2000万value的UltraMem模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模value或expert开辟了新路径。
InfoQ查阅论文发现,该技术论文的一作为ZihaoHuang。
根据OpenReview信息,ZihaoHuang于2021年硕士毕业于南开大学人工智能学院,同年加入字节跳动。
一流高校硕士、博士生、顶级学霸,这些都是已经进入TopSeed的人才身上的标签,也侧面反映了该项目的选拔人才标准——只要5%顶尖人才。
说完了对人才的要求,TopSeed又能给予候选人提供什么呢?
技术大佬导师成“招聘法宝”
首先是钱。能提供行业Top级薪资待遇。据进入计划的一位北大的学生透露,实习工资被提到了2000元一天,要是按照一个月出勤20天来算,实习工资将达到月薪4万元,这在全行业来讲也属高薪范畴。
其次是资源(算力和数据)。据宣传视频中介绍,TopSeed能够提供为人才充足的算力和数据支持。当同学们加入后,可以直接参与到问题定义和解决的过程中。TopSeed会给予人才充分的自由度——虽然团队有统一的愿景,但实现这个愿景的具体路径可以由同学们自主选择。
在这里,最大的优势在于,许多产品都涉及视觉数据处理。这意味着一旦学生加入后开发出了新的视觉技术,可以快速实现应用落地。
第三,是顶级技术大牛带队和充分的自由度。TopSeed另一最重要的资源和支持来自于优秀的团队。因为对于很多人才来讲,他们选择工作机会时看中的可能并非以上两点,而是能够与杰出的人才共同应对挑战性工作,这本身就极具吸引力。
此外,TopSeed团队也表示,将会给予学生们更多的自由度,基本上不用做PPT,也不怎么开会,将把更多的时间放在做正确的事情上。
那TopSeed背后的团队,到底藏着哪些优秀导师?根据宣传视频,我们来浅扒一下。
王明轩:TopSeedLLM研究团队研究员,豆包大语言模型研究团队负责人,北航校友,博士毕业于中科院计算所;
项亮:豆包大模型基础设施团队负责人,2006年毕业于中国科学技术大学自动化系,并荣获该校本科生最高荣誉奖——郭沫若奖学金。随后保送至中国科学院自动化所,并在杨青研究员的指导下攻读工学博士学位。毕业后,项亮任职于Hulu和宜信公司,从事视频推荐系统的研究和开发工作。他还曾任瓜子二手车首席科学家。
冯佳时:字节跳动研究科学家、豆包大模型视觉基础研究团队负责人,曾任新加坡国立大学电子与计算机工程系助理教授,机器学习与视觉实验室负责人。
王雨轩:豆包大模型语音部门负责人,本科毕业于北航,后攻读北京大学研究生,博士毕业于俄亥俄州立大学;
其他未出现在视频中的豆包大模型背后的技术专家还包括:
田值:豆包大模型视觉生成模型技术专家,在川大本科期间就以一作发布顶会论文,阿德莱德大学获博士学位;
严林:豆包大语言模型对齐团队负责人,研究生毕业于中科院计算所;
陈卓:豆包大模型音频生成研究团队负责人,西安交大校友,硕博毕业于哥伦比亚大学;
李成刚:豆包大语言模型预训练方向负责人,清华机械工程本硕学位;
同时,2月份加入字节的谷歌DeepMind研究副总裁、现Seed基础研究负责人吴永辉,也出现在了可供实习生选择的导师行列。
大厂AI人才争夺战,
为什么瞄准年轻人?
据智联招聘日前发布的《2025年春招市场行业周报(第一期)》,春招首周,人工智能行业求职人数同比增速达33.4%,位居行业第一;人工智能工程师的求职增速达69.6%,位居职业榜首,平均招聘月薪超过2万元。
据脉脉高聘人才智库去年9月的数据,云计算、搜索算法、大模型算法、DSP开发、反欺诈-风控算法5个岗位连续2年位列人才紧缺度前十。
AI方向技术人才如此短缺,大厂难免纷纷下场抢夺AI人才。
2月份,一则有关DeepSeek百万年薪招聘人才的消息引发了热议。据消息,DeepSeek开出最高98万元年薪招聘UI设计师。网友们进一步挖掘之后发现,这家公司正在以极具竞争力的薪资招聘各种工程师,即便是非算法岗,也提供令人瞩目的待遇,最高月薪9万(合年薪126万)。特别是核心系统研发工程师,甚至包括了“校招应届生”这一范畴。
4月初,阿里国际接连放大招。据阿里国际招聘官网消息,2026届校招中80%为AI岗位,包括AI算法、研发、AI产品经理等。同时,启动了面向全球的头部AI科技人才培养计划Bravo102。
4月中旬,腾讯宣布启动史上最大就业计划,三年内将新增28000个实习岗位并加大转化录用,其中仅2025年,就将迎来10000名校招实习生,有六成面向技术人才开放。
腾讯方面表示,今年开放的校招实习岗位涵盖技术、产品、设计、市场、职能等五大类70余种岗位,包括大模型、研发、算法、市场、策划、运营、销售、美术等多个岗位职能。同时,在大模型加速落地的背景下,腾讯加大了人工智能、大数据、云计算、游戏引擎、数字内容等技术类岗位的招聘力度,技术类岗位“扩招”力度空前,占比超60%。
但有个值得深思的信息是,无论是阿里、字节还是腾讯这类大厂还是DeepSeek,他们砸下重金招聘的往往都是应届生,甚至是一些本科生、硕士生以及实习生,为什么会这样?
在InfoQ近期的一次访谈中,中国人民大学信息学院院长、计算机系教授柴云鹏表示,之所以出现这种情况,是因为“在计算机领域,尤其是工科,很多人的创造力最活跃的时期是在20多岁到30出头。这个年龄段的人学习能力强,也有一定的经验。但到了40岁左右,学习能力可能会变慢,整体节奏也会放慢。特别是在AI时代,适应新事物的能力会变弱,而AI团队需要快速响应,一旦有新的思路,就要争分夺秒地去实施。加班能力也很重要,而年轻人在这方面更有优势”。
他还表示:“从这个角度看,吸引刚毕业或工作没几年的年轻人是比较划算的。比如,人大信息学院的进人策略也是这样,主要精力放在引进年轻人。只需要少量有经验的人来带领团队。比如,一个有经验的人带领十几个年轻人,这样的战斗力可能是最强的,性价比也很高。从头培养年轻人有很多好处,比如增强归属感和协同沟通能力。”
理想的创新团队年龄结构不能太大。从这个角度看,DeepSeek的策略是合理的。此外,AI领域与其他领域不同,它本身就很新,资深人士的经验作用并不大,甚至可能因为固定的思维方式而产生阻力。
参考链接:
https ://arxiv.org/abs/2504.02605
https ://seed.bytedance.com/zh/topseed?view_from=homepage_tab
https ://36kr.com/p/3214485615234177
https ://www.researchgate.net/profile/Daoguang-Zan
https ://www.sdust.edu.cn/info/1039/1527.htm
https ://arxiv.org/pdf/2501.12326
https ://arxiv.org/abs/2411.12364
https ://yujia-qin.github.io/
活动推荐
AICon2025强势来袭,5月上海站、6月北京站,双城联动,全览AI技术前沿和行业落地。大会聚焦技术与应用深度融合,汇聚AIAgent、多模态、场景应用、大模型架构创新、智能数据基建、AI产品设计和出海策略等话题。即刻扫码购票,一同探索AI应用边界!
今日荐文
“DeepSeek不是万能的”,李彦宏今年押注AI应用:模型价再“打骨折”,重点布局多智能体、多模态
AI智能体老“崩”?DeepSeek前员工联手李飞飞等大佬开源新框架,教会模型真正推理
Cursor、Devin等爆款系统提示词曝光,Github上斩获近2.5万颗星!官方给AI工具“洗脑”:你是编程奇才
95后中国开发者刚刚发布“摸鱼神器”,比Manus快4倍!实测结果能否让打工人逆袭?


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录