字节 AI 卷出新高度:豆包试水“上下文定价”,Trae 覆盖内部80%工程师,战略瞄定三主线


字节 AI 卷出新高度:豆包试水“上下文定价”,Trae 覆盖内部80%工程师,战略瞄定三主线

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

整理|褚杏娟
近日,字节分享了其对今年AI技术发展主线的思考,主要包括以下三个方面:
多模态的推理和思考。仅做文本的reason和thinking无法充分发挥模型能力,基于图片、视频等多模态数据,reason和thinking能力才会真正爆发。但目前行业并没有涌现这样的能力。
视频生成技术突破。在2024年底之前,全球视频生成模型还属于“玩具”,难以应用于实际生产环节。然而到了2025年,随着类似Veo2等模型的出现,视频生成技术开始逐渐进入实际生产与生活,如消费领域、电商广告短片制作等场景。
多步骤复杂任务。今年,多步骤复杂任务的处理能力会逐步成熟,但进程是缓慢的。直到目前,多数相关应用仍存在脱离实际需求的情况。字节预计到今年第四季度,这类能力会逐渐走向可用,可能达到放心让AI助手尝试完成价值约50元人民币的简单任务,准确率预计可达80%-90%,开始具备实际使用的可能性。
基于上述考虑,6月11日,字节跳动旗下火山引擎进行一系列的发布和更新,包括豆包大模型1. 6、视频生成模型Seedance1. 0pro等新模型,并升级了Agent开发平台等AI云原生服务。
豆包1. 6实行统一定价

Doubao-Seed-1. 6支持auto/thinking/non-thinking三种思考模式。据介绍,在高考全国新一卷数学中,豆包大模型取得144分;在海淀模拟全卷考试中,理科取得706分,文科获得712分。
豆包1. 6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题。演示案例显示,豆包1. 6可自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。

火山引擎总裁谭待介绍,上下文长度是影响模型服务成本的关键因素,模型上下文长度对成本有累加特性。
谭待表示,深度思考、多模态和工具调用等模型能力提升,是构建Agent的关键要素。同时,由于Agent每次执行任务都会消耗大量tokens,模型使用成本也要降下来,才能推动Agent的规模化应用。
鉴于此,豆包大模型1. 6从上下文长度的维度进行了三档定价,并对深度思考、多模态能力与基础语言能力统一价格:
上下文长度在1-32k之间,输入价格为0. 8元/百万tokens,输出价格为8元/百万tokens;
上下文长度在32-128k之间,输入价格为1. 2元/百万tokens,输出价格为16元/百万tokens;
上下文长度在128-256k之间,输入价格为2. 4元/百万tokens,输出价格为24元/百万tokens。
整体来看,豆包大模型1. 6的综合成本只有豆包1.5深度思考模型或DeepSeekR1的三分之一。
谭待介绍,火山引擎除了用技术优化方案降低成本外,还结合自建数据中心与公有云资源,平衡初期投入与长期成本,目前其自建算力占比达30%。
数据显示,豆包大模型日均tokens使用量超过16. 4万亿,较去年5月首次发布时增长137倍。
字节内部超过80%的工程师使用Trae
5月28日,字节被曝出于对防范数据泄露风险的考虑,自6月30日起,将在内部分批次禁用第三方AI开发软件,包括AI编程工具Cursor、Windsurf等,并将旗下编程助手Trae作为替代方案。消息被曝出来后,Trae也一度成为话题中心。
这次大会上,字节跳动技术副总裁洪定坤透露,在字节内部,超过80%的工程师在使用Trae辅助开发。Trae的整体月活用户已经超过了100万。
洪定坤自己亲身体验了Trae带来的效率提升。端午假期后,洪定坤与两名同事一起开发了一个相对复杂且完成度较高的英语学习应用,根据以往经验,开发该应用可能需要几周甚至一个月,但这次开发实际只用了三天。
据介绍,Trae有两个核心功能:代码补全和预测编辑。AI不仅能补全当前代码,还能预测下一步可能需要修改的位置,并直接跳转到那里。通过这种方式来大幅提升代码生成和编辑的效率。
洪定坤团队最早开发的产品是Mascode,它以插件形式集成到VSCode或JetBrains等IDE中,帮助开发者提升效率。如今Mascode插件拥有大量用户,但作为轻量级工具,它难以承载AI与IDE深度结合的完整体验。
随着模型能力提升,开发者对IDE的期待更高,希望它能支持更复杂的开发流程。因此,洪定坤团队研发了“去IDE”的Trae——一个为AI量身打造的原生开发环境,不仅包含基础功能,还支持代码重构、批量修改和交互式问答等复杂任务。此外,Trae还支持100+优质MCPServers,支持用户自定义并分享智能体。
Trae采用了自然语言编程的方式,但不同于简单地将需求丢给AI完成,开发者仍然是主导开发的工程师。例如,开发者用200多字的提示词描述后,AI生成了约300行代码,而开发者只需做少量优化(不到5%)。这种方式下,85%的代码由AI生成,“我更像是在与另一名工程师协作。”
Trae的开发使用了内部模型“豆包1. 6”,其强大的编程能力是关键。团队针对工程场景对模型进行了额外训练,使其更适配开发需求。该模型将很快推送给“去IDE”用户,性能较1. 5版有显著提升。
编码只是开发的一环,软件开发还涉及文档编写、运维、调试、发布和Debug等。传统开发中,编码仅占不到40%的工作量。因此,除了编码,团队还花费大量时间在环境搭建、压测和部署上。未来,我们希望AI能成为“调度者”,自动完成日志分析、分支管理、代码提交和发布等任务,将复杂流程压缩到几小时内。
“需要强调的是,AI与人的协作至关重要。完全依赖AI生成的代码难以维护,且缺乏性能优化。”洪定坤说道,“例如,昨晚我们遇到一个Bug,最终仍需人工介入修复。专业工程师应专注于创造性工作(如算法设计和性能优化),而AI负责执行和协作。真正的‘AI工程师’是人与AI的高效结合。”
视频生成模型也主打性价比
字节判断,视频生成技术已经进入了更深度的创作阶段。今天,字节正式发布最新的豆包视频生成模型Seedance1. 0Pro。
据介绍,Seedance1. 0Pro具有三大特点:无缝的多镜头叙事、多动作的随心运镜、稳定运动与真实美感。其中,无缝多镜头能力可以生成两个以上镜头的自然切换,配合远景、中景和近景的变化,大幅提升画面信息量和叙事表现力。除了丰富的镜头语言,人物在画面中的肢体动作和表情也更加生动流畅,能够生成多主体、多动作及复杂运镜的视频内容。
通过后训练阶段采用的精细数据集、多维度奖励模型和反馈学习算法,Seedance1. 0Pro在运动生动性、结构稳定性和画面质量等方面都有显著提升。
此外,Seedance1. 0Pro的价格也具有一定性价比。Seedance1. 0pro模型价格为0.015元/千tokens,生成一条5秒的1080P视频只需3. 67元。
换算来看,1万元预算可生成2700条1080p视频;若选择780p分辨率,则可生成9700多条。相比之下,对于5秒的1080P视频,可灵2. 1大师版和2.0大师版都是分别生成1000条,Veo2则仅生成785条。
目前,字节在电商、游戏、影视等领域进行了实践探索。其中字节与网易合作,用《逆水寒》仙侠游戏进行测试,玩家可以创作角色故事并通过视频生成演绎剧情。
此外,豆包实时语音模型如今全量上线方舟平台,向所有企业客户开放。端到端实时语音让模型说话越来越拟人。基于此,字节进一步推出了播客模型,支持自然流畅的双人对话,包含互相附和、插话、犹豫等真实播客互动节奏,同时支持多种输入:一句话指令、网页链接或长文本内容等。
智能体带动强化学习算力攀升
当前,各厂商都在加速将企业基础设施和云计算体系改造为更适配AI的形态。
在火山引擎智能算法负责人吴迪看来,其首要任务是选择更强、更智能且性价比更高的模型;其次,需要将数据基础设施与大模型能力深度融合,高效的数据检索能显著提升大模型表现,而知识库与记忆库的有机结合则有助于打造更智能的产品体验;最后,Agent落地涉及大量工具调用,对其效果的持续评估和迭代将是团队的长期工作重点。
当前,字节已经有扣子开发平台企业版、扣子空间、HiAgent等智能体构建平台。这次大会上,围绕MCP协议,火山引擎MCPHub已与AI原生IDETree、方舟体验中心和扣子打通,支持一键选用200多个丰富MCP协议服务。吴迪表示,与云的深度连接是火山引擎MCP的显著特色。
提示词工程是AI应用开发的重要部分。吴迪团队判断:第一,模型越强,提出好问题的正向价值越大,优质问题才能充分释放模型潜力;第二,现实世界中许多高价值问题没有标准答案,如各企业用大模型提升招聘效率时,用人标准各不相同;第三,长期来看,提示词工程本质是搜索优化问题,历史经验表明所有搜索问题终将由自动化系统和优化算法解决。为此,吴迪团队推出了PromptPilot,支持开发者用自然语言表达模糊需求,通过简单互动获得初步增强的prompt。
吴迪表示,过去几个月,强化学习算力消耗快速攀升,模型训练正从单纯的深度学习作业演变为综合推理训练环境、模拟虚拟机等要素的分布式系统。随着大量Agent进入现实世界,强化学习愈发重要。其预测到2027年,强化学习带来的算力和资金消耗可能逼近整个行业在预训练上的投入。
然而,当前强化学习面临诸多挑战:需协调GPU/CPU混合编排、异构算力调度和异步推理,系统驾驭难度增加;需要对环境模拟仿真进行管理,涉及大量代码解释器、浏览器、虚拟机和MCP服务,数百个沙盒需随训练过程快速启停并确保安全隔离;训练阶段变得更动态复杂,整体运维难度提升等。
声明:本文为AI前线整理,不代表平台观点,未经许可禁止转载。
活动推荐
6月27~28日的AICon北京站将继续聚焦AI技术的前沿突破与产业落地,围绕AIAgent构建、多模态应用、大模型推理性能优化、数据智能实践、AI产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索AI应用的无限可能!
今日荐文
曝豆包多模态负责人准备离职;马云频繁要求汇报Qwen3开发进度;北大“韦神”粉丝破2000万,评论区变高考许愿池|AI周报
别被MCP的包装骗了!重构系统、向智能体转型,CEO亲述:关键时刻还是RPA兜底?
王兴兴回应比赛风波:挣到钱了,但现在的机器人别指望它能干活
13年苦熬到170亿市值,一夜间被用户抛弃!一封“AI吹”全员信让网友“不喷不行”
天塌了,Claude全面断供Windsurf!CEO喊冤控诉也挡不住开发者退订,祸起OpenAI收购?
你也「在看」吗?👇


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录