飞桨星河社区6月报:文心大模型4.5系列开源发布,快来体验模型一键部署!


飞桨星河社区6月报:文心大模型4.5系列开源发布,快来体验模型一键部署!

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

月度动态总览
产品功能更新:体验优化与效率提升
首页改版焕新:首页导航栏改版,以提升开发者操作体验。上线新手指引卡片(GetStarted),实现一站式覆盖开发者从入门到深度使用的全场景引导;
模型体验场(Playground)上线:助力开发者低成本、高效能实现模型体验、调优调参、多模型对比;
模型库升级:重构模型四级标签体系,新增筛选项,便利开发者精准选择目标模型。模型详情页强化关联资源跳转,新增模型系谱展示,支持基模型溯源与子模型查询,覆盖模型选型至开发部署全流程;
数据集升级:优化标签体系,开发者可多维度选择标签,从而精准搜集目标数据集。
社区内容更新:丰富资源与实战赋能
模型资源:文心大模型4. 5开源系列已上线,共计新增200+开源大模型(ERNIE、DeepSeek、Llama、Qwen系列等),覆盖多模态、NLP等方向,兼容主流SDK,支持灵活接入与业务集成;
项目资源:新增100+实训项目,聚焦大模型实战、飞桨套件应用、入门教程等方向,如《律师分身Agent》《ERNIE情感分析教程》等;FastDeploy、ERNIEKit、一键部署实训项目上线,全面掌握文心系列开源模型最佳工具实践;
数据集资源:新增600+数据集,覆盖大模型微调、人类偏好对齐、强化学习等多个领域。联合智源研究院、人民日报健康客户端等发布高质量垂类数据(医疗/推理/粤语语料),赋能LIC2025语言与智能技术竞赛;
边学边练赋能体系:通过阶梯式教学课程(学)、文心开源微调实战营(练)联动,覆盖从理论学习到产业实践的完整链路,助力开发者精准匹配学习资源、强化实战技能,加速AI技术从掌握到落地的跃迁。
社区生态共建:开源协同与产学研联动
重点活动:本月成功举办「文心中国行·南京站」法律科技沙龙(覆盖90+开发者)与华南师范大学AI技术交流会(140+师生参与),推动智能法律助手项目上线飞桨社区,深化法律AI及产学研人才培养合作;
热门赛事:四大核心赛事“华南师大第六届AI算法赛(307支团队)、百度商业AI创新大赛(2000+选手)、飞桨黑客松第八期(攻克22项任务)及LIC·2025语言与智能技术竞赛(共设13. 5万奖金|覆盖医疗/科研/传媒三赛道)”,累计吸引超4000人次参与,驱动PaddleNLP/Speech项目升级,助力实现产教融合与开源技术突破;
开源贡献:截至6月飞桨开源贡献者总数514人。社区开发者贡献显著,在精度补齐、API正确性完善、算子切分推导等基础开源工作上持续发力,同时为PaddleMIX、PaddleNLP等多个开源项目带来功能更新,助力PaddleSpeech完成新版本发布。
产品功能更新
1. 1首页改版焕新
社区首页导航栏改版升级,通过整合重复模块(如服务列表三合一)、重构分类逻辑(新增“项目大厅”“学习大厅”等高频功能区)、简化操作路径(核心功能入口从三级Tab缩至一级),大幅提升开发者的功能查找效率与使用流畅度。上线新手指引卡片(GetStarted),进一步降低开发者在社区的学习使用成本,助力开发者快速玩转社区核心功能。
访问地址:https ://aistudio. baidu.com/overview
1. 2模型体验场(playground)上线
面向开发者提供低成本的大模型体验与多模型对比功能,助力开发者快速验证效果、精准选型,降低开发者模型成本调用和调试门槛,提升开发效率。
访问地址:https ://aistudio. baidu.com/playground
核心功能如下:
模型体验:预置ERNIE、DeepSeek、Qwen、Llama系列等主流大模型,覆盖多模态、深度思考、联网搜索等任务方向,开发者可根据任务需求选择模型,提供基于聊天交互的模型调用界面,支持任务验证与参数调试。
调参调优:支持个性化调整“输出Token上限、温度、Top-p、重复惩罚”等关键参数;提供系统提示词优化功能,降低Prompt设置成本;支持将模型、参数及提示词组合保存为模型配置文件,便于后续调用。
多模型对比:支持开启多配置对比界面;可同步比对同模型不同参数、不同模型同参数或完全异构配置效果;直观呈现不同模型配置的性能差异。
1. 3模型库升级
模型库首页重构标签体系并新增筛选功能;模型详情页新增“模型体验场基础版”功能、相关数据集/应用/项目跳转展示区及模型系谱展示区。本次升级全面支持开发者高效完成大模型选型、开发部署及创建的全流程任务。
访问地址:https ://aistudio. baidu.com/modelsoverview
核心功能如下:
大模型选型优化:重构模型标签体系,涵盖任务方向、模型特性等4个维度;新增开发支持、部署支持等筛选项,便利开发者更快更精准找到所需模型。
大模型开发与部署:新增关联资源跳转区(数据集/应用/项目),一键Fork快速启动开发任务。新增模系谱展示功能,支持适配(Adapter)、合并(Merge)、量化(Quantized)、微调(Finetune)四类衍生关系模型,支持基模型溯源与子模型查询。
大模型上传&托管:支持Git/SDK/网页三种方式上传模型文件,兼容Apache/MIT/GPL等多种开源协议,满足多元化创建需求。
大模型下载:支持CLI/Git/SDK/网页4种方式下载模型文件,2个命令行即可实现高速下载,加速开发者本地部署进程。
1. 4数据集升级
重构三级标签体系,新增“应用领域”、“组织来源”等不同维度;数据集主界面布局优化,全面提升开发者数据管理效率。
访问地址:https ://aistudio. baidu.com/datasetoverview
社区内容更新
2. 1模型资源
模型库集成海量优质模型,可快速体验文心大模型4. 5开源系列及飞桨经典模型,新增200+开源大模型,涵盖DeepSeek、LLaMA、Qwen等主流系列。覆盖视觉、语音、自然语言处理(NLP)、多模态等核心方向。一站式支持模型体验、开发训练、推理部署等,兼容主流SDK,支持灵活接入与业务集成。期待通过开源社区的共建,推动文心大模型应用生态繁荣发展。
访问地址:https ://aistudio. baidu.com/modelsoverview
💡精选模型
文心大模型4. 5系列
💡模型介绍与核心技术亮点
📖模型介绍
🤖文心4. 5系列开源模型共10款,涵盖了激活参数规模分别为47B和3B的混合专家(MoE)模型(最大的模型总参数量为424B),以及0. 3B的稠密参数模型。
🏆文心4. 5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。实验结果显示,该系列模型在多个文本和多模态基准测试中达到SOTA水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。模型权重按照Apache2. 0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广泛兼容多种芯片,降低后训练和部署门槛。
💡核心技术亮点
多模态混合专家模型预训练
高效训练推理框架
针对模态的后训练
2. 2项目资源
精选新增实训项目100余项,助力开发者快速进入大模型开发与应用实战。
访问地址:https ://aistudio. baidu.com/projectoverview
覆盖四大核心方向:
大模型项目实战:聚焦ERNIE、DeepSeek等主流大模型应用,重点覆盖RAG系统优化、多Agent协同开发、轻量化微调(LoRA/SFT)等关键技术;
飞桨套件深度应用:深入讲解边缘计算与工业部署、大模型全流程开发、产业实践创新等场景下的飞桨套件应用;
初学者友好教程:面向入门学习者,提供AI助手实践、A2A协议、技术原理剖析、微调实战等基础操作指导;
飞桨产业级大语言模型套件项目:基于飞桨套件,提供大语言模型(如Qwen2. 5)的预训练、微调(SFT/DPO)、对话模板生成等产业级实战案例。
💡精选项目
【FastDeploy】
基于飞桨的大模型高效部署套件FastDeploy,快速上手模型部署
项目简介:使用FastDeploy部署框架,在星河社区快速完成ERNIE4. 5开源系列模型推理部署。
项目链接:https ://aistudio. baidu.com/projectdetail/9352598
【ERNIEKit】
基于飞桨的文心大模型开发套件ERNIEKit,快速上手模型精调
项目简介:基于ERNIEKit高效实现ERNIE-4. 5-0. 3B-Paddle模型训练、模型部署,在星河社区快速上手开发。
项目链接:https ://aistudio. baidu.com/projectdetail/9349901
【一键部署】让ERNIE-4. 5-21B-A3B带你进入哆啦A梦的世界
项目简介:基于星河社区一键部署ERNIE-4. 5-21B-A3B-Paddle,构建多Agent协同系统,带你沉浸式体验《哆啦A梦》世界,与经典角色对话互动、使用神奇道具、探索熟悉场景,重温童年梦想与友谊力量。
项目链接:https ://aistudio. baidu.com/projectdetail/9349446
【PaddleOCR3. 0】基于PaddleOCR的实验数据自动化提取
项目简介:使用PaddleOCR精准提取1603张实验照片数据,并自动化录入表格,节省约6h的手动录入数据的时间。
项目链接:https ://aistudio. baidu.com/projectdetail/9240412
2. 3数据集资源
数据集板块增加600+数据集,覆盖自然语言处理、计算机视觉、音频及跨模态任务等方向,以满足模型开发全流程数据需求;联合智源研究院、人民日报健康客户端、发布高质量数据集,助力开发者攻克特定领域难题,共建精准行业AI解决方案;并基于新增数据集围绕文心大模型,开展2025LIC语言与智能技术竞赛,携手开发者共同探索真实数据场景下的AI技术落地方向。
访问地址:https ://aistudio. baidu.com/datasetoverview
💡精选数据集
LIC赛事人民日报健康客户端赛道一示例数据集:覆盖了从权威专家长视频讲座、轻量级科普短视频、多模态图文内容到结构化疾病知识库等多种类型和场景。
访问地址:https ://aistudio. baidu.com/datasetdetail/345031
LIC赛事智源研究院赛道二示例数据集:由北京智源人工智能研究院(BAAI)创建的合成推理数据集。它旨在通过从海量原始语料中提取并泛化复杂的人类推理过程,以提升大语言模型的推理能力。该数据集涵盖数学、代码和通用知识领域,每条样本都包含指令、思维链和用于预训练的合成文本。
访问地址:https ://aistudio. baidu.com/datasetdetail/317890
ai2_arc:AI2推理挑战赛(ARC)数据集,由艾伦人工智能研究所创建。它包含7787个小学科学多选题,专为高级问答研究而设计。数据集分为简单集和挑战集,后者包含现有简单算法无法解决的难题,对模型的推理能力构成真正的考验。
访问地址:https ://aistudio. baidu.com/datasetdetail/343349
openbookqa:OpenBookQA是一个模拟“开卷考试”的问答数据集。它包含近6000道多选题,需要模型进行多步推理并结合常识知识才能解答。数据集附有一本核心事实“参考书”,旨在推动需要深度文本理解的高级问答研究。
访问地址:https ://aistudio. baidu.com/datasetdetail/343353
LongBench:LongBench是一个双语、多任务的长文本理解基准测试,旨在全面评估大模型在长上下文环境下的表现。该基准测试涵盖中英文两种语言,包含六大类别共21项任务,涉及单文档问答、多文档问答、摘要生成、小样本学习、合成任务和代码补全等关键应用场景。
访问地址:https ://aistudio. baidu.com/datasetdetail/343374
2. 4边学边练赋能体系
为助力开发者AI探索之路高效成长,飞桨星河社区打造“边学边练”一体化赋能体系,提供从入门到精通的全流程指引,助力开发者快速掌握文心大模型核心开发能力,贯通学习、实践与竞赛全场景,加速AI技术落地应用。
📑学:全新课程体系上线,阶梯式引导快速上手
访问地址:https ://aistudio. baidu.com/course/introduce/35118
✍️练:文心开源微调实战营,深度赋能项目开发
为让大家体验文心大模型4. 5开源系列的强大能力,一场专属的文心大模型微调实战营正在紧锣密鼓地规划中,预计7月9日正式上线!
本次实战营将由飞桨开发者技术专家(PPDE)亲自带队,手把手从原理剖析到实战项目,全方位带您掌握使用文心开源大模型进行高效微调的核心技术。无论您是想提升模型在特定任务上的表现,还是希望构建专属领域的AI应用,本次训练营都将为您提供最实用、最前沿的指导。
社区生态共建
3. 1重点活动
百度文心中国行首次登陆南京
6月11日,百度文心中国行首次登陆南京,业界精英、专家学者以及AI开发者将齐聚一堂,围绕大模型时代的算法应用创新、数据价值挖掘、跨学科人才培养等核心议题,深入探讨人工智能技术如何通过政产学研协同创新机制,驱动实体经济和数字经济深度融合发展。大会还特设200㎡创意互动展区、2场平行分论坛、2场WorkShop,为南京AI从业者和爱好者们带来一场思想盛宴。
其中,飞桨星河社区推出的WorkShop,得到了广大开发者的关注和参与。WorkShop聚焦智能法律助手实践,讲师围绕「律师项目律师分身Agent」(基于文心一言的智能法律助手)展开讲解,并同步完成其在飞桨星河社区项目大厅的上线部署。现场围绕合作链路、应用场景及商业化方向展开交流,进一步推动法律科技生态协同。
飞桨星河社区和模力社区联名AI加速营亮相MWC
飞桨星河社区和模力社区联合推出的垂模加速赋能品牌活动——模力星河AI共创加速营,于6月19日上午在世界移动通信大会(MWC)成功举办第一期结营和第二期招募会,来自浦东科经委、模力社区、百度飞桨星河社区、交通银行的代表演讲分享,5家加速营企业成果现场路演展示,并向全球垂模创业先锋发出邀请。模力星河AI共创加速营,让更多年轻力量走上AI创新的产业舞台,缔造出人工智能产业新的传奇。
飞桨星河社区联合华南师范大学举办技术沙龙
百度飞桨星河社区联合华南师范大学计算机学院在广州举办技术沙龙,近140名师生与专家围绕AI前沿技术、开源生态及人才培养交流。活动结合华南师大五届人工智能算法挑战赛(第六届进行中)经验,涵盖PaddleNLP技术解析、Text2SQL赛题解读等内容,深化产学研协同,助力学生优化学习方向。现场互动解答技术及赛事难点,未来双方将持续合作推动AI人才培养。
飞桨「启航计划」第五期圆满收官
6月,飞桨开源社区「启航计划」第五期通过两个月高强度开源实战集训圆满收官,覆盖10+所重点高校,推动开源生态建设成效显著:29名营员累计合入110个PR(涵盖PaddleSpeech、PaddleNLP等仓库),其中28人为首次贡献的新开发者;12名营员通过考核顺利结营(含9名北京理工大学推荐学员),3名优秀营员更通过答辩分获一、二、三等奖,为飞桨生态注入新活力。
访问地址:https ://aistudio. baidu.com/activityoverview
3. 2热门赛事
2025“中国高校计算机大赛—人工智能创意赛”
2025“中国高校计算机大赛—人工智能创意赛”(C4-AI竞赛)启动,聚焦“飞桨文心”赛道,以文心大模型为首选开发工具,支持通过PaddleX零代码模型产线完成小模型训练与部署,并推出“潜力项目孵化计划”。
竞赛采用开放命题,要求参赛作品基于百度飞桨及文心大模型技术,在飞桨星河社区完成模型开发、部署、调用及产品托管/上线全流程。参赛者需自主探索应用场景、获取数据,提交具备原创性且可可视化展示的作品。
2025“中国软件杯”大学生软件设计大赛:智能四足机器狗太空基地巡检系统赛题发布!
“中国软件杯”携手百度飞桨与宇树科技,共同打造以“智能四足机器狗太空基地巡检系统”为主题的赛题,聚焦大模型+智能机器人融合应用,全面锻炼选手的AI技术落地实践能力。
飞桨黑客马拉松第八期6月收官
截至6月,飞桨黑客马拉松第八期即将进入收尾阶段。本期黑客松设置开源贡献个人挑战赛、FundableProjects、飞桨护航计划集训营及全新的飞桨正式实习招聘四大赛道,吸引全球开发者围绕飞桨核心技术难题展开攻坚。
22个重点开源任务、3个硬核项目研发工作在本次赛事中取得突破性成果。赛事不仅提升开发者技术能力,完善飞桨开源项目功能,更推动技术成果向产业转化,为行业储备人才,成为驱动深度学习开源生态进阶的重要引擎。
华南师范大学第六届人工智能算法挑战赛
2025年6月,飞桨星河社区与华南师范大学联合举办的第六届人工智能算法挑战赛圆满收官,该赛事作为双方四年合作的标志性成果,已成为区域AI领域人才培养与技术交流的标杆。
本届赛事吸引307支跨校、跨专业团队参赛,覆盖华南师范大学多院系及北京航空航天大学、深圳大学等外校学子,围绕PaddleNLP、Text2SQL等前沿技术命题,以“以赛促学、以赛促研”模式推动产学研深度融合,加速理论向产业应用转化。未来,双方将持续深化合作,培育复合型AI人才,助力区域AI生态发展。
2025IKCEST国际大数据竞赛报名开始,大模型首次加入
本届竞赛在教育部高等学校大学计算机课程教学指导委员会及丝绸之路大学联盟的指导下由联合国教科文组织国际工程科技知识中心(IKCEST)、百度公司及西安交通大学共同主办。竞赛旨在放眼“一带一路”倡议沿线国家,通过竞赛方式挖掘全球大数据人工智能尖端人才,实现政府—产业—高校合力推动大数据产业研究、应用、发展的目标,进一步夯实赛事的理论基础与实践基础,加快拔尖AI创新人才培养。
2025年第十届全国大学生生物医学工程创新设计竞赛(眼球翼状胬肉分割与诊断挑战赛)
该赛事作为飞桨星河社区重要赛事之一,6月进入赛事中期阶段。大赛由中国生物医学工程学会主办,西安交通大学(生命科学与技术学院、生物医学与健康工程研究院)承办,陕西省生物医学工程学会协办,旨在引导学生在临床应用导向下开展研究,提升综合问题解决能力,培育创新与协作精神,推动生物医学工程学科发展及产学研用深度融合。赛事获深圳市眼科医院数据支持,华南理工大学医疗大数据与医学智能实验室、中国计算机学会(CCF)数字医学分会提供技术支撑,飞桨星河社区进行赛事承接工作。过程中吸引全国424名学生报名参与,为生物医学工程领域卓越人才培养搭建了优质实践平台。
2025百度商业AI技术创新大赛
该赛事是面向全社会开放,高等院校、科研单位、互联网企业等人员均可参与的全国性技术创新大赛,旨在探索商业前沿技术、挖掘培育优秀人才。
本届赛事聚焦“生成式广告推荐算法优化”“视频广告生成推理性能优化”“搜索场景视频广告AIGC产品优化”三大核心议题,为参赛团队提供百度商业海量脱敏业务数据支持训练及测试,促进业内交流与产教融合,推动算法与技术应用创新。目前参与人数2000+。
飞桨星河社区作为本次大赛的承办平台,深度参与赛事运营,助力技术人才与产业需求精准对接,为AI技术创新与商业场景融合搭建实践桥梁。
LIC·2025语言与智能技术竞赛
该届赛事设置13. 5万元奖金,已于6月30日启动,现火热进行中!由中国计算机学会(CCF)、中国中文信息学会(CIPS)联合主办,百度公司承办,联合人民日报健康客户端、智源研究院、TVB共同举办。赛事聚焦文心大模型技术栈,开设“智慧医疗领域(人民日报健康客户端)、前沿科研领域(智源研究院)、传媒领域AIGC创新(TVB)”三条赛道,共同探索文心大模型在医疗、科研、传媒等前沿领域的无限可能。
欢迎点击下方链接查看赛题详情,或扫码加入官方交流群,获取最新动态与技术支持。
赛事报名链接:https ://aistudio. baidu.com/competition
访问地址:https ://aistudio. baidu.com/competition
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录