仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
在人工智能技术飞速发展的当下,百度飞桨作为中国首个自主研发、开源开放的产业级深度学习平台,持续推动行业发展。飞桨框架3.0、低代码开发工具PaddleX等最新技术产品,在武汉人工智能计算中心完成测试部署。飞桨携手武汉人工智能计算中心,通过整合飞桨的先进技术与本地算力资源,为武汉乃至全国企业、开发者提供高效、普惠的AI开发与应用支持。
打造AI产业化的核心引擎
武汉人工智能计算中心是在科技部、湖北省委省政府、武汉市委市政府大力支持下,由武汉东湖高新区政府承建,湖北省科技投资集团建设及运营的国内首个具有公共服务性质的人工智能算力基础设施。作为城市新型公共基础设施,不仅为企业、组织机构、科研院校等提供公共AI算力服务,还对外提供应用创新孵化服务、产业聚合发展服务、科研创新和人才培养服务。构建本地生态发展团队,通过算力+生态+技术优势为合作伙伴提供全生命周期服务,全链条服务上下游企业。
计算中心内飞桨产品矩阵:
技术底座与行业解决方案双轮驱动
飞桨深度学习框架
开源开放的产业级技术基座百度飞桨框架(PaddlePaddle)是国内领先的深度学习平台,覆盖从模型开发、训练到部署的全流程工具链。其开源特性与灵活架构支持多种硬件适配,助力开发者快速构建AI应用,助力开发者快速实现AI想法,快速上线AI业务。截至2024年11月,飞桨文心生态已凝聚1808万开发者、服务43万家企事业单位、创建101万个模型。帮助越来越多的行业完成AI赋能,实现产业智能化升级。
飞桨深度学习框架架构图
飞桨低代码开发工具(PaddleX)
基于飞桨框架构建的低代码开发工具,它集成了众多开箱即用的预训练模型,可以实现模型从训练到推理的全流程开发,支持国内外多款主流硬件,助力AI开发者进行产业实践。
飞桨低代码开发工具(PaddleX)架构图
飞桨大语言模型开发套件(PaddleNLP)
一款基于飞桨深度学习框架的大语言模型(LLM)开发套件,支持在多种硬件上进行高效的大模型训练、无损压缩以及高性能推理。PaddleNLP具备简单易用和性能极致的特点,致力于助力开发者实现高效的大模型产业级应用。
飞桨大语言模型开发套件(PaddleNLP)架构图
飞桨多模态大模型开发套件(PaddleMIX)
基于飞桨的多模态大模型开发套件,聚合图像、文本、视频等多种模态,覆盖视觉语言预训练,微调,文生图,文生视频,多模态理解等丰富的多模态任务。它提供开箱即用的开发体验,同时支持灵活定制,满足不同需求,助力探索通用人工智能。
飞桨多模态大模型开发套件(PaddleMIX)架构图
拳头产品PP-ChatOCRv3:
助力算力中心拓展大语言模型功能边界
PaddleX-文档场景智能信息抽取(PP-ChatOCRv3)融合OCR与大语言模型(LLM),突破传统文本识别局限,实现从文本识别到语义理解与知识推理的跨越升级。
产品亮点
多模型兼容:支持基于OpenAI接口的大语言模型切换,如文心ERNIE、DeepSeek等主流大模型
高效抽取:提供数据缓存加载方法并集成向量检索技术,降低多页PDF文档信息抽取成本
升级自定义提示词工程:KEY从单一关键词到涵盖问题描述、提取规则、少样本学习等方面
工业级落地:覆盖金融/法律/制造/物流等九大领域
多模态深度解析:处理多页PDF/图像中的生僻字、印章、表格等复杂元素
国产化适配部署优势:大模型调用优化,开箱即用
PP-ChatOCRv3系统流程图
PP-ChatOCRv3能够将思考过程通过额外的reasoning_content输出字段进行返回。该字段为一个列表字段,包含了PP-ChatOCRv3多次调用大语言模型时的思考结果,通过观察这些思考结果,可以实时查看AI提取信息的逻辑路径,利用这些思考结果可以分析模型决策依据,优化提示词设计。
接下来,我们将以一个具体的法律法规文档信息抽取任务为例,使用DeepSeek-R1模型作为调用大语言模型在PP-ChatOCRv3中进行关键信息抽取,并简单探究DeepSeek-R1模型的思考过程。
首先,您需要下载测试文件3(下图),然后更换以下代码中的api_key并执行:
在执行完成上述代码后,可以得到的结果如下:
{‘chat_res’:{‘reasoning_content’:[‘好的,我现在需要处理用户的查询,从OCR识别结果中提取指定关键词对应的信息。首先,用户提供的OCR文本是关于《勘察设计注册工程师管理规定》的内容,关键词列表是“该规定是何时公布的?”。我的任务是找到这个问题的答案,并以JSON格式返回。\n\n首先,我需要仔细阅读OCR文本,寻找与“公布时间”相关的信息。通常,这类法规文件会在开头部分提到公布日期。快速浏览OCR内容,开头部分确实有提到:“(2005年2月4日中华人民共和国建设部令第137号公布自2005年4月1日起施行)”。这里有两个日期,一个是公布的日期2005年2月4日,另一个是施行日期2005年4月1日。用户的问题是关于公布的日期,所以正确的答案应该是2005年2月4日。\n\n接下来,我需要确认OCR文本中是否有其他可能的日期或相关信息。继续查看后面的章节,比如第一章总则和后续条款,主要涉及注册工程师的管理规定,没有提到其他公布日期。因此,可以确定答案就是开头提到的2005年2月4日。\n\n然后,我需要确保答案格式正确。用户要求返回JSON,且每个关键词对应一个值。如果找不到答案,则设为“未知”。这里显然找到了,所以JSON应该是{“该规定是何时公布的?”:”2005年2月4日”}。\n\n最后,检查是否有其他可能的错误,比如OCR识别错误。例如,日期中的数字是否被正确识别。原文中的“2005年2月4日”看起来正确,没有明显的识别错误。因此,答案应该是准确的。\n’],’该规定是何时公布的?’:’2005年2月4日’}}
通过结果可以看出,DeepSeek-R1模型的使用,除了帮助我们完成了’该规定是何时公布的?’这个问题的关系信息抽取任务外,还在reasoning_content字段返回了其在解决信息抽取问题时所经历的思考过程,例如模型在思考时对该法规的公布时间和实施时间进行了认真区分,对返回的结果进行再次检查等。
武汉人工智能计算中心国产昇腾服务器中的PP-ChatOCRv3调用云端Deepseekapi接口测试结果:
推理脚本:
推理结果:
资源包下载地址
扫码一键获取飞桨-昇腾资料包:
https ://paddle.wjx.cn/vm/mBbZmkV.aspx#
飞桨PaddlePaddle
新型算力基础设施是数字经济时代的关键支撑,对于助力国家竞争力提升以及促进技术融合与创新等方面发挥着重要作用。基于此背景,飞桨推出了智算融合·生态赋能计划,以飞桨产业级深度学习平台为基础,旨在联合各国家级、区域级重点算力服务平台或算力中心,在技术、运营、生态等方面推动深化合作,打造围绕算力+算法的人工智能基础生态,最终面向行业、区域、场景三个层面,结合行业数据、场景数据促进各行业各区域企业AI应用落地、产业共建。
当前该计划合作伙伴包括国家超算互联网平台、苏州市公共算力服务平台、四川省算力调度服务平台、广州人工智能公共算力中心、武汉人工智能计算中心、国家(上海)新型互联网交换中心等,旨在以核心算法、AI模型为基础,链接算力·数据供需多方,发挥“算力、算法、数据”AI全要素价值,为数字经济发展注入强大动力,共建算力合作新模式。
【智算融合·生态赋能计划】
面向广大开发者、企业提供普惠算力服务
持续联合各地区算力服务平台针对各行业典型问题开展实战营活动,手把手指导企业开发者解决业务痛点
面向国产化浪潮,飞桨基于国产算力提供企业专属技术支持服务,旨在帮助企业顺利完成国产替代转型
基于人工智能三要素拉通各行业、各区域生态合作,共同助力企业智能化转型
持续输出百度AI技术能力,助力算力平台提供高性能、更稳定、更丰富的人工智能算力服务
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~