开单效率暴增30倍!“数字销冠”的AI密码:飞桨+文心大模型双引擎驱动
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
一家在成都做火锅食材批发配送的公司,每年销售额能达到数千万元,老板王总却长期因一个简单的业务流程而头疼——销售开单。在商贸批发行业,开单是库存、往来核算的重要数据来源,其效率与准确性直接关系到企业的运营管理效率和客户满意度。
公司销售每天开单100-400个,涵盖食材种类几百种,涉及500家左右上下游供应链管理和销售服务,经常因为手工开单慢、忙中出乱而影响生意。怎么能有条不紊、准确快速响应下游火锅店的采购需求?这个问题一直让这家只有三十多个人手的公司犯难。
从前他们的方法是:上人手、加班熬,“就这样还经常会出错”王总自己也吐槽。
下游客户每天要货20-30个品种,销售人员一行一行录入要5分钟左右。去年底,这家食材批发公司启用了“好业财多模态智能开单”功能,通过语音录入、拍摄手写订单以及图片上传等方式,让销售人员服务单个火锅店客户下单的时间,从5分钟直线缩短至几秒,效率提升近30倍,准确率依然保持在90%以上,极大地解决了开单效率低的痛点,销售员们称这项功能是“数字销冠”。
“好业财”是畅捷通信息技术股份有限公司(下称“畅捷通”)旗下一款面向小微企业的业财管融合数智经营平台。2024年8月,该产品开发上线“多模态智能开单”功能,针对性解决传统开单过程中存在的手工录入效率低、易出错、多渠道信息整合难度大等问题。在百度飞桨和文心大模型的技术支持下,能够实现语音、文字、表格、图片、PDF等多种形态的内容识别,准确理解下单商品内容和详细要求,提高开单效率。
好业财“智能开单”PC端、移动端界面
销售手工开单忙中出乱
传统识别技术效率低下
王总的食材批发公司主要经营火锅底料、预包装食材,在成都有自己的门店。
新客或散客的订货大多是线下到店进行。一张销售订单平均有二十来条商品信息,传统开单流程需要每一条信息挨个儿手敲录入财务系统,这个时间往往需要5分钟左右,而对于零售来说,客户接待时间即使只增加一分钟,都可能造成客户流失。
更大宗的开单主要面向二级批发商、火锅门店,这类开单情况则更为复杂。王总介绍,“有的客户直接手写到纸上,拍个照发给我们;有的打电话或者直接发一大串语音。”销售内勤每天都需要在各种字体不清的文字、夹杂方言的语音、模糊不清的图片中,辨别出正确的商品信息,誊抄订货清单,再一条条录到系统上。
除了效率的紧迫性和信息的复杂度,开单这件事还有工作时间上的压力。现在很多火锅店都营业到凌晨,等到店里打烊盘货,再下单有可能在后半夜了。王总认为公司现在都得考虑支持24小时订货。
“要是能把客户发来的文字、照片直接投入系统,或者像发语音消息一样说完就能转化开单,那可省事了。”王总说。
客户的需求一直促使畅捷通思考,如何让开单更高效、准确、智能。
畅捷通技术专家介绍,直到现在业界都面临两方面公认的挑战:一方面是各种噪音下的信息提取和识别,开单可能使用到格式不一的表格文件、角度像素刁钻的照片截图、五湖四海夹杂方言的口音……;另一方面是信息提取后,对其语义的理解和处理。
理想中的财务AI,既要有“千里眼”“顺风耳”,还要有一个“最强大脑”。
事实上,深耕小微企业财税及业务云服务领域十多年的畅捷通,2017年便曾尝试探索过相关能力的实现,但当时整体技术能力有限,多次尝试后识别准确率仍然不高,最终项目暂缓。
2024年,畅捷通技术专家“带题入组”,参加了由深度学习技术及应用国家工程研究中心与百度联合创办的AICA首席AI架构师培养计划(以下简称“AICA”),让“智能开单”的实现提上日程。“AICA中很多课程刚好与我们的需求相关,组内很多伙伴,这个过程中百度为我们输入了很多新技术支持,我们也做了非常多尝试,推动着智能开单项目不断迭代。”
“大小模型结合”
PaddleX助力快速响应精准识别
“我们监测发现,客户对于开单全流程的心理预期是10秒以内”畅捷通技术专家介绍,一旦一批订单从上传到生成确认的时间超过这个数值,“客户群就会出现较多意见反馈,认为还不如手动输入来得顺畅。”
相比起小模型,大模型的数据处理计算时间长,考虑到效率需求,畅捷通转变完全依赖调用多模态大模型响应的模式,调整为“大小模型结合”的技术策略,将轻量级专业模型进行适配微调后,通过飞桨低代码开发工具PaddleX的可视化界面,直接调用具备不同识别分析能力的轻量、产业级模型,再将识别内容交给文心大模型进行深度语义理解和分析,既能保障准确率,又进一步提升了响应速度。
开单问题之所以复杂,就是因为单单图文识别一个板块,就可能面临多种复杂的业务情景。比如能不能在开单系统中直接上传与客户的聊天截图、PDF文件,甚至有时是客户发来一张自己在纸上手写订单的照片,或者开单业务员接待客户时自己用纸笔记录的手写单据。这对不同拍摄角度、光线、图片像素和格式下信息的提取能力,提出了更高的要求。
针对这一问题,畅捷通选择了由飞桨团队自研的轻量级深度学习模型PicoDet_layout_1x。该模型专门面向文档版面分析而开发,专用于定位图像中的文字、表格、图片等结构化区域,并支持中英文混合场景的复杂版面解析。作为PaddleX支持的专用产业级模型之一,能够解决文档图像中多元素(如表格、标题)的定位问题,不仅高精度,更有低计算开销和端侧部署友好等特点,正适用于工业级文档处理场景。
好业财“智能开单”的图文识别能力展示
电子表格,是开单业务员常用的订单信息汇总方式。有时客户订货也只甩一个表格过来,但上下游各环节商家都有自己的订单统计习惯,表头制式、单元格合并都不统一,对于AI来说识别起来难度反而比单纯的文字识别难度更大。
针对这一问题,畅捷通技术团队选择了专门面向表格解析的轻量级深度学习模型SLANet。该模型核心设计包括行列定位、单元格合并检测等模块,解决了传统表格模型无法识别合并单元格的痛点。通过PaddleX的低代码开发能力进行集成与优化,两者结合可构建高效的文档智能分析解决方案。
畅捷通结合PaddleX提供的文本检测、版面分析和表格解析等模型协同能力,快速实现了从文档图像结构化解析到业务落地的全流程开发。同时,PaddleX强大的部署能力支持高性能推理插件,旨在实现对模型端到端推理流程的显著提速,可将PicoDet_layout_1x和SLANet优化为更适合端侧设备运行的版本,进一步提升其推理速度与资源利用率。据了解,相较于通用商用表格等识别服务,畅捷通基于PaddleX框架进行专用模型微调后,在图片文字等形式的销售开单场景,识别准确率提升了近一倍。
大小模型结合的技术实现流程
装上“更强大脑”
文心大模型驱动财务分析升级
通过上述轻量级专业模型解析并提取信息后,还要对信息进行结构化处理:抽取出商品名称、数量、计量单位以及更为复杂的规格等信息,对照这些信息在商品库中做语义逻辑关联和数据匹配。此时,小模型泛化理解能力相对有限,需要“更强大脑”文心大模型解决问题。
智能开单中对于泛化理解能力的要求场景非常多样,例如:
场景一:图片表格识别开单时,上下游商户之间对于同一商品的称呼并不相同,比如“土豆”,在不同商家订单中可能被称为“洋芋”“地蛋”“马铃薯”等。
场景二:语音输入开单时,客户一般会一次性念十几二十种商品,除了数量多,更难的是,用户口音差异可能会导致生成内容存在误差,比如王总的火锅食材配送开单时,曾将“独大蒜”识别为“毒大蒜”,“包包菜”识别为“巴巴菜”,“鲜苕粉丝”识别为“轩少粉丝”,“绿豆粉”识别为“罗豆粉”等。
畅捷通技术专家介绍,通过提示词工程告知文心大模型输入项为商贸企业的场景需求,基于其自身优异的理解、生成、逻辑、记忆能力,便可以将拆分召回信息对比商品库进行精排,准确理解和识别产品。
针对语音输入时容易产生的同音和谐音干扰,团队优化了召回算法,先通过商品库进行初步召回,再借助大模型进行精细排序。此外,畅捷通团队还开发了记忆模块,用于记录人工纠偏信息,以便在再次识别相同内容时快速调用,显著提升了响应速度。据介绍,这些措施有效提高了语音输入的召回准确率,尤其是针对原本识别率较低的情况,提升幅度超过50%。
现在,像王总一样的商贸批发企业,一旦有下游客户要货,就可以直接把截屏图片、聊天内容粘贴到开单界面,或者通过语音输入实现快速开单。后台识别确认该单无欠款并且有货,AI就能按规则自动进行审核,系统自动生成销货单。一张平均20-30件商品的销货单,传统手工录入需要5分钟左右,现在通过“好业财智能开单”功能,可以在10秒左右完成“输入、识别、理解、生成、审核、开单”全流程,企业平均一天使用智能开单功能的数量超百个,大客户促销高峰时支持企业单日开单上万个。
随着AI功能的不断布局,畅捷通进一步基于文心大模型开发了智能体“小畅AI助理”,并将针对产品使用的智能客服和部分AI业务执行接入其中。
目前,客户提出产品功能使用相关问题时,AI可以调取相关知识库,基于文心大模型的充分的理解生成能力,进行客服功能的内容回复;同时,客户还可以通过“小畅AI助理”对财务报表进行交互,例如输入“请进行销售数据统计分析”并说明重点希望看到的指标,AI便可快速进行数据概览、详细解读,还能实现对数据的可视化展示。通过可视化指标的切换,能够细致到按业务员等不同维度对销售额情况变化进行归因分析。
低门槛、一体化
实习生“徒手”两周部署搞定
基于多年来对AI技术的探索经验,畅捷通对市面上的大小模型和开发工具进行了全面的测评,最终确定了“飞桨+文心大模型”的技术组合方案。
一直以来,飞桨为文心大模型快速发展提供核心支撑,从性能、开发效率和硬件适配三端优化。飞桨框架还集成四项关键能力——自动并行、编译优化、训推一体、跨硬件兼容,显著降低大模型开发门槛。依托芯片到应用的四层技术布局,百度AI技术正加速驱动AI在产业与科研领域的落地应用。
“百度的技术产品,在训练、推理、部署一体化的能力表现很好。”畅捷通技术专家介绍,首先,学习成本非常低,原先算法工程师才能完成的项目,现在依托低代码开发工具PaddleX,一个实习生就能完成模型微调、训练和部署;其次产品操作逻辑简单反馈速度快,部署完成后就能进行验证,若需优化,可以直接在系统内调整提示词提升AI性能。
由于产品表现好、准确率稳定保持高位,越来越多业务场景和数据形式被拓展出来,各类合同识别录入、财务分析等功能也在陆续开发中。未来,更多财务功能入口将逐渐统一到“小畅AI助理”,用户只需通过自然语言输入指令需求,并结合文心大模型的多轮对话能力,即可完成不同流程的工作处理。
好业财希望能够通过人工智能的布局和落地,实现基于人机交互的数据分析和洞察,让AI成为解放传统财会专业人员的数字助理,将其从原先滞后的审核流程工作中解脱出来,进阶到提前发出财会层面的决策预警,推动财务安排更加合理和精细化。
未来,百度AI也将与以畅捷通为代表的更多财务智能化服务企业携手,助力AI融合到真移动、易交付、智能化、行业化、平台化、生态化的“业财管融合”SaaS服务中,拓展更多场景化功能,为企业客户提供更广泛的技术连接以及全方位的数字化管理服务。
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~