AI项目算法落地,背后的逻辑是什么?


AI项目算法落地,背后的逻辑是什么?

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

以下文章来源于微信公众号:爱罗AI说
作者:Aleo
链接:https ://mp.weixin.qq.com/s/Ugm7hLp9qar5hjdA3m-b1Q
本文仅用于学术分享,如有侵权,请联系后台作删文处理
导读
算法能否成功落地,不只靠技术,更关乎价值判断与全局思考。本文结合实践经验,总结了在研发前、中、后期必须自问的问题,帮助算法人少走弯路,提升研发质量与落地成功率。
“如果有人问你,我为什么要买你的算法?产品集成了这个算法能带来什么改变?客户会不会为这个改变付钱?研发了这套东西要花多少成本,是否值得?不知道我们是不是都能回答得上来。但是,在实际落地过程中,这些问题是无法逃避的,前面不面对,后面就受罪。看了太多东西研发完了,事后找补价值的;也见了太多前面胸脯拍的叮当响,后面双脚不离地到处救火的。
今天我尝试着总结一下做算法落地前要问自己的一些问题,并且给出自己的答案。以此作为引子,希望能对大家有一些启发和帮助,让算法落地的进程少一些弯路。”
01

研发前要问哪些问题
从工作开始,就一直被各种灌输过一个思维,那就是敏捷开发,小步快跑,快速迭代,等你想清楚了,黄花菜都凉了,我们要在做中发现问题、解决问题,等等等等,大概都是一个意思。就跟小时候一直听书上说“父母在不远游”,然后大家就认为父母健在我们就应该陪在他们身边,不应该去看看外面的世界,但实际上还有下一句,“父母在不远游,游必有方”。投射到我们的算法研发上,也是一样,很多时候,我们的算法或产品研发,将上面的那套快速迭代模式的字面意思当成金科玉律,成了我们事先不思考的免死金牌,但这往往是算法或产品最终做失败的最底层原因。
我一直到最近几年,还是偶尔被老板私底下说,想太多了,怎么还不动?但交给我的那摊子事,往往是质量上最过硬的,交付节点最能保障的,所以他也只是说一说,也不会硬推着怎么样。时常复盘过往的工作,结合自身的经历以及看到的一些别人的经历,总结一下,研发一款好的算法产品,事先要问自己的一些问题。
1.我们的算法最终要解决什么人的什么问题?这个问题要第一个回答,它的重要性足以让我把它标红加粗,如果不是考虑排版,我还想把它字体放大。绝大部份算法产品最终是否会死掉,在做它的那个时刻就决定了,研发本身在能否成事上,并不起决定作用,事想好,人找对,绝大部分都能成。我们到底要解决什么问题?这句话单独拿出来,那就都觉得可笑,但是大多数情况下,这个问题都不能被很好的回答。你说,我们要做一款算法去识别道路上的裂缝,这个产品给谁用?监管部门还是养护部门,这两个部门关注点完全不一样,你的硬件和算法选型就完全不一样。我们面向的是养护部门,养护经费有限,那重点类别搞一搞,严重的不漏,他们能用的很好,你搞精细化了他们还嫌你事多呢。如果你是要出道路裂缝分布的检测报告,那上面的思路就不行,对应的传感器和作业模式都不一样。如果这个问题一开始就没想好,那后面研发出来再牛的算法都没用,给一个芒果过敏的人说,我这个芒果个大核小又甜,你怎么不吃呢?那不是一个道理嘛。
2.这个问题痛吗?问你的客户,你还有哪些问题想被解决?我来帮你搞,那估计他能跟你唠一个晚上。这个裂缝要检,规范上说多少多少毫米以上的都要处理呢。占道经营也要识别,路上的坑槽也要识别,那个路灯不亮了也要识别…,反正他能讲出名字的,都要。但是你实际观察他们的作业模式,别说多少毫米的裂缝了,上厘米的都不一定会关注。但是出现了一个坑槽,他们会很紧张,很快就去修。你去问为什么呢?一个裂缝嘛,又不会出事,路上有坑,车可能会翻的。什么问题是痛的,非常重要,而且,你问客户,因为他那个角色在,有时候他也不一定会告诉你,一问都重要,这些都要上,研发成本和研发周期又扛不住。我们要先解决客户痛的问题,但是有时候,哪些问题痛,还得我们自己发掘。
3.这个问题可被解决吗?要做的事确定了,就得问问自己能不能搞得定。客户让在一个非常开放的场景解决非常精细的识别问题,传感器都感知不到,或者感知稳定性不够,你说让算法稳定识别,这可能吗?
4.这个问题被解决的成本高吗?这个事情要做,我们要付出多少代价,客户能否付出能覆盖我们成本的报酬,这点也很重要。就像现在非常火的大模型,放在视觉领域,以前很多我们没法解决的零少样本问题,有了多模态大模型,我们看到了问题能被解决的可能性,但是毕竟直接使用它,现在的推理成本还比较高,客户要预算足还好,如果预算不够,我们问题给他解决了,也没意义不是。
5.这个问题普遍吗?这是个普遍的问题吗?如果是,那可以朝着做产品的方式研发,前期的投入可以通过后面的多次销售分摊成本,那在思考研发成本的时候就得重新计算了。
上面是我在看到一个需求的时候,在动手做之前考虑问题的一个模式。但是,思考这回事,容易陷进去,很多事情没做之前,没办法看到全貌,后面会遇到哪些问题也并不知道,如果逼着自己能考虑到多远以后的事情,那肯定会陷入到预设困难,加剧内耗的魔咒里。怎么应对呢?我这边的建议是,长看、中想、短做,大的方向的价值一定要考虑,中期的逻辑要闭环,沿着中期的逻辑闭环制定短期计划并不断执行,大的方向是指引我们前进的,路径可能不清晰;中期的逻辑带来能产生具体的价值要考虑清楚了,以确定的价值目标指导制定短期的计划,制定好后就无脑执行吧,一个计划执行完后再复盘要不要调整节奏。我理解,这才是快速迭代的初衷,该粗粗该细细,该省省该花花,主打一个少让自己内耗。
02

研发中要怎么做
上面的问题回答完后,你的结论是,这个事情有搞头。那后面就看看具体的研发要怎么做?一般到这里,要做的事情已经想清楚了,更多的要考虑怎么把控研发的质量和进度,控制研发成本,这里也有几个问题要问。
1.给客户输出的是什么?绝大部分AI算法都不会直接面向客户输出价值的,而是包在一个行业应用里,算法更多的是信息提供者,应用负责信息整合和价值输出。一定要确定好给客户的输出是什么,然后反推算法要输出什么?系统要输出什么?有哪些先验信息可以拿到?没有严格意义上不会犯错的算法,更多的时候设计一条友好的业务链路,可以在算法没那么厉害的时候也能解决客户的大部分问题,有时候没必要死磕算法,面向产品价值输出考虑技术方案,可能更有利于做好产品。
2.算法在里面承担什么角色?从外往内拆解功能,整体产品考虑好以后,再看算法在里面承担什么角色,进而看看对算法有什么要求,明确算法的功能和性能边界,减少算法功能的过度设计,也在省钱。题外话一点,很多算法同学都是高学历很聪明的一帮人,容易跟自己较劲,害怕别人挑战你说这个功能咋就不能实现?然后就无缘无故的接了很多本不该被算法解决的工作,可能你也解决不了。其实,这也对搞算法的同学提了更高的要求,我们要能站在更高维度看问题,才能提出更全面实惠的解决方案,很多情况下就是,你不能说清楚为什么这个功能你可以不做,你就得做。这块做好,可能会成为算法同学的核心竞争力吧,GPT这块能力现在还不行。
3.给算法多少资源?功能和性能边界定好以后,就得考虑有多少资源给我们做事,这块也很重要,特别是给算法运行的硬件资源,CPU,GPU,内存,总线带宽,硬盘读写等等,都要考虑清楚,才不至于研发过程中陷入死胡同。
4.数据怎么来?这块是决定算法的性能指标能做到什么高度最重要的点了,即使是大模型横行的时代,数据依旧是算法性能达成的最重要因素。我们的方案中是用真实数据还是合成数据,还是都用,配比是多少?真实数据哪里来?怎么从海量数据中低成本发掘有价值数据?数据仿真怎么做?怎么降低标注成本,提升标注效率?甚至,怎么防止陷入到和标注公司无尽的扯皮中,这些都是能否搞出NB算法必须要考虑的事情。
5.判断算法好坏的标准是什么?这块在研发前期也得确定好,算法这东西,它底层的原理和能力现在还是攥在一小撮人的手里,大部分人对怎么评价一个算法的好坏并不了解。你做了个算法,有可能已经很厉害了,别人可能认为怎么这么简单的东西都识别不出来。在研发初期我们就得想办法和验收工作的人对好评价算法的方式,以及承诺的预期指标,这块得细,得具体,要不以后就是无尽的扯皮。我们不是要做苹果树的识别吗?怎么冬天叶子掉光上面有积雪的苹果树咋识别不了了,你一口老血没喷出去,刚想解释我们不支持冬天下雪没叶子的场景的时候,别人来了句,那棵是不是苹果树你就说吧,这个时候再欲哭无泪也没用了。
上面问题回答好了,其实从算法要解决问题的边界,算法方案,数据和算力,到评价标准这一大块闭环逻辑都建立好了,剩下的执行工作将会变的轻松很多,当然不一定是身体的轻松,更多的是心里轻松。我相信,后面才是绝大多数算法同学最享受的时光。
03

交付后就结束了吗
上面有我自己的思考,经验总结,也夹杂着这么些年工作中血与泪的教训,希望梳理出来,能对大家有所帮助。
欢迎加入《AI未来星球》,一起成长
扫描下方二维码即可加入~
你可以获得什么?
1、大白之前花费10W+购买,AI行业各场景私有数据集下载,星球内倾情分享;2、AI行业研发、产品、商业落地问题咨询(目前AI公司创业中),都可获高质量解答,有效期一年,无限次提问,有问必答。3、定期邀请AI行业各类嘉宾分享,创业/商业等方面的经验!
帮助你解决遇到的实际问题,升职加薪!
大家一起加油!


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录