北京儿童插座价格联盟

AI:因何纷纷扎入零售场景?

楼主:机器人指南 时间:2020-07-31 16:44:25


“我们相信零售会成为我们第15个营收过千万的行业。”商汤集团总经理尚海龙说。


近三年,商汤代表的计算机视觉公司以算法和更高的精准度打破海康、大华等传统巨头的藩篱,闯入相对封闭的安防领域。



随着安防市场的红海化,恰逢线下零售的升级换代,2017年下半年,视觉技术里大小玩家纷纷押注零售,安防领域的AI明星在思量这会不会成为下一个高地,在小众领域耕耘已久的潜力股,也在期盼得到走向台前的机会。


“通过技术赋能效果展现了以后,我相信整个零售行业真正进入了从商品或服务来要利润,转成向数据要利润,大家能够意识到数据的价值,这个意识的转变是伟大的。”


但是零售场景的分散化和多变性给新技术带来了莫大考验,也让市场更加不确定。人工智能视觉能否被一片传统土地接纳,这是场复杂得多的践行。


看清人脸是基本功


顾客在闸门前面对摄像头站定,数秒后连接摄像头的屏幕上出现机器采集的人脸,即完成身份认定,购物结束再次刷脸可支付离店。在苏宁体育Biu门店里,这张脸也正是用户的逛街ID,摄像头以及背后的机器兢兢业业地记录着:男,25岁,在耐克鞋前停留时间较长,购买了一顶鸭舌帽。


2017年,尤其是下半年,随着新零售、智慧零售的概念落地,视觉明星们也陆续杀入其中,包括商汤、旷视、依图、图普、阅面等等。它们以“刷脸进场“和“刷脸支付”占到一席之位,商汤与苏宁联手,旷视拿下了阿里巴巴的淘咖啡,图普把技术铺到了天福超市、EasyGo以及OPPO……


两项功能被广泛应用于无人门店和升级改造中的传统零售店,这也是目前视觉技术最被熟知的功能,最直接的效果是可以简化收银环节,节约成本。


当然,初出茅庐,在陌生的零售场域打拼容易么?


“AI不具备普适性,没有万能的,不同场景对算法的要求不一样。相比安防和金融,零售的场景太复杂多变了。”一位视觉产品经理感叹道。


据透露,目前的刷脸技术其实相对简单。“市场上提供的算法多是正面底库识别,这种门禁模型做线下零售是有一定的问题。线下零售要做到无感知,可能不是通过注册的人脸做识别,而是第一次进店的抓拍作为底库,可能光线不好,可能有遮挡,可能是侧脸,这就需要专门的训练。”


尤其是涉及支付环节,必须人为设置固定的静态场景,强制要求消费者配合,即便是人脸识别老大商汤所搭建的苏宁Biu店也依托于闸门。


“现在谨慎一点的,像各大银行ATM刷脸取款增加六位密码确认;大胆一点的,像苏宁门口有闸机,结账一个个排队,这样支付环境有固定的静态场景,准确率基本可以做到百分之百。大量的动态比对会成问题。”尚海龙说。


理论上,机器视觉不是没办法抓取非配合条件下的动态人脸,火车站里抓捕逃犯就涉及到人脸检测、特征提取、比对多项技术,机器先在一帧视频中框出所有的人脸,然后挨个与公安机关的照片数据库对照。但问题在于,场景的变化要求对算法同步调整优化。


公开数据显示,商汤2017年有20亿张人脸数据,2亿个体训练,达到9位密码时代。


进场之后,靠脸的可能性也不大了。


“一说到视觉技术就想到刷脸,其实这是最为简单基础的功能。”林捷说,“进场之后拍不到人脸,靠体态识别这个人,知道他拿了什么商品,这比较难。”


业内公认的、视觉技术应用的极致表现为Amazon Go,全程通过机器捕捉看了什么,拿走了什么,离店后自动扣款,当然,为确保准确性,Amazon Go还采用了重力感应器、二维码、红外感应器等辅助技术。


你们这方案多少钱?


“零售毛利低,对每一笔投资都会非常谨慎。相应而言,它是一定要看到效果才会投资。”尚海龙说。


从安防到零售,作为服务方的计算机视觉公司明显感知到客户预算的锐减。


后台分析是店里配备小型硬件处理站还是走云端,包括私有云、公有云还是混合云,厂商们提供了开放选择。图普负责零售产品的刘凯解释称,上不上GPU由客户需求决定,云端分析处理的好处是及时性更强,刚到店的客人马上就能被识别出来,模型、程序的更新也是在云端完成,无需人工干预,但是对网络传输要求高;本地化分析则几乎不占用忙时带宽,在本地分析完后再在闲时将分析结果上传到服务器。


“根据客户实际的需求以及资源的限制来做选择,没有最好的,只有最适合的。”刘凯说。


相机有原本线下就在用的几百块的普通摄像头,也有动辄上千的深度版,还有方案提供商自主设计的独家产品。


普通相机是单目的,2D成像,而深度相机通过双目或3D结构光或加红外模组实现3D效果,也就可以知道物体离相机多远,当然价格也更贵。


“我们现在用2D相机,通过算法模拟3D,当然,如果用深度相机模组可以更准,但成本太高了。”一位产品经理表示。


原有的设备可以用起来。“原来已经投资过的东西我们不会进行破坏性的损伤,摄像头我们要200万像素以上就可以,原来超市里已有的摄像头直接就可以用,并联进我们的系统就可以。“尚海龙表示。


图普向天福超市提供的改造方案正复用了原有摄像头,对接CRM系统拿到会员头像和消费记录,自动识别VIP,精准发送促销广告。


如何把握效果和成本之间的天平,是初来乍到玩家的必修课。


“如果不计成本的话,我们的精度早就上去了。”简24创始人林捷说。


懂零售


一套设计方案中,算法、硬件、 场景互相适配,构成一个完整的三角形。方案设计得是否符合“商业的逻辑”,很大程度上取决于对零售的理解程度。


零售是创新工场AI工程院今年的主打行业,联合创始人王晶表示,人工智能团队当中要有行业专家,每次见客户最长的时间花在了解对方的实际业务上。


刘凯告诉亿邦动力网,不同类型的零售商间差异会比较大,但即便同一类型的零售商客户,在管理上的需求也存在很大差异。


“做家居的客户会希望我们能按家庭的维度去识别客户,而卖日用品的客户可能更急迫于知道有哪些人是回头客。在同类的零售商中,根据客户自身管理目标的不同,共性的需求也会在指标要求上有差异,如对准确率、召回率的要求有所不同,差异化的个性化需求,未必在整个行业间通用。”刘凯说。


王晶认为,方案的优劣不仅取决于算法,很多时候是工程上的问题。“比如,要从用户的整个流程体验的角度考虑,怎样有一个很好的结账流程,让用户感觉更顺畅,反之不管技术多炫酷,如果用户不舒服,商家都不会买单的。”


林捷总结出来一套经验:不要让技术花时间在运营能够解决的问题上。“几十个人挤在柜台前结账,这样的场景就不要让视觉科学家去研究了,机器分不清楚谁买了什么,就让顾客排队好了。”这些取舍建立在零售业的理解上,技术大咖补课不足就容易掉坑。“有的(方案)为了做到更好的商品识别效果,会加高货架的层高,降低层数,一般货架有5到6层,变成了4层。”林捷强调,这是损伤便利店平效的本末倒置,“如果了解零售,绝对不会在技术设计上牺牲平效的。”


商品识别方兴未艾


要实现对人货关系互动的记录以及无人结算,绕不开谈商品识别。这也是视觉科学家在争夺的新高地,“前几年我们刷榜刷的都是人脸,刷烂了,现在物体是最难的。”一位业内人士透露。


去年,旷视参加了COCO竞赛的物体检测、人体关键点和物体分割三个单项比赛,获得两个第一和一个第二。码隆科技取得了 WebVision竞赛的第一名。


相比人脸识别,商品识别还徘徊在起跑线上。传统商超、便利店和品牌店升级改造,都一般采用条形码、RFID这些“老古董”技术,即便缤果盒子这样的创新项目也启用了RFID。


“因为RFID是一个比较偏成熟的方案,最早选择它在创业上是make sense(说得通)的。图像识别技术可能更领先、挑战更大。”华映资本投资总监姜志峰说。


总得来说,人脸相对标准化,可以把人种作为单独训练模型,而零售涉及的商品SKU多而杂,每个类别单独训练难度大,不可控性更高。机器识别每张照片的基本逻辑是:每张照片有向量,即多组数字,某几个组合起来代表袖长、颜色、款式等特征,机器根据数字判断自己“看见”的是啥。但是,如衣服这种柔性物体易变形,不同穿法或者扭曲、折叠在图片中像素排列不同,让计算机明白它们是同一件的不同形态很难。


此外,现在人脸识别已经可以把算法做到手机里,比如刷脸解锁,而物体识别暂时还要基于GPU或者X86这种高性能的硬件架构,成本较高。


“WebVision竞赛上李飞飞给我们颁的奖。”码隆创始人黄鼎龙强调。


和旷视不一样,物体识别是码隆们安身立命的根本。此外,国内市场上头部玩家还有衣+、Visenze。


与人脸识别早早收割了安防的麦田不同,商品识别长时间以来被认为应用场景不明确,空有技术难变现,玩家们在漫长的商业化探索中走出了不同的万里长征。


三家业务都在电商上下了大力气。码隆和衣+最初做的都是以以图搜图为核心的to C产品,类似淘宝“拍立搜”,后来转向2B服务,一个建立了Product AI平台,将识别能力开放给电商平台、品牌、图库等商家;另一个则锁定了媒体和大屏等,比如,在优酷视频上即看即买,跳转进入淘宝购物,即通过衣+的技术实现。


“线上的调用量在缓慢增长。”黄鼎龙说,从码隆的经验拉里看,线上市场有需求,但不会迅速爆发。为更快打开市场,码隆还把精力投向商家后端,比如,利用图像识别技术实现一键生成产品详情页功能。


黄鼎龙认为,经过几年的数据积累和算法迭代,加之新零售风潮愈来愈热闹,商品识别应用于线下的机会到了。


“这个事情能不能成立取决于是否useable(可用的)和useful(有用的),一方面,在技术上要达到基本可用的状态,这是很重要的前提条件,别人试了不work就不行;另一方面,也得有用,17年随着零售领域的(兴起),大家开始觉得有用。“黄鼎龙说。


大而无当还是前途无量?


商品识别是不是真的“useful”,即能否商业化、是否值得研究尚存争议。

图普科技和商汤暂时都还未涉及。“厂商对这方面热情还比较高,但可能需求不够聚焦,如何深度结合实际业务还需要探讨。”刘凯说。图为使用RFID的CITYBOX。



“商品的识别有一些创业公司在做,术业有专攻,市场这么大,我们做好自己的事情就好了。我个人判断它(机器视觉识别商品)的价值意义没那么大。”尚海龙介绍称,苏宁Biu店卖球鞋、运动衣,感应电子标签(RFID)即可结账。


RFID在服装行业尤其受到欢迎。“视觉技术可能在某些产品上取代RFID,服装可能比较难。“马克华菲CIO兼任电商总经理左敬东说。


马克华菲有100多家智慧门店,商品配置RFID标签,通过物联网识别器,消费者试穿衣服时站到智能试衣镜前,大屏可自动识别商品ID,向消费者展示模特试穿效果、产品介绍、评价、相关搭配等内容。


除了前端展示,RFID在后端零售库存管理上优势明显。“正常门店进行库存盘点,3000件衣服,2个人,原来需要半天到1天时间。利用RFID芯片,用扫描枪片式感应进行群读扫描,1个人,仅需15分钟就能完成全部盘点。”茵曼母公司汇美CMO肖海坤表示。


不过,RFID也有未解决的难题:每件商品都要加贴至少三四毛钱的标签,人工和材料成本高,且遇金属和液体等不识别或效果差。


除了机器视觉和RFID,市面上的还有消费者自己拿商品扫码结账、重力感应等方案。如下图物美超市的自助收营台。



“扫码对商户来说成本低且简单,但建立在信用基础上,盗损大,且顾客自己动手影响用户体验。重力感应是老技术在零售领域的新应用,无法判断具体哪件商品,知道哪个货架被动过。”


陈海波本人是机器视觉忠实拥护者,“未来商店一定是没有营业员,商品、编码、条形码不存在,商品一定要能够被远距离非接触识别。”


用视觉技术识别货架商品在国内少见,土生土长的Yi+也打算深耕。“国内的快消公司相对传统,我们的本土优势比较明显,而且以服饰和商品识别起步,在零售方面也有优势。”销售负责人称。


他表示,货架识别在国内处于空白状态,快消品公司也有迫切需求。“它们一般需要向超市或者门店交纳进场费,获取货架数据非常关键,很关心自己的货摆得好不好,销售量好不好,每天有什么变化,之前都没办法及时统计。”


当然,蛋糕店和超市愿不愿意买创新工场的视觉方案,Trax能不能赚到1亿美元,Yi+能不能成功挖掘到本土客户,这些都将被2018年所检验。


“我们希望通过AI降本增效,如果两点都能做到的话,我们就会把它商业化落地,如果最后得出的结论是用视觉无法真的做到的话,可能就不会做类似的产品。顶多做点展示,表明我们有这个能力而已。”正在关注商品识别的计算机视觉产品经理说。


技术卖给谁?


陈海波喜欢向投资人就什么零售项目值得投提建议,他本身确实也在密切关注,因为这决定了技术要卖给谁。


他认为,AI技术提供方人力成本高昂,必须要接规模化的项目,而单个项目不值得投入。“如果客户开一个店做秀,没有意义的。我们要拿下市场,就必须找到具备成千上万台采购量的商家。我们的科学家很贵的,不值得为一次性项目投入。”


目前市场上的采购方从形态上看有货架、冰柜、无人BOX创业公司,也有便利店、商超、卖场等传统零售商,不同类型的门店客流量不同,SKU不同,需求也千差万别。


无人店是市场上的主力买家,其核心需求在于离店的身份识别和收银结算两大项技术,以多金、舍得砸钱给技术公司留下深刻印象。


“互联网公司是资本烧钱模式,重效果,不太讲成本,要上最好的设备。”一位产品经理透露。


不过,陈海波放出话不愿意接无人BOX的活儿。“我们调研过,根本不赚钱,短期内也难以规模化开店,中国的零售店已经很多了,没有那么大的市场空间,不是那么多地方需要。”


深兰现在的业务重心在货架和自动贩卖机的改造上:增加视觉技术,即拿即走,解决盗损问题,把它们变成货柜或者风幕柜,出售毛利率更高的鲜食、水果和便当。


参考日本市场,中国自动贩卖机的潜力还未被完全激发。而货架相比其他零售形态与消费者距离更短,也算进步。但是,技术方案商们对货架智能化节点是否到达的看法还不统一:低门槛、弱技术的货架正忙于抢位,真的有时间和金钱顾及把自己升级为智能化产品?


不可否认,创业公司愿意尝试新技术,但技术也是它们区别于传统玩家、立足市场的核心。简24选择自主研发,缤果盒子也发布了以视觉、传感器、超声波多项技术替代RFID的解决方案,并声称已引入全球顶级人工智能专家,正与国内重点211院校合作共建国际人工智能实验室。


一边是火焰,另一边则是冰山。


相比创业公司对新技术的热情,传统零售被吐槽“感兴趣看看”、“掏钱欲望不强”。虽然此类玩家有大把的“试验田”,但看过花花绿绿的PPT和demo视频,再亲自与技术提供方谈一谈,心便凉了。


当然,一位曾试图采购视觉技术的品牌操盘手也抱怨:“几平米地方的改造要好几万,还省不了一个员工,我干嘛要做?”


业内人士介绍,目前人工智能在降低成本和提升业绩上还不能发挥显著作用,难以被零售商真正地落地采购。原因在于,算法优化是一个长周期的、需要“活数据”的过程:先有一套标准算法,然后找场景落地,之后数据回流,再对回流的数据做算法的差异化训练。甚至有人推测,整个模型跑通至少需要三年时间。


“现阶段零售业对视觉技术的认知还不足,预期或过高或过低,而前者占大多数。”Yi+产品负责人表示。


从算法模型优化的角度讲,传统的连锁商超、品牌店、便利店都是不错的标的。无人店数量太少;卖场虽然规模大,但是汹涌的人流对机器运算造成不小压力。


“说实话,现在的项目是赔钱做的,我们的目的还是和客户一起成长。”一位从业者坦言。


“对于大部分AI公司来说,数据其实挺难拿的,一方面要有客户愿意一起优化,另一方面,投入的人力也相当可观,需要研究人员来做单独训练。“另一位业内人士说。


王晶表示,数据量太小的店不是早期阶段最理想的案例,优先从AI能够带来更大效应的连锁店开始,而且线下门店在线化程度低,很多时候要重新开始积累数据。“有的传统门店POS机版本太低,以前的数据都无法调取。”


AI公司通常被认为核心竞争点在于算法、数据和算力,而事实上落地能力也是重中之重。“不能忽视的是,用户反馈机制完善度非常重要,你多久拿到用户新的反馈,从而修改你的方法,节奏是怎么样的,有没有建立自动的传输流程。”Yi+产品负责人称。


这也意味着AI公司抢占市场的速度异常重要。“如果前期用技术优势解决一个商家比较着急的问题,建立起信任,然后大家一起优化方案,如果这个流程开始跑起来,其他人进入就比较难。”


终极目标是分析预测


“前端获取了数据之后的东西特别重要,可以帮助门店做销量预测、选品建议、个性化营销。”王晶说。


王晶表示,人工智能的作用不仅仅在于节省人力成本,而且可以把线下用户行为转为在线化的数据,有了数据可以帮零售店主做更多的事情。


一位业内人士讲解道,AI的落地分为感知、理解、推理关系三个环节,直到可以告诉人该怎么做的时候才是AI真正有价值的时候。


王晶说,像7-11这样的便利店选品很大程度上依赖于店长的个人经验,以销售数据为出发点,结合第二天的天气和周边环境等情况预判消费心理并订货,而人工智能可以综合更多因素做出智能化决策。


“通过摄像机等传感器,店主可以掌握消费者全流程的行为,消费者从进店起就被识别出了是谁,是不是会员,店内看了哪些东西,对哪些产品感兴趣,在哪个区交互多,结账时买走了什么东西。”


目前,市面上的视觉方案也引入了大量客户分析功能,比如,客户画像、客流统计、热点分析、动线规划等等。


在图普科技的一个公开案例中,某大型餐饮连锁每天晚上在8点半组织营销活动,经过图普科技的重新统计寻找人流量最高的时段,图普科技通过数据分析发现8点30分比8点45分差了10%的人流,比9点差了15%的人流。“同样的成本投入情况下,选错了最有概率出现最多人的时间点,长此以往会有很大损失。”图普科技CEO李明强说。


基本各家官网和PPT都有类似的案例,但是也存在质疑:这些过渡性功能一定要通过视觉技术来解决吗?


“客流分析不是这波视觉技术带来的,十年前就有解决方案了。”一位业内人士坦言。


比如,大型商场用AP采集数据,统计客流数量,通过MAC地址反向做人群画像。早在2014年银泰就推广智能机采集用户身份,大数据公司据此提供标签,从而实现精准营销。




如涉及版权等问题,请及时与我们联系,我们将在第一时间处理。


中华机器人超市-线上线下体化机器人交易平台,提供机器人厂商、产品、展会、招商、人才、投融资等全方位的服务。


朋友 图片 表情 草稿箱
请遵守社区公约言论规则,不得违反国家法律法规