北京儿童插座价格联盟

【关于大数据变现】企业家和投资人是这样说的

只看楼主 收藏 回复
  • - -
楼主

本文共计6619个字,预计阅读时间为13分钟



爱分析线下活动“析议”第2期于3月8日“女神节”如约举行,我们邀请6位大数据领域的大咖,分享他们对“大数据变现”这一主题的观点,他们分别是:数据堂创始人&CEO齐红威红点创投合伙人张涵永洪科技联合创始人谢玲百融金服副总裁陈浪仙达晨创投投资总监窦以及同盾科技副总裁孙程


活动第一个环节,爱分析分析师和6位嘉宾分别进行主题演讲,从数据源、数据技术以及数据应用等多个维度表达他们对大数据变现这件事的看法。


数据变现之


爱分析企服分析师李喆主要从大数据行业对比、大数据常见变现模式、如何判断大数据公司变现能力以及重点关注行业等方面,表达了他对大数据变现的现状与趋势的看法。


数据源的产业现状与未来趋势


数据堂创始人&CEO齐红威主要从关注哪类数据、如何采集数据以及数据如何对外提供服务等方面,阐述了他对数据源的产业现状与趋势

数据堂创始人&CEO齐红威


他把“数据如何划分”分成两个阶段,第一个阶段:按照行业划分数据,分成互联网金融、物流、教育、农业、化工等二十几个行业,当时我们主要关注人工智能、金融和精准营销领域的数据。第二个阶段:分为三大类:第一类是人库,有关用户的数据。第二类是企库,有关企业的数据,第三是车库,这是物联网一个分支,有关车的数据。

 

按数据来源对数据进行划分成四类:众包数据行业数政府数互联网数。众包数据主要依靠众包平台、利用人力去获取;行业数据是企业做主营业务时的副产品,主要以投资或者合作的形式去拿到数据。

 

政府数据分为地方政府数据和部委数据,地方政府的数据远没有整合得非常好,还没到可以对外大规模提供商业价值的时期。真正有价值的政府数据来自工商、税务、民政、,这些数据经过多年整合、汇聚,数据价值很高。

 

互联网数据实际是比较封闭的,比前三类数据的开放程度和力度要差很多。互联网数据分为两类:公开和非公开。公开数据都可以拿到,但这些数据价值不高,第一个原因是噪音很大,第二个原因是没有ID信息,只能做宏观、中观分析,现在大数据领域真正产生价值的数据变现在于微观。非公开数据掌握在BAT等大型互联网企业手里,他们的开放意愿甚至低于部委。

 

数据对外服务前要深度处理,这中间有三个环节:第一个环节是数据分析,规避隐私问题;第二个环节是非结构化数据处理;第三个环节是数据融合,包括身份关联、时间及空间的融合。最后,对外提供的应该是数据高度融合后的分析结果,将数据增值,长效模式是把增值部分做得越贴合需求、反映业务需求的深层信息,主要以API接口形式提供服务。

 

齐红威认为,初创公司最好以线下行业和政府数据作为切入点,不要从线上数据开始,互联网公司有数据,但是能公开的量不大,价值度不够深。数据融合非常重要,大数据发展到现在,很多团队都有机会获取优质数据,但问题是能不能把数据打通,这是个IDMAPPING的问题。


挖掘数据技术层的投资机会

 

红点创投合伙人张涵首先介绍了大数据行业图谱以及图谱中各个赛道的投资价值,他重点提到早期投资中要关注大数据公司的技术、销售/市场以及产品能力。

红点创投合伙人张涵


红点创投对大数据公司的技术要求很高,技术可以产生天然门槛,防止竞争对手抄袭和追赶。张涵认为,技术可以起到杠杆作用,把市场翘起来。另外,他会关注这个技术架构是不是有生命力,不想投一个过渡性的技术,这个技术至少应该有几年的领先。

 

在美国,销售和市场不是很严重,但这个问题尤为严重。以前的上市公司并购主要是为了吃进更多利润,同时增加一些概念,所以大数据公司必须保证有收入,不仅仅是技术好,还要能把产品销售出去,在市场上产生较大声音,要长期布道。

 

商业化进行到最后,一定要把技术产品化。他们之前投了一个公司,技术很好,但光找产品方向就花了两年,市场机会可能因此错过了。一定要切到目标客户的刚需,而不要什么都做,有些时候需要端到端解决方案,有些不需要。

 

最后,张涵表达了他对开源和闭源技术的一些看法。

 

闭源是传统的,开源解决很多人处理大数据的问题。但开源存在很大问题,开源技术相对学术,组织产品的能力弱,商业化能力弱。

 

很多公司在开源社区的成果作为基础创业,有个问题是如果开源社区不受公司影响,提前在某一个版本上做出产品,可能无法利用后面版本的技术,这样公司的路就越走越窄,堵死在一个错误路线上。但如果每次都跟着社区往前走,在不同情况下做定制化和产品化,工作量非常大。

 

因此,张涵建议如果想利用开源社区技术做商业化的团队,最好可以引导这个社区走向,对社区理解深,了解开源技术与真正产品之间的区别,就明白把自己做什么功能可以形成产品,然后到客户那里去验证。


大数据分析平台的机会与挑战

 

永洪科技联合创始人谢玲针对大数据分析平台服务客群的痛点进行阐述,以及永洪科技是如何促使客户成功的。

永洪科技联合创始人谢玲


面向企业客户时,一般是会碰到两个类型的部门:IT部门和非IT业务部门,两个部门诉求是不一样的。

 

IT部门通常会遇到3类的问题:首先是IT部门的资源瓶颈化。一个企业不是技术公司的话,IT人员可能最多只有企业的5%-10%,却需要服务各个业务部门,所以资源会比较匮乏。其次是工具的碎片化,因为IT人员要选择不同的工具去实现一个端到端解决方案的结果。第三是报告静态化。

 

业务部门的诉求一般是两个方面:一个是不清楚分析什么,需要大数据公司告诉他应该怎么去建模型,怎么样去构建指标;另一个是不清楚怎么分析,这时候需要大数据公司提供一套的培训体系,然后把数据化运营的最佳时间方法论交给他。


大数据风控下的普惠金融

 

百融金服副总裁陈浪仙介绍普惠金融的现状、挑战以及百融金服在普惠金融领域的大数据风控解决方案。

百融金服副总裁陈浪仙


普惠金融的有四个特点:额度小,额度最低到100,比如最近特别火的线上现金贷,会出现借100三天还的情景;分散,我们服务的机构一天数万笔贷款申请处理,这种现象很普遍;无抵押,这种贷款不像传统小贷,全靠信用;利息跨度大,年化利率从5%到300%。


普惠金融信用评估的挑战主要在于:客户信息缺失,80%-90%用户都不在人行征信系统,没有信用记录;审批时效要求高,我们合作的客户有的都是秒级、分钟级实现放款


大数据风控的机会与挑战

 

同盾科技副总裁孙程越阐述互联网黑产的发展趋势以及同盾科技的跨平台跨行业联防联控平台是如何解决大数据风控问题。

同盾科技副总裁孙程越


互联网黑产主要有以下几个发展趋势:场景多样化,黑产遍布各个场景,包括渠道分发、注册登录、交易支付、营销抽奖和留言评论,以虚假注册为例,一个手机号可以跨500多个小贷平台申请结果;


分工精细化,以猫池为例,猫池里面插的都是手机卡,用来做客户登记,这主要是注册号码领取奖励,做出客户后有其他专门的人进行提现等欺诈,从卖卡、做卡到下游黑产,整个黑色产业链非常完善;


团伙集中化,一个团伙可能控制几个设备,借此控制几千个账号,涉及成千上万的交易;


全网流窜化,欺诈行为渗透到生活各个角落,从团购到邮箱注册等。

 

大数据风控的利器之一就是“大数据反欺诈功能”,其本质是通过对大数据的采集和分析,找出欺诈者的蛛丝马迹,从而预防欺诈行为的发生。


大数据应用层的投资逻辑

 

最后,达晨创投投资总监窦勇就布局大数据行业的原因、如何布局大数据行业、市场对比以及大数据行业发展阶段等方面阐述他的观点。

达晨创投投资总监窦勇


他认为这个行业值得投资的逻辑很简单。数据量急剧放大,而数据存储成本在降低,这就使得记录人的行为轨迹的数据,能够被存储。正因如此,才需要模型算法,把数据背后隐藏的价值发掘出来。

 

通过市场对比,应该更加关注大数据应用。从资本的角度来看,美国做底层平台的公司赚钱,做应用的不赚钱,国内是相反的。国内企业客户不要平台,要解决实际问题的应用,这就是之间巨大的差异。这带来的什么结果呢?大家对底层技术不太关注,大家都是基于某一个细分领域,解决一个行业化的具体化的应用。

 

另一个角度是市场倒逼企业做应用。创业的多是硕士博士,人力成本可不便宜。一个比较好的行业数据科学家,在北京市场平均价大概是80万人民币起。对于一个初创公司来说,他有多大的资金量来承担人力成本,这就逼着企业必须做行业应用。

 

所以从底层平台来看,不如美国,但在行业应用来看,美国干不过,不能说美国的技术就一定牛。客观来看,比如互联网领域的电商数据,美国绝对没有这么大的数据量。我们电商交易平台上这么多用户的数据量,支撑着国内的数据企业能够快速发展。

 

达晨创投在布局大数据行业时,主要关注数据平台、数据存储、场景应用、数据展现以及数据安全等6个方面。

 

数据平台:数据既然像货币一样可以流通,那这里面肯定有国家银行、私人银行,我们就想找一个平台,实现这种数据流通的企业。

 

数据存储:首先,这么多数据如何存放?国家有去IOE的大趋势,数据库层面国内只有4家,达晨创投选了一家民营企业,来解决数据存放问题。其次,传统关系数据库与新型数据库之间的数据迁移在未来5-10年并不容易,因此做工具的企业会有机会。再次,下一代超融合技术代表前端存储技术,达晨创投也有布局。

 

场景应用:解决存放问题后,要考虑数据变现,也就是场景化应用。这里面把握两个原则:信息化基本完成、要有资金消耗能力,能够消费数据产品。因此,达晨创投在金融、工业、、、政务等八个行业都有布局。

 

数据展现解决场景化应用后,如何展现数据。因为数据是无形的,需要让终端客户看到思维分析的逻辑结果,这里需要有一个展现的过程。

 

数据安全数据既然是资产,是有价值的,那么数据的安全需要保护。有了数据安全,数据才能融会贯通。因此,达晨创投从芯片、通讯协议、网络、威胁情报等五个方面布局七家企业,实现对数据资产全方面维护。



嘉宾结束主题演讲后,活动进入到圆桌讨论环节,主持人和现场观众向6位嘉宾提问,主要针对大数据行业发展、技术和产品化对大数据公司的影响,以及医疗大数据和社交大数据如何变现等问题。


爱分析:从去年下半年开始,我们发现大数据行业渐渐冷下来,一方面公司融资进展放缓,另一方面大数据释放价值没有想象的大,怎么看待大数据遇冷的现象?

 

齐红威:我觉得有宏观的因素,又有微观的因素。宏观上,从15年股灾之后,整个大环境都不好,大家心理上会受很大影响;微观上,大数据疯狂投资期已经过了,现在到精挑细选的阶段了,大家会比较谨慎。

 

第二个问题,大数据产业普遍没达到大家的预期,不论收入还是发展的速度。我个人觉得是大家心理预期过高了。因为大数据的产业是2B的。从2B的角度而言,不可能像2C一样发展那么快,它需要一个时间过程,需要适应这种慢一点的节奏,这就是企业服务市场的特点。

 

孙程越:从客户来看的话,客户对大数据的要求越来越高,他们对整个大数据的理解、洞察、学习越来越高,所以对大数据公司的要求越来越高。

 

从创业公司来看,创业公司之前更多是做某一个部分,比如只做数据的收集。现在对创业公司提出的要求也越来越高。不但要对行业的理解,还要能做出基于这个行业特定场景的应用,还要有能匹配的数据。

 

张涵:2B行业确实会慢,但我觉得这个慢是在非常早期的阶段。它其实是有拐点的行业,这个拐点在于你早期需要去埋伏很多的行业标杆。因为你是比较小的公司,所以,前面谈判周期、实施周期、验证产品周期都会比较长。一旦产品被验证好了,几个行业一拓展出去,拐点来了,速度就很快。他是一个前后发展和2C领域不大一样的行业。

 

爱分析:大数据技术本身能不能建立一个特别高的门槛?


窦勇:从技术本身来看,再好的技术如果没有基于场景化的应用,也会成为无本之木,立不住脚,驱动不了。从技术的应用场景来看,数据企业都是2B业务,这些B端企业,他可能更需要解决实际的应用问题,性能指标的提高多少,对他来说可能并不是太关注。所以我更倾向于技术很重要,但是基于场景化应用的技术,才是能够解决实际问题的。

 

陈浪仙:大数据肯定有一定技术壁垒,但是信息技术的扩散非常快。美国出现一个新技术,一个月后国内就可以接触到,而且现在国内有一些单点的技术跟美国是不相上下的。但技术切入行业后,虽然我是做技术的,但不得不承认必须要跟着应用走。

 

另外我认为大数据行业有一个非常高的壁垒,那就是数据。因为数据的边际成本非常低,就会导致一种非常可怕的马太效应。早期进入的公司在数据有积累的话,相对后进入的公司,会有一个非常高的数据壁垒。

 

我认为,产品的上限是由数据决定的,数据质量好就会产生高价值。如果数据价值本来就很低,那不管用多好的算法也得不到很好的解决办法。

 

齐红威:我个人更愿意用阶段论来描述大数据行业的发展。假如满分是10分的话,现在大数据产业也就1-1.5分。无论是数据的供给方,还是需求方,都处于特别简单、特别粗暴的阶段。说实话,简单粗暴的办法就把需求满足了。

 

技术是工具、手段,不是目标,我们目标还是要解决需求。以石油产业为例,刚开始对石油的需求就是挖掘出来用于照明即可,不需要高端的提炼技术,但随着产业的发展就需要这些技术。大数据同样如此,需求会慢慢爆发出来,对技术的要求也会逐步增加。


爱分析:技术与场景应用结合中会有大量定制化开发,未来大数据公司能否减少定制化开发、实现产品标准化?

 

齐红威:就拿对大数据应用最深的金融行业而言,我们看到不同银行对产品需求是慢慢聚焦的。刚开始肯定是定制化的,因为这是新需求。随着需求慢慢聚焦,定制化部分会越来越少,供应商和客户之间还处于互相教育的阶段。

 

做行业解决方案的公司,最初试图从需求、产品、技术到数据源都自己做。如今,已经有很多做数据应用解决方案的企业,开始寻求一个数据方面的合作伙伴。因此随着产业的发展,大数据公司会分工,专注一个细分领域,这样定制化会减少。

 

谢玲:我认为通用的大数据分析产品核心一定是标准化,定制化是为了适应客户环境,主要体现在接口上。因为每个企业的门户、权限管控、单点登陆等都不一样。对行业应用而言,我们可以对标杆客户的需求进行梳理、抽象提炼,变成一个垂直应用的产品。

 

张涵我们主要投A轮之前的公司,是否定制化对我们来说不是最重要。首先得验证技术是不是在客户那边真的有需求。所以我觉得,找更有格局的团队,在最早做定制化产品时,就要想着怎么去把功能模块化、行业模板化,这样会有利于复制。投资人比较关心公司未来怎么做大的问题。如果永远定制化,那公司的人力成本就会非常高,这样不容易做大。

 

另外,当公司已经在很多行业做的很不错、积累一些优势之后,bargaining power变强时,可以把定制化工作交给合作伙伴或渠道去做。因为我们看到有技术核心的团队,它其实不是面向终端那个B,主要是靠渠道去做系统集成来服务终端客户,有些脏活累活可以包给他们,公司专心把核心产品做好。


现场观众:如何看待医疗大数据的变


齐红威:我觉得需要做数据跨界,如果只是用医疗行业的数据,为医疗行业客户提供数据服务,基本没有我们第三方的机会。医疗行业的数据是非常专业的,Know-How是我们第三方很难做到的。机会在于跨行业,拿医疗数据服务保险客户或者用保险行业数据服务医疗客户。

 

现场观众:随着国内社交时代的到来,初创公司想以社交和电商平台作为切入做数据分析,我们现在拿到四个平台的社交数据,请问社交数据如何变现?

 

张涵:我认为有几个问题要解决:小平台数据可信性存在很大的问题,有很多垃圾信息稀释了原本可以用的数据,所以做数据分析时,必须由特别强的引擎能够把垃圾信息过滤掉,把真实数据的拿出来。提高数据准确性之后才能谈数据应用。

 

很多社交属性的电商平台本身做的就不太成功,一些公司最后转型成全平台,只做电商,跟社交关系不大。如果最后落到电商行业,社交数据本身能否直接导向交易是个问题。

 

最后,多平台数据如何打通。因为你把一个平台的数据放在另外一个平台去做验证,在数据打通上也有一些问题,

 

窦勇:数据获取层如何体现独特价值。主要是指获取数据的维度,加工后数据的颗粒度、细腻度,如何基于场景化应用。凡是做数据的公司可能都有一些爬虫技术,都能获取一些社交数据,因此在做数据交易、产品化时第一个挑战是如何体现独特价值。

 

数据应用层如何体现独特价值。现在都讲究数据融合,单一维度的社交数据如何与其他公司多维度数据去竞争,价值体现在哪里?初创公司又不可能往上层应用走,不然会与数据应用公司竞争,商业模式会变得非常重。



文章来源:爱分析ifenxi (ID:ifenxicom)




举报 | 1楼 回复

友情链接