旗下微信矩阵:

独角兽马蜂窝:1800万“真实点评”来自抄袭,大数据时代罗生门,警钟为谁而鸣?

数据造假的成本在过去十年间,同样水涨船高。而一旦成本高到了一定程度,产业链的某一环不堪重负的时候,必然会倒闭整个数据评价体系,甚至是生产关系的重构。
2018-10-22 10:48 · 微信公众号:创业邦  风间海色   
   

  今天下午,邦哥被一篇名为《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章刷屏了。这篇文章的内容,主要是说旅游独角兽马蜂窝宣传中的2100万条“真实点评”,有1800万条都是通过爬虫等手段,从其他平台进行抓取的,而并非出自平台用户本身。

  在文章中,作者用到的核心关键词,是“抄袭”。并称即便将标准设置为,一字不差的抄袭,才算抄袭,但仍然发现了7454个抄袭账号,和相应的共计1793万条抄袭点评。

  不久后,马蜂窝一位市场经理出面回应,称公司正在核实情况,他们同样在等待结果:“暂时不知道什么时候能出,不过今天应该是可以的。”

  引发轰动的同时,邦哥在于一位从业者交流时,却得到了不同的答案:“抄袭我觉得谈不上吧,其实大家都是评论的搬运工,版权在用户,用户却是最弱势的群体。”

  “互联网公司,有几个数据是真的?”

  “其实平台是没有所有权的。”在评价“马蜂窝从竞争对手处抄袭评论”一事时,业内人士给出了这样的答案:这些评论并不属于哪一个平台,真正的所有者是用户,然而用户在这件事情上的话语权却是0。

  邦哥有一位朋友2004年去了雪乡,那时雪乡还默默无闻。一年后搜索“雪乡游记”,至少有20个不同的网站出现了他的原创游记文章。似乎比起抄袭,这次的事件叫做“搬运”还更为贴切:平台不生产评论,平台只是评论的搬运工。而马蜂窝,显然不是*一个搬运者。

  有业内人士表示,其他平台也多多少少有类似的情况,用技术手段抓取其他平台数据内容,是业内相当常见的一种做法,只是用得多和用得少的问题而已。

  而另一位从业者则表示,即便马蜂窝的数据量并没有他们自己标榜得那么大,但马蜂窝已经是行业内的头部公司了,“其他平台又能比它(马蜂窝)的数据量大到哪去呢”?

  复制粘贴是很容易的工作,在业内很多人看来,互联网就是这样的:“这个时代,有几家互联网公司的数据是真的?”

  我们谁也不知道答案。

  价值导向,催生行业“原罪”

  “我们的PGC又有用又优秀,奈何你们只要数据说话”——这是邦哥朋友圈的一条评论动态。

  某种程度上讲,这代表了相当一部分人的看法和无奈:在流量至上的时代,有时不被裹挟,太需要天时地利人和。

  马蜂窝由陈罡和吕刚创立于2006年,但却是从2010年才正式开始公司化运营,那时公司的注册用户只有15万。

  而直到2012年6月,马蜂窝才开始商业化尝试,那之前的2011年,公司进行了500万美元A轮融资,并拿到了200万美元的无息贷款来支撑日常运营。

  2013年4月,马蜂窝获得启明创投领投的1500万美元B轮融资,次年6月,马蜂窝的注册会员突破5000万。

  2015年2月,马蜂窝获得了高瓴资本、Coatue、CoBuilder、启明创投的C轮融资,累计融资逾亿美金。

  在质疑马蜂窝的文章中,有这样一段话:

  但事实上,这一万五千人,恐怕还真的不一定是僵尸。

  据几位马蜂窝重度用户的表述,2015年到2016年,马蜂窝点评部分的突然活跃,跟当时马蜂窝的活动有关。那时马蜂窝正需要“数据说话”,于是开始用刷回答和点评获得“蜂蜜”的手段,激励用户刷点评,写游记和评论。

  从2015年初到年中,马蜂窝的线上活动日渐疯狂,一度每周都有活动且“蜂蜜”完全不限量,50000蜂蜜就可以换一个索尼nex5的套机,实物奖励同样极其丰厚。据老用户回忆,重奖之下,大量用户开始自发地手动刷点评,“抄袭”、“搬运”之作,都相当常见:“没去过的人只能通过去其他网站扒数据过来,而且就我知道的马蜂窝对这个情况知情且默认的。”

  截至发稿,邦哥仍未等到马蜂窝的回应,因此对于数据和新闻的相关真实性,我们不做更多的评论。2015年9月,马蜂窝用户数达1亿,其中80%的用户来自移动端(马蜂窝自由行APP);月活用户数达8000万。从开始公司化运营的15万用户,到达成“1亿用户”成就,马蜂窝用了五年时间。

  然而,PGC和UGC内容的产生,显然都需要更多的时间进行积累,恐怕很难与用户数量的增长率保持完全的正比关系。有人说创业公司从*天起就不要碰刷榜刷量,以及扒别人的数据据为己有。因为江湖这么小,出来混迟早会还的。然而也有人怀着更加深重的无奈对邦哥说:去见投资人别人*句就是你有多少用户,我不刷量可能已经死了,你告诉我怎么选择?

  信息化时代,价值导向中对于数据的追逐,终于成为了很多互联网企业一开始就背负的“原罪”。

  互联网时代,到底还有什么是真的?

  我们无法得知马蜂窝内部对于点评数是否有硬性的KPI,这些KPI又如何被制定,最终被推行和实现。我们也无法单纯地指责一家企业以实物奖励激励用户进行点评的做法,因为也许这也并非是公司的初衷。

  但对于从业者无意间那句“互联网企业有几个数据是真的”,邦哥又无法真的放下:流量的红利期正在过去,与之相矛盾的是,大数据时代的到来,让整个互联网行业对于数据的依赖日渐深重,无法回头。

  马蜂窝不是*一个被质疑数据真实性的平台,旅游业也不是*一个被质疑数据真实性的行业。

  2018年9月3日,一个半月之前,爱奇艺率先宣布了一项或许对整个中国网络视频行业豆浆影响深远的决定:取消前台播放量显示。和收视率之于电视台一样,播放量,曾经是网络视频平台的“信仰”。然而信仰们却日渐崩塌。

  很多年里,播放量就是网络视频平台的“收视率”。曾经“收视率高”、“播放量大”,毫无疑问地意味着“作品出色”:某种程度上讲,电影、剧集、综艺,这些视频产品的质量,在数据未造假之前,是与“播放量”指标毫无疑问呈现正相关的。

  但随着大数据时代的到来,行业和投资方、广告商越来越依赖这些数据来进行商业决策,其背后代表的巨大利益,使得数据本身的安全性和纯净性,受到了巨大的威胁。

  于是我们看到,一些电影明明质量平平,票房却动辄十几亿;一些电视剧并未给观众留下深刻印象,点击量却超出全国人口总和;真正优质的作品被虚假数据反攻以至赔钱离场;制作敷衍的差评作品却占领渠道和流量,成为“赚钱典范”……

  信仰的崩塌,是因为数据本身逐渐从“真实”走向了“虚假”。“大数据”的可靠性,正在成为互联网时代的“通用焦虑”,许多人在马蜂窝此次事件的相关评论里写下一句话:到底还有什么是真的?

  警钟为谁而鸣

  2012年,一个叫做王建锋的出品人,*次把电视台、造假卖家的利益链公之于众。收视率造假成本达到了3000-7000元一集。但那时候大家还能活下去,好多公司觉得还承担得了。于是事件的结局是王建锋损失2亿,不再从事影视制作。

  2016年,王长田在一个论坛上说,我们看到的所有电视节目、电视剧,收视率90%以上都是假的。光线传媒在那之前因不堪忍受购买收视率的巨额费用,宣布退出电视节目市场。王长田在后来接受采访时曾说,“幸好光线传媒还有电影业务可以支撑,不然当时我们可能就死掉了。”

  要知道,光线传媒可是一家上市公司。

  众所周知,流量是越来越昂贵的。数据造假的成本在过去十年间,同样水涨船高。而一旦成本高到了一定程度,产业链的某一环不堪重负的时候,必然会倒闭整个数据评价体系,甚至是生产关系的重构。

  近一年来,影视行业对于播放量和收视率等指标造假的指责甚嚣尘上,并不是因为行业突然找回了“道德感”,本质上是因为商业利益在“虚假数据”里的逐渐失衡,导致行业整体成本结构的畸形,最终将所有人推向了生死存亡的边缘,倒逼了行业的变革。

  于是我们看到,爱奇艺在2018年9月3日,宣布取消前台播放量显示,代之以“热度值”。优酷虽然表示在找到合理有效评估方式前不会“动播放量”,但言下之意,显然也在寻找替代方案。10月20日,则有报道称腾讯也在内部宣布,未来将以“会员拉新”为新的主要KPI,淡化播放量的影响和权重。

  影视产业链已经不堪重负之下,做出了不得不做出的变革。其他行业呢?

  我们不知道马蜂窝最终的回应会是什么。但我们至少知道,警钟为谁而鸣。


【本文由投资界合作伙伴微信公众号:创业邦授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。