随着信息技术的发展和应用,特别是移动互联网的深度普及和迅猛发展,人类社会的数据量激增并迅速进入大数据时代。可以预计,随着物联网的发展,万物互联将使数据量进一步井喷,进入“万物皆数据化”的深度大数据时代。在大数据的应用领域,全球互联网企业已经广泛将大数据应用于互联网平台的服务提升、用户管理和营销推广等领域。
在互联网出行领域,约车平台通过对用户信息、车辆及位置信息、路线信息等海量数据进行挖掘分析,可以实现更精准的出行供需匹配和更优化的路线以更好地服务用户;在互联网征信领域,征信机构通过合法途径采集各类数据,通过数据对用户的信用进行画像评分并链接各类商业场景服务用户;在互联网平台治理领域,电商平台通过对用户的订单和支付等海量交易数据的挖掘分析,打击售假、欺诈和炒信等黑灰产;在互联网营销领域,各大广告联盟依据用户数据对用户进行贴标和精准画像,实现互联网广告的精准投放以提高营销效率。
互联网上数据作弊盛行
不仅仅是服务用户,作为各大互联网平台的一种基础资源,大数据也广泛应用于平台的用户管理、资源分配和业务决策。这类场景下大数据的应用涉及到较大的利益调整,各种黑灰产业随之兴起,通过数据作弊的方式在各大互联网平台上制造虚假数据,干扰平台的运行和决策进而获得非法利益。由于法律规制滞后,数据作弊快速形成灰色产业链,给互联网平台治理与大数据应用带来挑战。
在电商领域,电商平台在确定流量资源分配机制时,会对店铺的销量、评价和维权等数据进行分析和计算并给出相应评价,最终电商平台会以这些评价为基础确定流量分配方案。同时,消费者也会信赖这些评价做出购物决策。针对淘宝等电商平台的各种第三方刷单公司明目张胆地为淘宝商家提供刷单服务,以通过数据作弊的方式制造虚假交易数据,让商家获得虚假评价,以及欺骗平台和消费者,在平台竞争中获得不当优势,进而获得巨额利益。
在互联网统计领域,针对友盟和百度统计等第三方数据统计平台,刷数据公司通过为移动应用开发者以作弊方式提供虚假的APP应用新增用户数、留存用户数和日活用户数。作为对互联网领域各种数据的独立客观的统计平台,数据真实是第三方数据统计平台赖以获得市场认同的基础。
在互联网融资领域,第三方数据统计平台对被投资项目用户注册数、月活跃数等统计数据是风险投资机构为项目估值的重要依据。部分开发者为获取好看的用户数据以提升项目估值,在第三方刷数据平台的帮助下,进行数据造假。
同样,在O2O领域,针对滴滴出行和美团大众点评等补贴营销活动,大量黑灰产通过作弊的方式制造虚假交易数据欺骗O2O平台骗取补贴。在互联网广告领域,为骗取广告主的广告费,众多中小推广者通过数据作弊方式制造虚假用户数和点击数等数据欺骗广告联盟。在自媒体领域,为使账号发布的文章能获得今日头条等自媒体平台推荐,通过刷阅读量、转发量和粉丝等数据作弊,欺骗以数据为决策基础的自媒体平台。
数据作弊危害大数据根基
互联网领域广泛而普遍的数据作弊行为,对互联网产业最严重的破坏在于污染了数据源。众所周知,数据已经成为互联网的核心生产资料和基础决策工具。一旦数据被大规模污染,建立在数据基础上的各类应用将受到严重影响。在大数据时代,数据运用的深度和广度愈往前推进,垃圾数据对互联网产业的危害愈严重。
数据作弊产生的垃圾数据,将会导致依据数据做决策的主体做出错误决策,进而导致资源分配的扭曲和互联网良性秩序被破坏。最终提供给用户的服务质量下降,同时又造成互联网领域不公平竞争加剧,“劣币驱逐良币”的恶劣生态由此形成。
电商领域的刷单行为,将导致依据数据决策的平台信用评价体系失灵,其后果是,消费者因为失真的评价而购买作弊者的劣质商品;搜索引擎领域的SEO作弊行为,将导致依据数据决策的平台算法模型失灵,搜索到的可能不是向用户最需要的信息而可能是作弊者的信息;自媒体平台的刷点评阅读等作弊行为,将导致文章推荐系统失灵,平台推荐的资讯将不再是用户感兴趣的而可能是作弊者的内容;O2O平台上的刷单刷评价的行为使得平台服务推荐系统失灵,系统推荐的将不再是提供优质服务的商家而可能是作弊的商家……
互联网平台为防止决策系统失灵,需要投入大量的成本预防数据作弊,同时对于已经污染了的数据源从技术上进行清洗。而部分作弊数据由于高度仿真性,使得数据的清洗成为一项成本昂贵收效甚微的工作,互联网平台与用户集体受损。
数据作弊,法律规制仍然缺位
数据作弊现象如此普遍,其危害如此严重,然而针对数据作弊却无有效法律规制手段,使得提供作弊服务的黑灰产盛行,大肆为各种主体提供数据作弊而大面积制造垃圾数据。在搜索引擎中只要输入“刷单”、“APP刷量”、“刷粉丝”等关键词便可发现,提供数据作弊的各类公司公然在网站上介绍其数据作弊业务。这些像牛皮癣一样泛滥的黑灰产,从数据作弊中获取了丰厚利润,有的平台甚至包装成互联网新型服务项目进行融资并准备上市。
面对上述丰富的数据作弊场景以及事实上的严重损害,无论刑事打击还是民事诉讼亦或是行政执法,均处于应对不力的状态。以针对电商平台的刷单行为为例,提供刷单服务的黑灰产平台,每年营收动辄上千万,而在现有法制环境下他们面临的法律风险确不成比例。刑事打击角度,除非刷单骗补贴等情形可以依据诈骗罪进行定罪,对于刷单以改变电商平台信用评价的行为如何定罪,刑事法律界仍束手无策。行政执法角度,商家刷单构成对其他商家的不正当竞争可以通过工商执法进行处罚,但对于为商家提供刷单服务获取巨额非法利益的刷单黑灰产平台而言,行政处罚数额较低,相对于其获利而言并无震慑力。民事诉讼角度,电商平台可以破坏信用评价体系损害经营利益的角度,对其提起不正当竞争或者侵权之诉,但由于该行为法律关系复杂新颖,无论是不正当竞争或侵权之诉,在证据以及损失认定上,法律理论与实践均有待突破。
从电商刷单这个例子可以看出,数据作弊已逐步成为一个风险低而收益高的暴利行业。如果没有民事、行政、刑事有效衔接的法律规制体系对数据作弊行为进行规制,黑灰产业链将不断扩大,进而更大面积更深程度污染数据源,破坏大数据的基础资源。
我们都在关注大数据的价值。时至今日,用数据度量万物的大数据时代令所有人惊喜,人们也越来越坚信大数据的广泛使用将给人类带来前所未有的机遇和变化。但是我们同样需要关注数据作弊这种破坏数据资源的黑灰产业链,从立法上专门制定相应法律对其进行规制,通过行政监管和司法手段进行规制,遏制数据作弊的现象,为大数据时代夯实基础。