最近,一则《讯实网络监控覆盖全国90%网吧:从计费软件入手》的新闻报道频频出现在国内的各大网站和媒体上。讯实网络一时名声大燥,其商务经营模式也因此进入了大众的视野。
据报道,讯实网络成立于2008年,和当前风头当劲的美国公司Hitwise一样,是一家互联网数据开发和服务公司。上的“菜”一样,但做法却 大相径庭。Hitwise的数据来源是互联网服务提供商,讯实走的却是草根“网吧”路线,其依托网吧计费软件平台,在全国90%以上的网吧安装了客户端监 测系统,在对网吧用户一举一动进行监测和分析的基础上,提供互联网营销效果的评估和咨询服务。
报道还介绍说,目前流行的在线监测技术手段有多种。其中,讯实网络采用的客户端监测可谓是“贴身”监测,最为准确。它不仅可以分辨独立的个人,甚至还能监测用户的网下行为,即除了浏览器之外的其他软件的使用情况。
无疑,客户端监测的方法提高了数据采集的质量,是讯实网络的技术优势。但这个优势,笔者认为,在讯实网络未来的发展当中,可能也是最大的“隐”和“忧”。
首当其冲的“隐”,是指网吧用户的“隐私权”。对此,讯实网络的CEO于辉在报道中也有谈及,他解释说:“网吧电脑不属于用户私人设备,同时公司收集的数据并不包含具体到个人身份的信息”。
如果报道属实,于辉先生的第一句话其实可以这样理解:因为在公共场合上网,所以网吧用户的网络行为和隐私不受法律保护。
网吧无疑是公共场合,但网吧用户花钱到公共场合消费,其隐私不该受到保护吗?这一点是需要质疑和讨论的。事实上,绝大部分消费行为都是发生在公 共场合的。按照于辉先生的逻辑,银行用户在ATM提款机上的输入也不能受到法律保护,因为ATM提款机也设在公共场合、同样不属于用户私人设备。
另外可以肯定的是,客户端的数据监测方法具备了收集网吧用户个人身份和隐私信息的能力。既然有能力,就很难保证监测者本身不会做出超越他们宣称范围之外的监测,网民完全有理由以“小人”度“君子”:网吧用户的个人资料及隐私是不是已经命悬“一线”?
不妨把视线投到海外,看看这种数据公司的“始作俑者”是如何处理类似问题的。以Hitwise为例,它采取的是数据提供和数据分析两相分离的方 法,在数据被分析使用之前,数据提供商就对原始数据进行了进行匿名处理。这样的分离机制,确保了用户的隐私权不受侵害,即使个别一线分析人员有侵入用户隐 私的主观意愿,也无染指的客观条件。再看美国最大的在线数据提供商ComScore,和讯实一样,它采用的也是客户端监测方法,但它是在取得每一个客户同 意的基础上,才安装监测软件。同时,它给被监测人员提供免费的杀毒软件、网上存贮空间甚至现金和实物奖励作为回报。即便如此,一涉及用户的身份信息,还要 再次询问用户的意见,得到肯定的授权以后才能收集。如此这般,才将“隐私侵犯”之“隐”化于无形。
和这些海外同行相比,除了这个“隐”,讯实更有一个“忧”,这个“忧”,就是其数据质量。
为了保证数据的质量,大部分数据公司采用的是分层抽样的调查收集方法。众所周知,网吧的客户单一性非常高。换句话说,无论是京城北京的网吧、还 是延安乡镇的网吧,他们的到访对象可能都是同属一个年龄段、一个社会阶层的消费者,样本的同质性很高,绝大部分是中小学生。这部分消费群体有什么特点呢? 他们上网游、上社交网站,他们追求的是好玩,他们的消费能力非常有限。即使那些有限的消费,也未必是发生的网吧的在线交易中。
在同一个分层内,由于数据的同质性很高、变化幅度很小,样本再大,其在统计学上的意义也是很有限的。因此,讯实网络的监测虽然已经覆盖了全国 90%以上的网吧,但它在统计学的意义上,可能和50%区别也不是很大。如果网吧用户的数据真的能代表全国网民,那讯实网络现在也就不必煞费苦心地再发展 其家庭和办公用户了。
有意思的是,讯实网络最近发布了《网吧网民上网行为的八大新趋势》白皮书,白皮书说,与前些年网吧网民总是集中在交友和网游板块不同,现在的网 吧“也有不少投资理财的用户”,“一定比例的网吧网民通过在线购物来节省开支”,网吧支付的比率也比一般人想象的高。总之,网吧消费有向高端化发展的趋 势,但对趋势变化的具体比例,白皮书却语焉不详。
这是讯实公司为自己做的一则广告,用心良苦,可以理解。我的担心是,即使网吧用户行为的多样化程度真的在提高,但由于讯实公司的存在,刚出现的 这个多样化苗头或者高端消费的趋势可能就会立刻受到抑制。因为,没有人会愿意无偿和讯实网络分享自己的隐私。讯实公司的名气越大,知道的网民越多,其从网 吧采集来的数据,含金量可能会越低。
网络在线数据的监测和使用,在中国,还是“头啖汤”。作为先行者,讯实网络有先入为王的优势,但螃蟹好吃骨难开,只有解决好这些“隐”和“忧”,讯实网络才能走上顺风顺水的发展“快车道”。