本福特定律,也称为本福德法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍。推广来说,本福特定律越大的数,以它为首几位的数出现的机率就越低。它可用于检查各种数据是否有造假。本福特定律说明在b进位制中,以数n起头的数出现的机率为logb(n + 1) ? logb(n) .本福特定律不但适用于个位数字,连多位的数也可用。
本福德定律的适用条件是数据不能经过人为修饰。如果数据来自舞弊所得到的结果,则这些数据将不再服从本福德定律。
网络游戏运营中,经常出现各种类型的造假行为,从市场宣传推广的广告投放,到游戏外挂和盗号等,欺骗检测和应对是游戏运营管理中一项难题。在宏观趋势判断方面,利用本福特定律作为欺骗检测的规则之一,用以判断检测范围内基本状况。
具体应用
网络游戏账号和由此产生的用户行为可以产生一系列的可数字形态的数据,例如“经验值”“财富值”等各类属性数值和数值型数据,将多个单独的用户群体(例如一个服务器)应用本福特定律进行判断,找出符合定律的数值体系。假设定律成立,则推导出网络游戏的整体符合本福特定律。
在网络游戏数据符合本福特定律的前提下,以目标为导向,对网络游戏某些行为进行欺骗检测。
游戏运营中广告造假的手段已经演进到将部分广告费用实施在效果关联性造假上门,而这方面的欺骗检测难度非常高,应用本福特定律,对于测试期间的服务器数值状况进行趋势性判断,当得出总体存在造假等可能时,提取具有造假条件属性维度的用户群体进行二次判断(维度例如:IP地址段,上网时间规律,用户注册信息缺失项等)。
由于本福特定律更适合宏观趋势性判断,与其他数据分析方法相结合才能更准确地应用于网络游戏的数据挖掘数据分析实践,希望与业内相关人士就此话题进行深入交流。