发现视频聊天中的暴露癖


  互联网最显著的趋势之一是视频聊天服务的迅速增长,比如聊天轮盘(Chatroulette)的出现。通过网络摄像头,这些服务与访问该网站的人们随机发生联系。

  但是聊天轮盘存在一个问题。现在,那些暴露个人身体器官的暴露狂在这个网站上泛滥。2010年7月,大约有6300万人访问聊天轮盘,也许就是因为其中含有这些关于性的内容

  但是这对于网站的未成年用户来说是一大难题,因为没有好办法来限制访问者的年龄,而且未成年人很容易就能进入。根据科罗拉多大学的邢新雨(音,Xinyu Xing)和其他一些人的介绍,聊天轮盘有相当数量的用户看起来是未成年人。

  “我们在一个具有代表性的星期六的晚上进行了观察,结果表明,聊天轮盘大约有20-30%人用户是未成年人。”他们对科技博客arXiv这样说道。

  不过,邢和他的同事有一个解决方案。这个团队开发出一种“暴露狂探测”(flasher detection)算法可以发现这些冒犯者,并能将他们踢出去。

  

  事实上,捕捉这些暴露狂比一开始看起来的要难。一个办法就是使用一种众包(Crowdsourcing)机制,由用户举报那些冒犯者,然后再由受过专门训练的个人进行视频评估,如果有必要的话阻止这些视频。

  但这是一个耗时又耗力的工作,有被滥用的危险。而且,再加上任何时间都多于2万用户,这也不可能被聊天轮盘长久使用。

  另外一个办法就是使用被设计用来探测色情内容的既有算法。这些算法如何才能被正确地使用目前还不完全清楚,但是它们看起来是在寻找含有皮肤内容的图像。

  邢及其同事说,很不幸,这种软件对于视频聊天内容来说不是很适用。举例来说,原因就是,视频图像亮度不够,这使得它很难分辨皮肤和背景中的黄白色墙壁。

  因此,邢和同事就开发出了自己的一套算法,叫做SafevChat。他们已经在2万张来自聊天轮盘的视频截图上做了测验,并且已经提供给该网站的创始人安德烈·特诺夫斯基(Andrey Ternovskiy)。他们的论文详细介绍了这个算法的工作方法。

  这种新的算法很有意思,因为它使用几个不同的标准来分析图像,在将结果进行融合之后才决定该图像是否可接受。

  为了克服肤色墙壁和家俱的问题,他们将皮肤探测与动作探测结合起来,再进行对比,看“皮肤”是否正在活动。他们还使用了脸、眼睛和鼻子探测器来区分面部和非面部皮肤。最终结果是综合性的,于是图像就被分类为“正常的”和“冒犯的”。并且这些结果都已经被存储在最初的数据集中。

  邢及其同事说,这个算法效果很好,而且比一个叫做PicBlock的商业色情图像探测程序效果要显著。事实上,由于SafeVChat的效果这么好,聊天轮盘已经在本月初的时候开始使用它了。