可衡量人类权力等级的新算法


  在互联网上判断人的权力和影响力是很有意思的事情。的确,从网页链接模式中提取等级的算法已经让一些公司挣到了很多钱,比如谷歌。

  其中最著名的就是超链归纳主题搜索(Hyper Induced Topic Search, HITS)算法,它假设重要的网页分为两类——中心和权威——如果它们指向其它重要的页面或重要的页面指向它们,就会被认为是重要的。这种思想直接导致谷歌搜索算法PageRank的诞生。

  该思想的创始人是约翰·伯格(John Kleinberg),他是位于伊萨卡岛(Ithaca)的康奈尔大学(Cornell University)的计算机科学家,他已经通过一些工作受到了大家的欢迎。可以说,伯格的工作已经为网络世界塑造了基础。

  如今,伯格及其同事提出了一种完全不同的衡量权力与影响力的方法;这种方法终有一天也会有同样深远的影响。

  他们已经解决了怎样用人们说或写的语言模式来衡量权力的个体差异。换句话说,他们说交谈的语言类型揭示了正在说话的那个人的权力级别。

  “我们向大家展示了在群组讨论中,参与者对其谈话对象语言风格的附和程度揭示了他们的权力差异,”伯格说。

  这个问题的关键是“语言配合”的思想,讲话人自然的模仿对话者的语言风格。人类行为专家长期研究个人模仿别人的肢体语言或语调的方式,一些人甚至研究这种影响怎样揭示小组成员之间的权力差异。

  伯格说现在同样的情况发生在语言风格上。他们研究对话者模仿别人在句子中使用特定单词的方式。尤其是构成句子语法基础但缺少自身意义的虚词(例如,在这句话中的黑色字体)。虚词分为冠词、助动词、连词、频率副词等等。

  伯格的问题是:假设一个人在一句话中使用特定类型的虚词,那与其交谈的人也如此使用的概率是多少?

  为了找到答案,他们分析了说话人或写作人心中有特定目标的两种文本类型:美国最高法院(US Supreme Court )口头辩论的记录和维基百科编辑之间的讨论(这个工作中的关键限制是,对话不能是闲聊;讨论中必须有焦点话题)。

  维基百科编辑被分为有更大机会接触网络文章的管理人员,和接触不到网络文章的非管理人员。很清楚,管理人员的权力比非管理人员要大。

  看看人们在从非管理人员向管理人员角色转化过程中语言风格的变化,伯格展示了语言配合的模式也有了变化。管理人员不太可能与别人进行配合。同时,低级别的人更有可能与管理人员进行配合。

  最高法院中也有相似的效果(这里的权力差异更明显)。

  很明显,人们完全不知道自己正在做这些事情。“如果你正在与一个爱使用冠词、介词或人称代词的人交流,那么你将增加对这些词的使用,甚至你自己都意识不到,”伯格说。

  这种效应只在研究大量文本或记录的时候才会比较明显。“是我们首个认识到语言配合和社交权力之间有大规模的联系,涵盖了许多人和区域,”伯格说。

  在有相当大量讨论的场景时有潜在的应用。伯格可以很容易做到的一件事是对维基百科的编辑按权力排名(说明白些,尽管他们没有在文章中这样做)。

  不难想象一个公司用同样的方法根据内部邮件记录来确定哪个人有最大的权力和影响。谷歌为了提供广告,已经处理了私人邮件的内容,那为什么不在Google+里用来确定人的权力等级?

  也可以用这种方法为博客主、tweeter用户和facebook网页排名,可能可以结合其它排名技术。

  如果可以在实际交谈中进行这种分析,那就能在谈判、采访、法律陈述过程中提供重要的反馈信息。

  这看起来是有深远意义的重要工作。这些并不都是为了隐私。很难想象有人想在讨论过程中揭示他们的权力级别,尤其是维基人和普通网民可能会经常悄悄的这样做。

  这是有意义的一课,有时候无害信息在一段时间之后可能会揭示出很多难以想象的东西。