一则新闻在网上爆开后,很难预测它在博客或微博中被讨论的广度以及持续时间。
斯坦福大学计算机科学系的助教朱•莱斯科夫(Jure Leskovec)正在寻找一种更容易的方法,来预测哪个新闻能被讨论和传播更长的时间。然而,预测方式受很多因素的影响,如新闻的内容本身、来源网站的名气以及目标读者所在社区的特征。
莱斯科夫和斯坦福大学在读博士生杨家旺(音,Jaewon Yang)新著的2篇研究论文揭示了新闻在线共享的模式,从而提供了一种提早预测新闻的流行度会上升还是下降的方法。
莱斯科夫说,预测一则新闻或任何其他消息在网络流行的广度,可以帮助网站更有效地安排其内容和广告。这种方法也能显示出一名作者或博客是如何被共享的,并以此来判定其影响力。通过与其他工作的结合,这一方法可以更好地展示通常信息是如何在网上传播的。
研究者分析了1年内的1.7亿篇新闻文章和博客,以及8个月内的Twitter微博。他们跟踪每篇作品在其他博文、新闻和微博中提到的次数以测量其受到的关注度。他们不看链接,而是跟踪博客和文章中有特色的词组——如“做无用功”(lipstick on a pig)——的出现频度。他们利用这些数据创建一个揭示6种不同模式的图表。例如,一些新闻的传播快速达到顶峰然后消失,图上形成一个尖峰形状。其他的则更有持久力,上升和下降都比较平缓。
“通过观察何时特定类型的媒体参与到转播中来,你能看到不同模式出现了。”莱斯科夫说。例如,如果由一篇博客爆料,其传播模式会与通过传统新闻媒体爆料不同。莱斯科夫说,博客在哪一点上介入报道是决定新闻持久性的一个主要因素。比如,即便传统媒体只短暂地集中在一篇报道上,而博客的讨论能让此新闻更长时间地停留在公众的视野中。
通过研究新出现新闻的早期反响,研究者能够预测较长的一段时间里某个内容的流行程度图,准确度达75%。
莱斯科夫说,这些结果与预测工具结合使用时将更加有力。这些工具能预测一个新闻获得的关注量,而不是只预测其传播的模式。为预测关注量,研究者要看新闻的发布地点、主题以及其他因素。
该研究可被用来帮助站点管理内容,莱斯科夫说。比如,一个大的新闻网站可以使用这一方法来决定一篇报道在其首页的突出位置上停留多长时间。
在线话题和趋势实时分析公司PostRank的CTO暨共同创办人伊利亚•格里高利克(Ilya Grigorik)说,研究者的发现与其公司收集的数据一致。他特别提到,新闻在最初的24小时内被讨论得最多。PostRank观察到,新闻关注量的50%甚至更高通常在其出现的第一个小时获得,而关注量的80%及以上通常在前24小时获得——格里高利克说这个数字在近三年里是一致的。
格里高利克认为,将成果投入实用还需要做更多微调。特别是,研究者所识别出的图形需要具备更多特性描述,这样人们能根据特定图形来领会某个新闻的含义。
格里高利克说,新闻聚合网站可以使用基于这项研究的工具来预测帖子的流行度,不过还不清楚这样做比靠网站编辑判断在多大程度上更有效。
曾和莱斯科夫一起工作的康奈尔大学计算机科学系教授乔恩•克雷恩伯格(Jon Kleinberg)说,在梳理新闻随时间增长而获得注意力的诸多不同方式时,这项研究是非常有前途的方法。他说,他对按时间而非主题分类的新闻报道在图形中的上升和下降特别有兴趣,对研究新闻来源中博客和主流媒体所扮演的互补角色同样有很大兴趣。
莱斯科夫计划在互联网信息传播方式方面做更多的研究。他和同事也在观察信息在传播中如何变化,也许这能帮助洞察谣言和错误信息是如何传播起来的。
网络新闻推手能这样炼成
评论
15 views