让互联网更加廉价


  维韦克•派储存网络内容的新方法可以使世界最贫穷的地区都负担得起上网费用。

  在发展中国家,稀缺的互联网入口成为数字鸿沟比较突出和顽固的表现,其程度也超过了电脑的缺乏程度。普林斯顿大学电脑科学家维韦克•派(Vivek Pai)认为:“无论从相对还是绝对的角度来讲,大多数地方的网络价格都要比美国昂贵。”一些贫困国家的大学甚至仅仅能够支付低速带宽网络;个人用户只能接受少量的拨号上网连接。为了改进这些网络的使用,派和他的团队开发了哈希缓存技术(HashCache),一种高效的缓存方法,将经常访问的网页内容存贮在本地硬盘上,从而不再占用网络带宽来重复获取同样的信息。

  尽管互联网络千变万化,但其中相当一部分内容的变化并不频繁和显著。目前的缓存技术不仅需要大容量硬盘来存贮数据,也需要大量的随机记忆存贮器(random-access memory)来存贮索引,这种索引包含了硬盘上每个数据片段的“地址”信息。随机存储设备相对于硬盘更加昂贵,并且只能在接电状态下工作――这就像带宽一样,在发展中国家昂贵且稀少。

  哈希缓存技术摒弃了这种索引,将随机记忆存储器和电的需要量降低到1/10。它使用一种叫做哈希函数的数学方法,将每个存贮网页URL地址的目标――图片影像、博客的文本等--转换成小段数字。虽然大多数缓存系统也这样做,但他们需要将每个哈希数存入到随机记忆存贮设备中的特定表中,再将该表的内容映射到硬盘地址上。派提出的技术避开了这一步,因为它使用了一种新的哈希函数:函数输出的数字直接定义了对应网络对象所在的硬盘位置。派说:“使用哈希函数直接计算出位置,我们可以完全摆脱索引。”

  当然,这里仍然需要一些随机记忆存储器,但其容量只需足够运行哈希函数并提取出特定网络对象即可,派解释说。尽管这项技术的研发仍在初始阶段,但哈希缓存已经在加纳的Kokrobitey研究所和尼日利亚的Obafemi Awolowo大学进行了实地测试。

  超文本传输协议(HTTP)的作者之一的吉姆•盖提斯(Jim Gettys)认为,这项技术打破了缓存技术长期停滞不前的僵局。虽然对于贫困国家的学校,购买数百G容量的硬盘不是不可行,但那些学校如果使用目前最好的免费软件,就可以支付并购买足够的随机记忆存贮器,来支持多达数十G容量的缓存内容。使用哈希缓存后,一间装配随便哪种电脑、甚至是被人丢弃的电脑的教室,便可廉价地存储并访问多达1T(1T=1024G――译注)容量的网络数据。这些容量足够存储下所有维基百科(Wikipedia)内容,或者如莱斯大学(Rice University)等高校的开放课程的所有内容。

  哈佛大学伯克曼互联网与社会研究中心的伊桑•朱克曼(Ethan Zuckerman)说,即使使用新的光纤电缆将东非地区接入互联网,一些非洲地区大学的数以千计的大学生仍然在分享类似家用DSL 的速度。“这些大学在网络带宽方面严重受限。”他表示,“他们所有的学生都希望使用电脑,但大多数人都没有足够的带宽。这个创新的技术将使大量缓存服务变得极其廉价。”

  派计划将哈希缓存技术作为一种免费的、非赢利模式授权使用,但也会为未来的商业化留下一条路。这意味着这项技术也会给富有国家的平民化互联网接入带来帮助。