分词结合搜索引擎的表现


  分词结合搜索引擎,表现在:

  一是找出语言的“最小语境含义表达单位(语境根)”,按照检索习惯进行分词,建立对应的数据库。这个的好坏决定了查询的响应速度。因为如果直接对上号的更多,那么查询时就不需要进行过多处理。对于大型搜索引擎来说,每天几亿次以上的查询,这可是节省不少时间。

  二是找出语言的“最小语境含义表达单位(语境根)”相互间的关系,也就是前面说的“相关词”。这个的决定了准确率。要知道,站内投票的意义远大于站外投票。能否准确判断“相关词”,是识别“关键词”真实与否、重要与否的关键