搜索引擎是因特网上的一类网站,这类网站与一般网站不同的是,其主要工作是自动搜寻Web服务器的信息,将信息进行分类、建立索引,然后把索引的内容存放到数据库中。简言之,搜索引擎就是一种在Internet上查找信息的工具,用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎、目录索引类搜索引擎和元搜索引擎。
1.目录式搜索引擎
目录式搜索引擎又称目录索引、主题指南,是以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务有搜索功能,但从严格意义上讲,算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。这类搜索引擎的代表有Yahoo!、搜狐、新浪等。
2.全文搜索引擎
全文搜索引擎又称独立搜索引擎或机器人搜索引擎,它通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。因此,他们才是名副其实的搜索引擎。这类搜索引擎的代表是Excite、Google、百度、天网等。
3.元搜索引擎
元搜索引擎是一种调用其它独立搜索引擎的引擎,亦称搜索引擎之母。它的特点是本身并没有存放网页信息的数据库,当用户查询一个关键词时,它把用户的查询请求转换成其它搜索引擎能够接受的命令格式,并访问数个搜索引擎来查询这个关键词,并把这些搜索引擎返回的结果经过处理后再返回给用户。对于返回的结果系统会进行重复排除、重新排序等处理。服务方式为面向网页的全文检索。著名的元搜索引擎Meta Find、Inference Find、DogPile等。