上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第1章 引言
1.1 搜索引擎概述
随着互联网的蓬勃发展,建立在互联网之上的各种应用也层出不穷,其中最为成功的莫过于万维网(WWW)。万维网被称为“网中之网”,是互联网上最受欢迎的服务之一。它运用超文本技术为人们访问信息资源提供了巨大的方便,但也以非线性组织的构建方式使人们在信息海洋中彷徨。奥地利的鲁施在1994 年接触万维网,并在其作品《令人吃惊的万维网》(aMAZEingweb)中表达了对万维网的感受:它有那么可观的潜力,却又是经常使探索者丧失方向的迷宫。
时至今日,万维网迷宫般的复杂和魅力还在继续。因为它每天都在不断地产生、更新或消失各种各样的网页。其魅力依然,然而复杂不在。正是由于诞生了搜索引擎这样伟大的技术,万维网复杂的局面才被打破。搜索引擎成为带领人们走出迷宫的灯塔,帮助千百万的网民便捷地找到重要的信息。
WordNet上对搜索引擎的解释是:一种用来在计算机网络,特别是在万维网上检索各种文件的计算机程序。从本质上讲,如果将搜索引擎的搜索结果看做一种动态网页,那么这种动态网页通过提交的检索关键词聚合了各种重要、有价值并与关键词相关的网页。因此,与其说搜索引擎是一个查询系统,不如说它是一个用户定义的信息聚合系统。通过用户输入的查询关键词,搜索引擎推测用户的查询意图,然后快速地返回相关的查询结果,供用户选择。
对搜索引擎的理解也经历了一个漫长的过程,从早期的目录式搜索,到今天的全文搜索,人们对搜索引擎的认识也在不断地加深。今天,公认的搜索引擎有如下3种服务方式。