走进搜索引擎
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

作者序

本书第1版出版到现在已经3年了。在这段不长的时光里,搜索引擎技术有了进一步的发展。其中比较突出的是,随着数据规模进一步增大,为提升用户体验,搜索引擎性能进一步优化;在更广泛的用户参与下,增强了基于用户行为进行效果改进的能力。这也使得本书有了改版以适应这些重大变化的必要。

基于此,本书第2版增加了搜索引擎性能调优、搜索引擎日志分析,以及基于学习进行排序优化三方面的内容,希望能让读者跟上搜索技术的发展潮流,在这一领域的前沿真切地感受到它的勃勃生机。

当前,搜索技术已经不再局限于搜索引擎本身,它所建立的一套驾驭互联网级别海量数据的架构和理念正日益扩展到整个信息技术领域。而随着世界的日益信息化、数字化、网络化,这些理念的深远影响还会进一步显现。这又将是一次新的科技浪潮。

时光流逝,却有如轮回。信息技术产业,甚至整个科技界,正是在这样的浪潮更迭中不断进步。从AT&T的有线电话到IBM的大型机,到Apple的PC机,到Intel的CPU,到Motorola的无线通信,到Microsoft的操作系统,到Cisco的路由器,到Google的搜索引擎,概莫能外。一次次浪潮,一个个产业巨擘,终将随自己的时代而去,但它们所带来的影响却将投射在人类文明的历史上,永不消逝。

至于搜索的浪潮究竟将持续多长时间,在整个IT史上留下怎样的一笔,只有时间才能告诉人们答案。此时此刻,置身其中,让我们打开书本,接受浪潮之巅的洗礼,走进搜索引擎。

关于本书作者

作者潘雪峰,毕业于中国科学院计算技术研究所,工学博士。研究兴趣包括多媒体内容分析、机器学习和互联网数据挖掘,现从事搜索引擎领域相关工作。

作者花贵春,目前在清华大学信息科学与技术国家实验室攻读博士学位,研究兴趣包括机器学习及其在搜索领域的应用。

作者梁斌,目前在清华大学信息科学与技术国家实验室攻读博士学位,研究兴趣包括大规模数据处理、搜索引擎和软件工程等。

致谢

笔者首先要特别感谢他们的妻子,感谢她们在繁忙的工作和学习之余,包揽了家里家外大大小小的事务,还在笔者们有所懈怠的时候,从精神上给予莫大的支持和鼓励。正是她们无私的支持,才使本书得以面世。

感谢电子工业出版社计算机图书出版分社孙学瑛女士和邓彩屏女士,她们除了参与了此书的创作过程,还为笔者提供了有关图书市场的宝贵信息,使得本书更加面向读者,面向市场。

感谢本书参考文献的作者们、搜索引擎研究界的学者们,以及为此书提出宝贵技术意见的业界同行,正是你们杰出的成就和无私的帮助,才使得本书有了写作的基础和必要。

由于笔者水平有限,加之搜索领域的发展日新月异,书中不足及错误之处在所难免,敬请专家和读者给予批评指正。

潘雪峰、花贵春、梁斌

2011年2月