2.1 利用搜索引擎追踪
搜索引擎(英文名称“Search Engine”)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索之后的相关信息展示给用户的系统。专业的搜索引擎拥有作为信息发现及深度挖掘工具的巨大潜力。
在普通用户的眼中,提到搜索引擎,首先想到的就是能用来搜索自己不懂的问题和查找各种资料。但由于搜索引擎使用的网页爬虫性能十分强劲,能够完整地记录网站的结构和页面,黑客们通过构造特殊的关键字,使用互联网上的相关隐私信息,甚至可以在几秒钟内黑掉一个网站。
2.1.1 你了解“度娘”吗?
人们最常用到的搜索引擎是Google和百度。由于最近一段时间Google搜索处于无响应状态,同时涉及“谷歌地图”“谷歌翻译”“谷歌地球”“谷歌邮箱”等网站无法正常访问(这里就不介绍了),因此百度成了全球最大的中文搜索引擎,每天处理数以亿计的搜索请求,更贴合人们的使用习惯,为人们的生活、工作、学习提供了极大的便利。
百度搜索引擎就像传说中的“万事通”,不管用户搜索什么内容,它都能给出答案,灵活运用百度搜索技巧可以帮助用户更快速、更准确地在浩瀚的互联网中找到需要的信息。用一句流行的说法就可以完美诠释百度这一搜索引擎在人群中的普及程度:“有问题,找度娘。”
1. 介绍搜索功能
日常生活中使用百度搜索引擎仅仅是为了快速便捷地查找出对用户有用的信息,但是用户真的了解百度搜索引擎都有哪些搜索功能吗?
在IE浏览器的地址栏中输入网址“www.baidu. com”,进入百度主页,如图2-1-1所示。可以清楚地看网页到主体部分主要包括搜索框、LOGO、百度搜索按钮及百度旗下的相关产品,这一设计极大地方便了用户的使用。
图2-1-1 百度主页
人们利用百度搜索引擎可以搜索网页、图片、相关视频或者搜索地图、新闻及音乐等。下面就详细介绍这些常用搜索功能。
(1)默认搜索
百度的默认搜索选项为网页搜索,用户只需要在查询框中输入想要查询的关键字信息,单击【百度一下】按钮,便可获得想要查询的资料,如图2-1-2所示。利用百度搜索到的信息是根据用户的使用频率进行排序的,因此比较方便用户进行查找。
图2-1-2 利用百度搜索网页
(2)其他搜索
在使用百度搜索时,除了默认的网页搜索选项,百度还设计了其他的搜索选项,方便用户根据自己的需要进行选择。
① 新闻。单击百度搜索框下的“新闻”标签,再输入要查询的关键字即可进行新闻的搜索,同时,百度还提供了“新闻全文”“新闻标题”(默认是选择“新闻全文”选项)以及排序方法(默认是选择“按焦点排序”选项)方便用户使用,如图2-1-3所示。
图2-1-3 利用百度搜索新闻
② 贴吧。“贴吧”作为一种新兴的供人们交流的社交平台,凭借其强大的功能和人性化的设计,拥有了众多的粉丝。为了方便贴吧用户的使用,百度搜索引擎也将其列为搜索选项,如图2-1-4所示。
图2-1-4 利用百度搜索进入贴吧
③ 知道。人们在生活中会遇到各种各样的问题,这些问题有时不能通过百度的“网页搜索”查找到具体的答案,由此设置了“知道”这一搜索项。在搜索框中输入你想查找的问题,单击“搜索答案”按钮便会出现其他百度用户提问过的跟你相似的问题,此外为了保证答案的时效性,还可以对找到的答案进行时间上的筛选,如图2-1-5所示。若还是找不到你想要的答案,还可以单击“我要提问”链接,进入提问问题的网页,在这里输入你的问题,单击“提交问题”按钮,便会收到热心网友对你所提问题的解答,如图2-1-6所示。
图2-1-5 利用百度知道搜索问题
图2-1-6 利用百度知道提问问题
除了上述提到的网页搜索、新闻搜索及百度的“贴吧”“知道”功能,百度搜索还提供了其他的搜索功能,如搜索音乐、图片、视频,查找地图,查找论文的百度文库及关于百度搜索引擎的更多功能,极大地方便了用户的使用。
2. 介绍搜索语法
相信大多数人在使用搜索引擎的过程中,只是输入问题的关键字,就开始了漫长的信息提取过程。经常使用百度搜索引擎的用户会发现一个问题:如果只是简单地输入几个关键字,百度搜索只会根据用户提供的关键字展示结果,这时要想查找到自己需要的信息就会很困难。
在生活和工作中,人们经常需要通过搜索引擎的一些高级搜索语法来提高搜索结果的准确性。百度对于搜索的关键字提供了多种语法,合理使用这些语法,将使得到的搜索结果更加精确。下面给大家举例详细说明百度的一些常用高级搜索语法。
(1)site——把搜索范围限定在特定的站点内
当需要找一些特殊文档,并且已经知道要找的东西在某个站点(特别是专业性较强的网站)中时,合理使用site语法可以事半功倍。使用的方式是在查询内容的后面加上“site:站点域名”,如“社会工程学site:zhixing123.cn”,百度搜索引擎会显示出在知行网上查找到的关于社会工程学的文章,如图2-1-7所示。
图2-1-7 site的用法示例
提示
“site:”后面跟的站点域名,不要带“http://”和“/”符号;另外,“site:”和站点名之间,不要带空格,否则会出现错误。
(2)intitle——把搜索范围限定在网页标题中
一般情况下,网页标题是整个网页的纲要,使用intitle语法可以把查询范围限定在网页标题中,有利于快速地找到所需要的网页。使用的方式是把查询内容中特别关键的部分的前面加上“intitle:”,如“intitle:社会工程学”,百度搜索引擎会查找出以“社会工程学”为网页标题的网页,如图2-1-8所示。
提示
“intitle:”和后面的关键词之间,不要有空格。
图2-1-8 intitle的用法示例
(3)inurl——把搜索范围限定在URL链接中
用inurl语法找到网页URL(中文名称“统一资源定位符”,是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示)相关资源链接,然后用另一个关键词确定是否有某项具体资源,使用户找到更精确的专题信息。使用的方式是在“inurl:”后加上需要在URL中出现的关键词,如“计算机inurl:lunwen”,百度搜索引擎会显示出关于计算机的论文,如图2-1-9所示。这个关键字中的“计算机” 可以出现在网页的任何位置,但是“论文”必须出现在网页URL中。
图2-1-9 inurl的用法示例
提示
inurl语法可用于查询网站某个页面的百度收录情况,但是“inurl:”语法和后面所跟的关键词,不能有空格。
(4)减号——要求搜索结果中不含特定查询词
用减号语法可以去除用户不希望看到的网页,如“[笑傲江湖] intitle:小说 -电视剧”,这时百度搜到的便都是关于笑傲江湖的小说,不会出现电视剧的信息,如图2-1-10所示。
提示
前一个关键词,和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。
图2-1-10 减号的用法示例
(5)domain——查找跟某一网站相关的信息
要了解某个网站的信息时除了可以在地址栏输入“www.网址.com”外,还可以用domain语法在百度搜索引擎上查找与这个网站相关的信息,如“domain:www.Google.com”,就可以查询到在网站内容里面包含www.Google.com信息的网站,如图2-1-11所示。
图2-1-11 domain的用法示例
(6)filetype——限制查找文件的格式类型
查找某一关键字的信息可能搜索到的有很多类型,这时可以通过filetype语法限制要查找的文件类型。使用的方式是搜索“关键字+filetype:ppt”,如“计算机+ filetype:ppt”,就可以只搜索到关于计算机的PPT,如图2-1-12所示。
提示
目前可以查找的文件类型有.pdf/.doc/.xls/.ppt/.rtf。
图2-1-12 filetype的用法示例
(7)双引号、书名号和中括号——精确匹配,缩小搜索范围
① 双引号。如果输入的关键字很长,百度在经过分析后,给出的搜索结果中的关键字,可能是拆分的。如果对这种情况不满意,可以尝试让百度不拆分关键字。只需要给关键字加上双引号,就可以达到这种效果。举例说明:“中国计算机行业协会”。如果不加双引号,搜索结果被拆分,效果不是很好,如图2-1-13所示;但加上双引号后的“中国计算机行业协会”,搜索的结果就符合要求了,如图2-1-14所示。
图2-1-13 不加“”的关键字搜索
图2-1-14 加了“”后的关键字搜索
② 中括号。同样的道理,使用中括号,也可以让百度不拆分关键字,缩小搜索的范围。举例说明:[说故事]。加上“[]”后关键字不会被拆分。
③ 书名号。书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,而在百度中,中文书名号是可被查询的。加上书名号的查询词有两层特殊功能:一是书名号会出现在搜索结果中;二是书名号扩起来的内容不会被拆分。书名号在某些情况(如查找常用的电影或小说)下特别有效果。举例说明:《社交网络》。如果不加书名号,很多情况下出来的是各种社交平台,如图2-1-15所示;而加上书名号后,搜索《社交网络》的结果就是电影了,如图2-1-16所示。
图2-1-15 不加《》的关键字搜索
图2-1-16 加了《》后的关键字搜索
百度作为Google在国内的竞争对手,性能和实力一点也不逊色。上述这些搜索语法只是百度中的一小部分,读者可以借助上文中提到的技巧来提高搜索效率。给用户提供这些语法的目的是获得更加精确的结果,但黑客却可以利用这些语法构造出特殊的关键字,使搜索的结果中绝大部分都是存在漏洞的网站,一旦一个正在使用的网站被搜索出漏洞,那便有可能面临被攻击的危险,可能造成巨大的损失。
上述介绍的百度的基本搜索语法,可以方便人们在日常工作生活中使用。但是对于黑客来讲,他们需要的通常是更加准确的搜索结果。这时候他们就会采用多个语法组合搭配的方式快速定位。有时候还会通过搜索敏感信息以及让被搜寻人无所遁逃的“人肉”搜索来获取想要的信息,如通过某人的微博,可以得到其最近的活动,通过此人相关的活动得到敏感的信息。下面通过介绍“人肉”搜索以及如何探寻企业的机密信息来揭露社会工程学攻击的信息搜索手段。
2.1.2 什么是“人肉”搜索
首先要来区别一下机器搜索和“人肉”搜索。类似百度这样的搜索引擎,它们属于机器搜索,大部分过程是由计算机来完成的。虽然查找速度快,但是由于目前的计算机技术还没有发展到能够领会人的意思的境界,因此一些搜索结果达不到人们想要的目的。
顾名思义,“人肉”搜索就是利用现代信息科技,通过网络而聚集的强大社会力量。变传统的网络信息搜索为人找人、人问人、人挨人的关系型网络社区活动。可谓一人提问、八方回应……而在“人肉”搜索的背后,其实是网友的集体声讨、铺天盖地的批评,还有无穷无尽的从网络到现实的“追杀”。
例如,要了解一个人,那么可以通过在论坛发帖的形式发起人肉搜索,也许正好有个网友认识他所要了解的那个人,那么该网友就可以利用在网上发帖的形式把该人的信息公布于网上。“人肉”搜索的力量是强大的,特别是在当前互联网越来越发达的情况下更是如此,谁也不能保证认识自己的人没有一个会上网的,假如,正好网上有人对你发起“人肉”搜索,很有可能认识你的人会将你的相关信息在网上公布。
下面通过介绍百度百科上 “人肉”搜索的流程和一个简单的例子介绍“人肉”搜索一个人的过程,揭开“人肉”搜索的神秘面纱。
1. “人肉”搜索的一般流程
(1)起因
一般来说,“人肉”搜索的起因是一起事件。这个事件可以是犯罪行为(如撞人后逃逸),或者是不违反法律,但为主流道德观所憎恶的行为(如丈夫婚外恋导致妻子自杀),甚至只是一个不合常理的事件(如很暴力)。
(2)相关人发布此事件
事件发生后,相关人或对事情真相好奇者,往往在网络论坛上发表帖子,列出已掌握的人物资料,号召网民帮助查出该人的身份和详细的个人资料。
(3)响应者参与此事件
响应者通过互联网、人际关系等手段,寻找到更多的资料,并以总结形式再次发布网上。
至此3个过程已经构成了完整的“人肉”搜索。正是由于网络社交圈的强大,“人肉”搜索才能得以继续下去,如致力于公益找人事业的“找人网”。
2. “人肉”搜人的简单案例
首先要知道对方的基本资料之一,如姓名、网络ID、手机号码、QQ号码或者电子邮件地址等。这里就拿最简单的QQ来演示。
1登录搜索引擎,可以是百度或者Google等,这里以百度搜索引擎为例,如图2-1-17所示。
图2-1-17 打开百度搜索引擎
提示
搜索引擎越多,检索到的结果越多。
2在搜索引擎中输入要搜索的QQ账号,百度搜索会展示出关于这个QQ账号的相关信息,如图2-1-18所示。
图2-1-18 输入要搜索的QQ账号
3进入其中一个检索结果,可以找到对应的百度ID,这样就查找到更多信息了,因为大部分人的ID都是多网通用的,如图2-1-19所示。
图2-1-19 找到对应的百度ID
4再用找到的ID检索,可以得到更多更详细的信息,通过组合整理这些信息,可以对检索目标得到一个清晰的认识,如图2-1-20所示。
图2-1-20 用找到的百度ID检索更多信息
如果品行端正的人使用这种搜索方法,则可以帮助人们在茫茫网海中解决很多棘手的问题。但若居心不良的黑客使用这种搜索方法,则可能会搜索到某个人的详细信息,包括对方目前所处的位置、所在的学校或工作单位、年龄及电话号码等私人信息,进而对其进行骚扰。我们要合理利用“人肉”搜索做公益事业,不能盲目跟风,给其他人的生活带来巨大的影响。
2.1.3 探寻企业机密信息
无论是电视剧还是现实生活中,处处存在着企业之间的竞争。一个公司要想在某个行业领先其竞争对手,必须有自己的经营模式、独特的产品策划方案等,这些可以称为一家企业的机密文件。通常这些机密文件都会存放在一个站点中,不同部分的人都有一个账户来进行登录,上传必要的文件档案,这些档案的格式通常为DOC、PPT、PDF等,以供相关技术人员整理上交。
在不正当的竞争中,某些公司会雇用网络攻击者窃取竞争对手的策划方案、产品设计初稿为自己所有。正是由于网络中的资源是无限的,只要找到合适的搜索关键字,即使是一些企业的机密信息,也有可能搜索到。黑客们在对某公司网站进行攻击之前,会事先通过网络搜索该公司的重要信息,如企业的相关常用术语或机密信息的主题等,就有可能搜索出想要的机密信息。
举个例子来说,假设要搜索某公司的年会策划方案,可以尝试在搜索框中输入语法“filetype:doc年会策划方案”,搜索到的结果如图2-1-21所示。
图2-1-21 搜索年会策划方案
通过这种方法搜索时会出现多个网页的结果,如果仅需要来自百度的结果,可采用针对型搜索。可将搜索语法更改为“site:baidu.com filetype:doc年会策划方案”,再进行搜索,如图2-1-22所示。
图2-1-22 只针对百度搜索年会策划方案
对于一个公司来说,只要牵扯到公司的任何信息,都可以称为公司的机密文件,也都可能成为黑客攻击企业需要的信息来源。这是一种无形资产,能够给企业带来巨大的经济利益,使企业在一定时间、一定领域内获得丰厚的回报。也正因为如此,保护公司的机密文件,对于一个企业来说,具有至关重要的作用。