文章插图
从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表 。互联网发展早期,以雅虎为代表的网站分类目录查询非常流行 。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下 。用户查询时,通过一层层的点击来查找自己想找的网站 。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎 。【分类】1、全文索引全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索 。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果 。根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎 。2、目录索引目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已 。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询 。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo、新浪分类目录搜索 。3、元搜索引擎元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户 。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎 。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo 。其他非主流搜索引擎形式:1、集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎 。2、门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎 。3、免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多 。【工作原理】1、抓取网页每个独立的搜索引擎都有自己的网页抓取程序(spider) 。Spider顺着网页中的超链接,连续地抓取网页 。被抓取的网页被称之为网页快照 。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页 。2、处理网页搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务 。其中,最重要的就是提取关键词,建立索引文件 。其他还包括去除重复网页、分析超链接、计算网页的重要度 。
【搜索引擎是什么意思?】
推荐阅读
- 晚上睡热了身上就痒是什么原因
- 成功的含义是什么 成功有什么含义
- 跳台滑雪项目是什么 跳台滑雪项目有哪些
- 以家人之名结局是什么 以家人之名结局介绍
- 描写西湖九溪十八溪的对联是什么?
- 土豆怎么做才是最好吃 做法是什么
- 摸金校尉的意思 摸金校尉是什么意思
- 让子弹飞的结局是怎么样 让子弹飞的结局是什么意思
- 古稀之年的意思 词语古稀之年的意思
- 争什么争歌词 争什么争歌词是什么