.

...

Ⅰ 搜索引擎的主要体系包括哪些

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。全文索引搜索引擎分类部分提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),蜘蛛搜索引擎搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。随着搜索引擎索引规则发生很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。这种引擎的特点是搜全率比较高。目录索引目录索引也称为:分类检索,是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源。虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。与全文搜索引擎相比,目录索引有许多不同之处。首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功;而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其像Yahoo这样的超级索引,登录更是困难。此外,在登录搜索引擎时,一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。搜索引擎与目录索引有相互融合渗透的趋势。一些纯粹的全文搜索引擎也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而像Yahoo! ;这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围(注)。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如中国的搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。这种引擎的特点是找的准确率比较高。元搜索元搜索引擎(METASearch Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。

Ⅱ 四大门户网站是哪四大网站.还有什么几大搜索引擎又

新浪:四大综合门户网站之首,中国门户网站的“老大哥”,办得最为齐全也是最好的门户网站之一,同时也是最为受欢迎的中文综合门户网站。新浪已成为国内最大的网络内容服务及无线增值服务提供商,两项收入均居行业之首。在多项调查评比中,新浪也均被称为最有价值的品牌,最受欢迎的网站。在2004和2005年社科院最新发布的互联网调查报告中,新浪网均被评为网民首选网站。新浪在2004和2005连续两年荣获由北京大学管理案例研究中心和《经济观察报》评出的"中国最受尊敬企业"称号搜狐门户网站经营综合性业务,社区,无线等增值服务,这是它的强项。然而搜狐在新闻上不如新浪,在游戏上不如网易,在电信增值服务方面不如TOM,在搜索方面不如网络,其许多优势被别的网站所掩盖。 网易:作为中国的四大门户网站之一,然其并不在乎这一称号。网易在2005年总收入、净利润分别为2.1亿美元和1.155亿美元方面超过其它三大门户网站居首位,显示出强大的实力。网易已由当初的齐头并进,到如今的成功打造为中国最大的网络社区和门户网站前三甲,证明其当初正确的发展策略。近几年网易成功收购一些有一定影响力的网站,更为其做大强做强扎实的奠定了基础。TOM网作为门户网站的后起之秀,已表现出其强大的增长势头。无线互联网服务是其最大的优势之处,别的门户网在这方面明显不及TOM网站。作为一个成功的门户网站,TOM的新闻、体育、娱乐、财经、汽车、游戏等资讯,1.5G超大免费邮箱,论坛、聊天、相册、贺卡、BLOG等方面也呈现出良好的发展势头。

Ⅲ 四大搜索引擎国家到底有哪些

Alexa 目前来居世界四大搜索引擎自第一位,已超过Googlegoogleyahoo 前几大搜索引擎都是出自美国适用范围广 只有网络是中国的因为国内人口基数多基本都是用网络国内中常用的网络 360 搜狗 其他的都是占很小比例

Ⅳ 搜索引擎是什么

什么是搜索引擎,你知道吗?搜索引擎与浏览器是完全不同的,浏览器并不是搜索引擎。想必大家已经是一头雾水,那么就让小编帮大家解开疑惑吧!首先我们来了解何为搜索引擎。它是将与用户检索内容相关的信息展示给用户的系统。而浏览器是指可以显示网页服务器或是文件系统的HTML文件内容,让用户与这些文件交互的一种软件。简单来说搜索引擎就是一个网站,为用户提供收集到的信息资料,类似于中介的身份。浏览器上的搜索框实质上是搜索引擎和浏览器合作的产物。曾经听过一个很形象的比喻:如果把互联网比作商场,搜索引擎就是导购,浏览器就是逛商场时穿的鞋子。搜索引擎需要用浏览器访问,它是一项检索服务,是根据一定的策略,用特定的计算机程序,从网上搜集、整理信息并呈现给用户。如网络、360、搜狗等都是搜索引擎。每一个浏览器都有自己默认的搜索引擎,像IE的默认搜索引擎是Bing搜索,360极速浏览器的搜索引擎是360搜索,搜狗浏览器默认的搜索引擎是搜狗搜索。目前我们主流的搜索引擎有360 、网络、搜狗、有道等。下面小编就给大家科普一下几个主要的搜索引擎。1. 网络搜索引擎。网络是目前全球最大的中文搜索引擎,也是国内使用量最大的搜索引擎,它的创始人是李彦宏、徐勇。它是于2000年1月诞生于北京中关村。2. 360搜索引擎。它是在2012年8月16日由奇虎360推出的搜索引擎,因为360搜索是依靠360 安全卫士和360安全浏览器所拥有的广大用户群,所以在一开始上线时就获得了很大的流量。360搜索的前身为好搜搜索,后于2016年2月1日更名为360搜索。3. 搜狗搜索。是全球首个第三代互动式中文搜索引擎,诞生于2004年8月3日,其属于搜狐旗下,搜狗搜索的优势在于搜狐原有的网游、博客、论坛等业务已吸引了海量的用户,这使得搜狗在搜索引擎中很快就占据了一席之地。

Ⅳ 四大搜索引擎是什么

四大搜索引擎是网络、谷歌、搜狗、雅虎。

Ⅵ 搜索引擎可划分为哪四个子系统每个子系统的功能分别是什么

搜索引战可划分为哪四个系统?每个子系统功能分别是什么呢?

Ⅶ 四大搜索引擎是什么

Alexa 目前居世界四大搜索引擎第一位,已超过Google googleyahoo 2004年 5月 据Alexa最新显示网络已经成为全球第四大网站。

Ⅷ 搜索引擎可划分为哪四个子系统每个子系统的功能是什么

您好,实际复上搜索引擎是由制的五个子系统组成的,下面来说说每个子系统的功能:

网页抓取系统

网页抓取系统的工作原理是首先搜索引擎派出爬行蜘蛛搜索整个互联网的网页,并沿着网页上的每一个链接继续向下抓取

数据分析和处理系统

当蜘蛛抓取的网页下载回来之后,数据分析系统便开始工作了,根据搜索引擎收录的标准对网页进行分析,进而判定哪些网页是可以收录的,哪些网页是需要删除的;当数据分析完成之后,接下来便是数据处理系统开始工作,数据处理系统主要原理就是根据搜索引擎的算法对网站的外链、内容、权重、关键词进行分析,然后对网页进行排序。

存储系统

数据存储系统里储存的网页是经过处理系统处理过的干净数据,并且根据网页的内容进行了分类。

缓存系统

一般缓存系统分为临时缓存区和时段缓存区,临时缓存系统主要是针对临时网页的排名,而时段缓存区一般是24小时变动一次。

展示系统

展示系统中的数据都是被处理好的,包括网页的排名,网页的权重计算等等,只要用户进行搜索,这些数据就可以快速地展现在用户面前,而不需要进行新一轮的抓取、处理、排序等复杂工作。

Ⅸ 四大搜索引擎分别有什么特点,流量来源各有什么不同

四大搜索引擎:

网络搜索

360搜索

搜狗搜索

谷歌搜索

在搜索引擎里输入你要搜索的关键字,通常得到很多搜索结果,这些搜索结果的排名有先后之分,这就是搜索引擎排名。搜索引擎蜘蛛从数据库中已知的网页开始出发,就像正常用户的浏览器一样访问这些网页并抓取文件。对搜索词进行处理后,搜索引擎排序程序开始工作,从索引数据库中找出所有包含搜索词的网页,并根据排名算法计算出哪些网页应该排在前面,然后按一定的格式返回“搜索”页面。然后进行排序过程只须一两秒之内就能找到并返回您所要的结果。

Ⅹ 四大检索系统的四大检索系统

我国被四大系统收录的论文数量逐年增长。学校在1512工程建设及科技成果奖励方案中均十分重视四大系统,也已成为教师和科研人员提升自己的努力方向。