求真百科欢迎当事人提供第一手真实资料,洗刷冤屈,终结网路霸凌。

中文搜索引擎查看源代码讨论查看历史

事实揭露 揭密真相
跳转至: 导航搜索
中文搜索引擎

中文名: 中文搜索引擎

外文名: Chinese search engine

性 质: 自动搜索信息

中文搜索引擎指的是中文类的搜索引擎,中文引擎,国内浏览网页大多均采用中文搜索引擎[1]


中文搜索引擎

百度360搜索搜狗搜索、网易有道。


国内目录索引


搜狐(Sohu)— 国内三大门户之一,最早在国内推出搜索引擎收费登录服务。


新浪(Sina)— 最大的中文门户网站,同样也推出了搜索引擎收费索引项目。


网易(Netease)— 网易搜索是ODP的国内翻版,其目录由志愿管理员维护,是google的网页搜索用户。


国内搜索引擎


百度(Baidu)— 国内唯一商业化的全文搜索引擎,提供搜狐、新浪、Tom等站点网页搜索服务。


中搜(ZhongSou)— 网络猪是一只神奇的小猪,是中国搜索强力推出的桌面软件,但它不仅仅是一个软件,而是代表了新一代的搜索文化 ――快乐搜索。


搜索引擎对比

搜狐、新浪,263等三十多家网站公司均采用中文搜索引擎。相反网易、雅虎、netscape、Deja等全球一百三十多家公司采用Google,各大引擎竞相模仿Google的功能和特色,如网页快照,偏好设置等。而且Google引擎的技术发展很快,经常有更新的技术诞生;而Go,GoTo等 许多公司则采用全球另一著名引擎--overturn,其特点是搜索很准,速度尚可,但商业化太重。过去Lycos公司收购了altavista,hotbot ,成为全球最重要的搜索公司,然而Lycos的精准、hotbot的全的风格却并没有保留,已经明显逊色于google等着名专业引擎了,尤其是 速度太慢。dmoz只搜索站点,但所有站点皆是精选而成。可确保每一个均极佳,而且还可自定义站点,不过对中文支持不理想。All the Web与Google类似,均支持中英文等多语言,速度快,搜索面广,然而必须先选择语言,否则可能出现乱码,而不如Google自动识别多种 语言。而且界面较Google逊色。这几大引擎已成为最主要的引擎,另外象search163, search,excite, northernlight,AltaVista,HotBot,Infoseek,等是过去名声赫赫的,但近来发展却不十分如意,尤其是Excite,过去其中文引擎很有特色,被广泛采用,虽仍支持中文,但数据库已太小,无法收到新的内容了,而英文方面又不如Google快捷,数据库大。Hotbot曾全球排名第一(搜索页面数),自从被Lycos收并后,反而不行了,而且不支持中文。wisenut和teoma刚刚兴起,极具代表性引擎,它们还不能对Google构成危胁,而且二者均是 英文的,前者速度类似Google,非常快,数据库也较大,而后者界面几乎完成模仿Google,但速度稍差数据库偏小。因而综合引擎主要选择上述几家引擎,如果能恰当应用的话,几乎能找到一切所需的东西。其中Google继承了原Altavista的多语言风格,而且由于网易的购 卖,它对简、繁体中文支持都十分良好。但其它英文引擎却不可。


工作原理

搜索引擎的工作原理大致可以分为:


搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链接,机器人便可以遍历绝大部分网页。


整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。


接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。


搜索引擎主要返回以网页链接的形式提供的,通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。


发展史

1996年8月成立的搜狐公司是最早参与作网络信息分类导航的网站,曾一度有“出门找地图,上网找搜狐的”美誉。由于其人工分类提交 的局限性,随着网络信息的暴增,逐渐被基于robot自动抓取智能分类的新一代信息技术取代。


1998年1月,台湾中正大学吴升教授所领导的GAIS实验室创立了Openfind中文搜索引擎,是最早开发的中文智能搜索引擎,采用GAIS实验室推出多元排序(PolyRankTM)核心技术,截止2002年6月,宣布累计抓取网页35亿,开始进入英文搜索领域。


北大天网是教育网最流行的搜索引擎,它由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务, 2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大 的ftp搜索功能。


中文搜索由超链分析专利发明人、前Infoseek资深工程师李彦宏和好友徐勇2000年1月创建,支持网页信息检索,图片,Flash,音乐等多 媒体信息的检索。并且在中文领域第一个开始使用ppc经营模式。


2002年开始进入搜索引擎市场的中搜是由慧聪国际主持开发的,是搜索领域的后起之秀。处于起步阶段,技术没有特别见长的优势。


搜索引擎商务

搜索引擎的商务是一种新的商业模式,在国内的大多数人还在用网址大全去寻找商业平台网站的时候,搜索引擎营销的方式慢慢的兴起,传奇私服 、网站建设 、网站制作 、网站推广, 猎头越来越多的买家又或卖家通过搜索引擎来寻找自己的需要。其中以google最为出名,可以说是一代搜索引擎的楷模。google以其优秀的搜索算法,不被竞价排名所笼罩的口碑成为全世界最为出名的搜索引擎。


参考来源