搜寻引擎
搜寻引擎 |
---|
|
搜寻引擎(英语:search engine)是一种资讯检索系统,旨在协助搜寻储存在电脑系统中的资讯。搜寻结果一般被称为“hits”,通常会以表单的形式列出。网路搜寻引擎是最常见、公开的一种搜寻引擎,其功能为搜寻全球资讯网上储存的资讯。
目录
概述
搜索引擎是设计用于执行网络搜索的软件系统。他们以系统的方式在万维网上搜索文本网络搜索查询中指定的特定信息。搜索结果通常以一行结果的形式呈现,通常称为搜索引擎结果页面(SERP)。这些信息可能是网页、图像、视频、信息图表、文章、研究论文和其他类型文件的链接的混合。 一些搜索引擎还挖掘数据库或开放目录中可用的数据。不像仅由人工编辑维护的网络目录,搜索引擎还通过在网络爬虫上运行算法来维护实时信息。任何不能被网络搜索引擎索引和搜索的基于互联网的内容都属于深度网络的范畴。
搜索引擎的诞生
第一个互联网搜索引擎早于 1990 年 12 月 Web 的首次亮相:WHOIS用户搜索可以追溯到 1982 年,而Knowbot 信息服务多网络用户搜索于 1989 年首次实施。第一个有据可查的搜索搜索内容文件(即FTP文件)的引擎是Archie,于 1990 年 9 月 10 日首次亮相。
在 1993 年 9 月之前,万维网完全是手动索引的。有一份由Tim Berners-Lee编辑并托管在CERN网络伺服器上的网络伺服器列表。1992 年列表的一个快照仍然存在,但随著越来越多的 Web 伺服器上线,中央列表无法再跟上。在NCSA网站上,新伺服器以“What's New!”为标题公布。
第一个用于在Internet上搜索内容(相对于用户)的工具是Archie。这个名字代表没有“v”的“存档”。它由加拿大魁北克省蒙特利尔市麦吉尔大学计算机科学专业的学生Alan Emtage 创建。该程序下载了位于公共匿名 FTP(文件传输协议)站点上的所有文件的目录列表,创建了一个可搜索的文件名数据库;然而,阿奇搜索引擎没有索引这些网站的内容,因为数据量非常有限,可以很容易地手动搜索。
Gopher (由明尼苏达大学的Mark McCahill于1991 年创建)的兴起导致了两个新的搜索程序Veronica和Jughead。像 Archie 一样,他们搜索存储在 Gopher 索引系统中的文件名和标题。Veronica(Very E asy R odent - O riented N et-wide Index to C omputerized A rchives)提供了对整个 Gopher 列表中大多数 Gopher 菜单标题的关键字搜索。Jughead ( J onzy 的通用歌唱机)Hierarchy E xcavation A nd D isplay )是一种从特定 Gopher 服务器获取菜单信息的工具。虽然搜索引擎“ Archie Search Engine ”的名称不是指Archie 漫画系列,但“ Veronica ”和“ Jughead ”是该系列中的角色,因此引用了它们的前身。
运作
网路搜寻引擎原理有两个主要功能:爬行网站 (crawling) 跟建立网站索引 (index),并且提供一个搜寻引擎认为最相关的结果列表给搜寻的人们,并且使用网页相关性去排序 / 排名 (ranking) 这些搜寻结果网页。
- 爬行与建立索引:
在网路上爬行并且索引数千万字的文件、网页、档案、影片、与各式媒体。网路的连结结构会把所有网路上的网页绑定在一起连结让 Google 搜寻引擎的自动化机器人,被称为爬行者 (crawlers) 或蜘蛛 (spiders) 去接触数以千万计的档案。当搜寻引擎找到新的网页,他们就会阅读理解这些页面中的程式码,并且把选定帮助他们认识这个网页的程式码片段储存在数据库当中,当需要在搜寻查询被使用的时候再找出来使用。为了完成了解数十亿网页的庞大任务, Google 搜索引擎已经在世界各地建立了数据中心。
当搜寻引擎找到新的网页,他们就会阅读理解这些页面中的程式码,并且把选定帮助他们认识这个网页的程式码片段储存在数据库当中,当需要在搜寻查询被使用的时候再找出来使用。为了完成了解数十亿网页的庞大任务, Google 搜索引擎已经在世界各地建立了数据中心。
- 提供搜寻结果:
为使用者提供答案到搜寻搜寻查询结果,通常通过他们检索的相关页面列表进行查询,并进行相关性排序 / 排名。
相关性与人气
搜寻引擎如何决定相关性与人气,这是许多人想要了解的。对于搜索引擎而言,“相关性”的意义不仅仅在于找到合适的词汇。在网路建立的早期,搜索引擎只能检查网站是否有搜寻查询提到的词汇,搜索结果的价值有限。多年来,聪明的工程师已经设计出更好的方法来将结果与搜索者的疑问进行配对。直到今天则有了数百个因素去影响相关性,只要能够掌握最主要的因素,便能做出好的 SEO 了。搜索引擎通常假设网站的页面或档案越受欢迎,它所包含的信息就越有价值,然而人气和相关性不是手动确定的,引擎使用演算法,从谷壳中挑出小麦(相关性),然后按质量(人气)排序小麦。
获得更好排名
Google 建议您在搜索引擎中获得更好的排名:
- 请确保你的网站是给使用者看的,而不是给搜索引擎看的。不要欺骗使用者,也不要向搜索引擎展示 A 资讯,却给使用者看 B 资讯,这种做法通常被称为“隐藏(Cloaking)”。
- 建立一个明确的层次和文字连结的网站。每个页面至少应该有一个静态内文连结,建立一个有用的且资讯丰富的网站,并写出清晰准确地描述您的内容的网页。
- 确保你的 <title> 元素和 ALT 属性是描述性且准确的。
- 使用关键字创建描述性的且人性化的网址;当Google 在爬行你的网站时,要避免重复的内容被 Google 看见,请使用 301 重新导向或 rel =“canonical” 属性告诉 Google 哪个网址是拥有该内容所有权,应该要被爬行到的。[1]
隐藏功能
Chrome浏览器网址列,暗藏了五个超实用功能,直接透过网址,立即就显示搜寻结果,且完全无需开启任何的页面,真的是相当的方便,而今天要再来分享另一个,也是相当的实用的功能,而这些功能则是隐藏在Google搜寻引擎中,比方像是大家最常用的计算机、色盘、汇率、时间差…..[2]
一、色盘(#000000):当与设计师在作沟通时,色码是一定少不了,这时只需在搜寻框中,输入#000000按下Enter键,立即就会开启色盘功能,完全不用再开启任何的影像软体。
二、计算机:虽然说透过Chrome浏览器的网址列,也可使用计算功能,但输入计算机,所出现的则是完整的计算机功能,可作更进阶的计算。
三、翻译:当输入翻译时,立即就会出现翻译的输入框,就可在此进行单字或句子的查寻。
四、电影时刻表(片名+戏院):当要查询电影时刻表时,只需输入片名+戏院名称后,立即就会出现,今日与明日的场次。
五、银行代码(银行名称(分行)+代码):当要汇款时,不知银行代码时,只需输入银行名称+代码,立即就会显示银行代码,甚至若要查询银行的分行,也可透过此方法,就可快速的查询出银行代码。
六、时差(国别台湾时差):像梅干当初租用的主机为英国时,这时就得了解英国和台湾时差,这样在设定排程时,才不会出错,而方法也很简单,只需输入英国+台湾+时差,立即就会显示,二国的当地的时间与时差。
七、天气预报(地区+天气):当要出游时,天气好不好也是出游的关键,这时只需输入地区+天气,除了有一周的天气预报外,还可查看雨状况。
八、汇率(国家+元):先前透过Chrome网址列,需输入国别代码,但透过Google搜寻引擎时,只需输入国别+元,像是日元、美元、欧元..,立即就会显示该国的币值汇率。
九、股价(股号):当要查询股价时,只需输入股号代码后,除了会显示股票名称、每股价格外,下方还可看到像是本益比、殖利率等相关资讯。
十、尺寸表:尺寸也是大家日常所会用到的,比方证件照多大,这时只需要入证件照+尺寸,立即就会显示相关的资讯,当要查询别的时,像是鞋子、床、A4时,只需输入“纸张尺寸/鞋子尺寸/床尺寸”….等。
参考资料
- ↑ Google 搜寻引擎是怎么运作的?搜寻引擎行销必了解原理吐司边的都市小资生活
- ↑ Google 搜寻引擎隐藏10大密技!快速开启计算机、天气预报、汇率、时差、色盘…。梅问题数学网