求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

搜尋引擎查看源代码讨论查看历史

跳转至: 导航搜索

搜尋引擎

圖片來自playpcesor

搜尋引擎(英語:search engine)是一種資訊檢索系統,旨在協助搜尋儲存在電腦系統中的資訊。搜尋結果一般被稱為「hits」,通常會以表單的形式列出。網路搜尋引擎是最常見、公開的一種搜尋引擎,其功能為搜尋全球資訊網上儲存的資訊。

概述

搜索引擎是設計用於執行網絡搜索的軟件系統。他們以系統的方式在萬維網上搜索文本網絡搜索查詢中指定的特定信息。搜索結果通常以一行結果的形式呈現,通常稱為搜索引擎結果頁面(SERP)。這些信息可能是網頁、圖像視頻、信息圖表文章、研究論文和其他類型文件的鏈接的混合。 一些搜索引擎還挖掘數據庫或開放目錄中可用的數據。不像僅由人工編輯維護的網絡目錄,搜索引擎還通過在網絡爬蟲上運行算法來維護實時信息。任何不能被網絡搜索引擎索引和搜索的基於互聯網的內容都屬於深度網絡的範疇。

搜索引擎的誕生

第一個互聯網搜索引擎早於 1990 年 12 月 Web 的首次亮相:WHOIS用戶搜索可以追溯到 1982 年,而Knowbot 信息服務多網絡用戶搜索於 1989 年首次實施。第一個有據可查的搜索搜索內容文件(即FTP文件)的引擎是Archie,於 1990 年 9 月 10 日首次亮相。

在 1993 年 9 月之前,萬維網完全是手動索引的。有一份由Tim Berners-Lee編輯並託管在CERN網絡伺服器上的網絡伺服器列表。1992 年列表的一個快照仍然存在,但隨著越來越多的 Web 伺服器上線,中央列表無法再跟上。在NCSA網站上,新伺服器以“What's New!”為標題公佈。

第一個用於在Internet上搜索內容(相對於用戶)的工具是Archie。這個名字代表沒有“v”的“存檔”。它由加拿大魁北克省蒙特利爾市麥吉爾大學計算機科學專業的學生Alan Emtage 創建。該程序下載了位於公共匿名 FTP(文件傳輸協議)站點上的所有文件的目錄列表,創建了一個可搜索的文件名數據庫;然而,阿奇搜索引擎沒有索引這些網站的內容,因為數據量非常有限,可以很容易地手動搜索。

Gopher (由明尼蘇達大學的Mark McCahill於1991 年創建)的興起導致了兩個新的搜索程序Veronica和Jughead。像 Archie 一樣,他們搜索存儲在 Gopher 索引系統中的文件名和標題。Veronica(Very E asy R odent - O riented N et-wide Index to C omputerized A rchives)提供了對整個 Gopher 列表中大多數 Gopher 菜單標題的關鍵字搜索。Jughead ( J onzy 的通用歌唱機)Hierarchy E xcavation A nd D isplay )是一種從特定 Gopher 服務器獲取菜單信息的工具。雖然搜索引擎“ Archie Search Engine ”的名稱不是指Archie 漫畫系列,但“ Veronica ”和“ Jughead ”是該系列中的角色,因此引用了它們的前身。

運作

網路搜尋引擎原理有兩個主要功能:爬行網站 (crawling) 跟建立網站索引 (index),並且提供一個搜尋引擎認為最相關的結果列表給搜尋的們,並且使用網頁相關性去排序 / 排名 (ranking) 這些搜尋結果網頁。

  • 爬行與建立索引:
    在網路上爬行並且索引數千萬字的文件、網頁、檔案、影片、與各式媒體。網路的連結結構會把所有網路上的網頁綁定在一起連結讓 Google 搜尋引擎的自動化機器人,被稱為爬行者 (crawlers) 或蜘蛛 (spiders) 去接觸數以千萬計的檔案。當搜尋引擎找到新的網頁,他們就會閱讀理解這些頁面中的程式碼,並且把選定幫助他們認識這個網頁的程式碼片段儲存在數據庫當中,當需要在搜尋查詢被使用的時候再找出來使用。為了完成了解數十億網頁的龐大任務, Google 搜索引擎已經在世界各地建立了數據中心。

當搜尋引擎找到新的網頁,他們就會閱讀理解這些頁面中的程式碼,並且把選定幫助他們認識這個網頁的程式碼片段儲存在數據庫當中,當需要在搜尋查詢被使用的時候再找出來使用。為了完成了解數十億網頁的龐大任務, Google 搜索引擎已經在世界各地建立了數據中心。

  • 提供搜尋結果:
    為使用者提供答案到搜尋搜尋查詢結果,通常通過他們檢索的相關頁面列表進行查詢,並進行相關性排序 / 排名。

相關性與人氣

搜尋引擎如何決定相關性與人氣,這是許多人想要了解的。對於搜索引擎而言,「相關性」的意義不僅僅在於找到合適的詞彙。在網路建立的早期,搜索引擎只能檢查網站是否有搜尋查詢提到的詞彙,搜索結果的價值有限。多年來,聰明的工程師已經設計出更好的方法來將結果與搜索者的疑問進行配對。直到今天則有了數百個因素去影響相關性,只要能夠掌握最主要的因素,便能做出好的 SEO 了。搜索引擎通常假設網站的頁面或檔案越受歡迎,它所包含的信息就越有價值,然而人氣和相關性不是手動確定的,引擎使用演算法,從穀殼中挑出小麥(相關性),然後按質量(人氣)排序小麥

獲得更好排名

Google 建議您在搜索引擎中獲得更好的排名:

  1. 請確保你的網站是給使用者看的,而不是給搜索引擎看的。不要欺騙使用者,也不要向搜索引擎展示 A 資訊,卻給使用者看 B 資訊,這種做法通常被稱為「隱藏(Cloaking)」。
  2. 建立一個明確的層次和文字連結的網站。每個頁面至少應該有一個靜態內文連結,建立一個有用的且資訊豐富的網站,並寫出清晰準確地描述您的內容的網頁
  3. 確保你的 <title> 元素和 ALT 屬性是描述性且準確的。
  4. 使用關鍵字創建描述性的且人性化的網址;當Google 在爬行你的網站時,要避免重複的內容被 Google 看見,請使用 301 重新導向或 rel =“canonical” 屬性告訴 Google 哪個網址是擁有該內容所有權,應該要被爬行到的。[1]

隱藏功能

Chrome瀏覽器網址列,暗藏了五個超實用功能,直接透過網址,立即就顯示搜尋結果,且完全無需開啟任何的頁面,真的是相當的方便,而今天要再來分享另一個,也是相當的實用的功能,而這些功能則是隱藏在Google搜尋引擎中,比方像是大家最常用的計算機、色盤匯率、時間差…..[2]
一、色盤(#000000):當與設計師在作溝通時,色碼是一定少不了,這時只需在搜尋框中,輸入#000000按下Enter鍵,立即就會開啟色盤功能,完全不用再開啟任何的影像軟體。
二、計算機:雖然說透過Chrome瀏覽器的網址列,也可使用計算功能,但輸入計算機,所出現的則是完整的計算機功能,可作更進階的計算。
三、翻譯:當輸入翻譯時,立即就會出現翻譯的輸入框,就可在此進行單字或句子的查尋。
四、電影時刻表(片名+戲院):當要查詢電影時刻表時,只需輸入片名+戲院名稱後,立即就會出現,今日與明日的場次。
五、銀行代碼(銀行名稱(分行)+代碼):當要匯款時,不知銀行代碼時,只需輸入銀行名稱+代碼,立即就會顯示銀行代碼,甚至若要查詢銀行的分行,也可透過此方法,就可快速的查詢出銀行代碼。
六、時差(國別台灣時差):像梅干當初租用的主機為英國時,這時就得了解英國台灣時差,這樣在設定排程時,才不會出錯,而方法也很簡單,只需輸入英國+台灣+時差,立即就會顯示,二國的當地的時間與時差。
七、天氣預報(地區+天氣):當要出遊時,天氣好不好也是出遊的關鍵,這時只需輸入地區+天氣,除了有一週的天氣預報外,還可查看狀況。
八、匯率(國家+元):先前透過Chrome網址列,需輸入國別代碼,但透過Google搜尋引擎時,只需輸入國別+元,像是日元美元歐元..,立即就會顯示該國的幣值匯率。
九、股價(股號):當要查詢股價時,只需輸入股號代碼後,除了會顯示股票名稱、每股價格外,下方還可看到像是本益比殖利率等相關資訊。
十、尺寸表:尺寸也是大家日常所會用到的,比方證件照多大,這時只需要入證件照+尺寸,立即就會顯示相關的資訊,當要查詢別的時,像是子、、A4時,只需輸入「紙張尺寸/鞋子尺寸/床尺寸」….等。

參考資料