求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

元資料查看源代码讨论查看历史

跳转至: 导航搜索

元資料

圖片來自itsfun

元資料metadata),又稱詮釋資料中介資料中繼資料後設資料等,為描述其他資料資訊的資料。

元資料有六種不同類型,分別是記敘性元資料結構性元資料管理性元資料參考性元資料統計性元資料[1]法律性元資料

  • 記敘性元資料描述了用於發現與辨別意義的資源。它可以包括如標題、摘要、作者和關鍵字等元素。
  • 結構性元資料是有關於資料容器的元資料,指示如何整理其中複合的物件。例如頁面依甚麼排序方式組成章節。
  • 管理性元資料是用於管理資源的資訊,例如資料產生的時間和方式、檔案種類和其它技術資訊,以及誰有權限存取它。
  • 參考性元資料是跟內容及統計數據質量相關的資訊。
  • 統計性元資料,又稱處理過程資料,會描述收集、處理或產生資料的過程。
  • 法律性元資料提供有關作者、版權持有者、及公共授權條款等資訊。

內容簡介

主要是描述資料屬性(property)的資訊,用來支持如指示儲存位置、歷史資料、資源尋找、文件记錄等功能。元資料算是一種電子式目錄,為了達到編製目錄的目的,必須在描述並收藏資料的內容或特色,進而達成協助資料檢索的目的。

該名詞起源於1969年,由Jack E. Myers所提出的.metadata即關於資料的資料,可以說是一種標準,是為支援互通性的資料描述,所取得一致的準則。其基本定義出自OCLC與NCSA所主辦的「Metadata Workshop」研討會。它將metadata定義為「描述資料的資料」(data about data)。此後各種有關Metadata的定義紛紛的出現。現存很多metadata的定義,主要視特定社群或使用情境而不同。如有有關資料的資料(data about data),有關資訊物件之結構的資訊(structured information about an information object),描述資源屬性的資料(Data describes attributes of resources)等。

都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元資料的一種應用,是1995年2月由國際圖書館電腦中心(OCLC)和美國國家超級計算應用中心(National Center for Supercomputing Applications,NCSA)所聯合贊助的研討會,在邀請52位來自圖書館員電腦專家,共同制定規格,建立一套描述網路上電子文件之特徵。

歷史

元資料傳統上用於图书馆卡片目錄,一直到1980年代。2000年代起,數位化成為儲存資料的普遍方式。而圖書館也將其目錄資料轉換為數位資料庫,數位資料也有相關的元資料標準。

不同行業有不同的元資料標準(例如,博物館收藏、數位音樂檔案、網站等)。描述資料或資料檔的背景和內容,增加了實用性。例如一個網頁的元資料包括了有關頁面主題、編寫腳本語言(例如 HTML)、產生頁面的工具,以及哪裡有關於主題的更多資訊。這個元資料可以自動提高閱讀者的體驗,讓使用者更容易在網路上尋找網頁。音樂CD可提供此專輯的音樂家歌手歌曲作者資訊的元資料。

元資料的主要目的是幫助用戶尋找相關資訊並探索資源。元資料也有助於組織電子資源,提供數位識別,並支援歸檔和保存資源。“由相關標準尋找、辨識資源,將相似資源集中在一起,區分不同並提供位置資訊”,元資料可幫助使用者探索資源。各國政府廣泛收集包括互聯網在內的通訊活動元資料,用於流量分析,而且可用於大規模監控

在許多國家有關於電子郵件電話網頁IP連線與手機位置的元資料,是固定由國家儲存的。

定義

元資料是指「描述資料的資料」。雖然說源自於希臘介詞前綴 μετά- 的英文前綴「meta」代表「之後」或「之下」的意思,在此處實際上是使用知識論中「關於」的意思。元資料被定義為提供某些資料單方面或多方面資訊的資料;它被用來概述資料的基礎資訊,以簡化查找過程與方便使用。

例如:

  • 創建資料的方法
  • 資料的用途
  • 建立的時間與日期
  • 資料的建立者或作者
  • 資料被建立在電腦網路的何處
  • 用作標準
  • 檔案大小

舉例,一個數位影像檔案可能會包括描述圖片大小、色彩深度、圖片解析度、圖片建立時間、快門速度等資料的元資料[2]。一份文檔的元資料可能會包含文檔長度、作者、建立時間、文檔概述等資訊。網頁中的元資料也可以包含页面內容的描述,以及有關於內容的關鍵字等等。

這些東西常被稱作「元標籤」(metatags),其在1990年代後期以前被用來當作決定搜尋引擎結果順序的主要因素。在1990年代後期,由於「關鍵字堆砌」的出現,對於元標籤的倚賴程度逐漸降低。元標籤的濫用導致許多搜尋引擎會誤認某些結果的關聯性高於實際值。

元資料可以在被稱作元資料註冊系統元資料儲存庫資料庫中儲存和管理。不過,如果沒有文字和參考點的話,單純看是很難辨認這些元資料的[3]

舉例來說:一個資料庫本身會包含一些數字,但是這些數字代表的涵義可能是某些計算後的結果,或者是書籍的ISBN碼──這就需要參考才能知道,而無法直接由資料容器內部得知。菲利普•巴格利在1968年在他的著作《Extension of Programming Language Concepts》中發明了「metadata」這個詞,當時的意思為「描述資料容器的資料」,也就是結構性元資料,而非描述性元資料或常用於圖書館目錄的元內容(metacontent)。

自那時起,資訊管理、資訊科學、資訊技術、圖書館學與地理資訊系統等領域廣泛接受了這個詞彙。在這些領域中,元資料的定義為「描述資料的資料」[4]。儘管這是最廣為接受的定義,許多學科也為了自用而採用了特殊的解釋或定義。

參考文獻

  1. Directorate, OECD Statistics. OECD Glossary of Statistical Terms - Reference metadata Definition. stats.oecd.org. [2018-05-24]. 
  2. ADEO Imaging: TIFF Metadata. [2013-05-20]. (原始内容存档于2013-05-17). 
  3. Metadata Standards And Metadata Registries: An Overview (PDF). [2011-12-23]. (原始内容存档 (PDF)于2011-06-29). 
  4. NISO. Understanding Metadata (PDF). NISO Press. [5 January 2010]. ISBN 1-880124-62-9. (原始内容 (PDF)存档于2014年11月7日).