數據
數據(data)是事實或觀察的結果,是對客觀事物的邏輯歸納,是用於表示客觀事物的未經加工的的原始素材。
數據可以是連續的值,比如聲音、圖像,稱為模擬數據,也可以是離散的,如符號、文字,稱為數字數據。在計算機系統中,數據以二進制信息單元0、1的形式表示。
數據:在計算機系統中,各種字母、數字符號的組合、語音、圖形、圖像等統稱為數據,數據經過加工後就成為信息。
在計算機科學中,數據是指所有能輸入到計算機並被計算機程序處理的符號的介質的總稱,是用於輸入電子計算機進行處理,具有一定意義的數字、字母、符號和模擬量等的通稱。是組成地理信息系統的最基本要素,種類很多。
目錄
數據庫的特點
數據庫不同層次之間的聯繫是通過映射進行轉換的。數據庫具有以下主要特點:
(1)實現數據共享。數據共享包含所有用戶可同時存取數據庫中的數據,也包括用戶可以用各種方式通過接口使用數據庫,並提供數據共享。
(2)減少數據的冗餘度。同文件系統相比,由於數據庫實現了數據共享,從而避免了用戶各自建立應用文件。減少了大量重複數據,減少了數據冗餘,維護了數據的一致性。
(3)數據的獨立性。數據的獨立性包括數據庫中數據庫的邏輯結構和應用程序相互獨立,也包括數據物理結構的變化不影響數據的邏輯結構。
(4)數據實現集中控制。文件管理方式中,數據處於一種分散的狀態,不同的用戶或同一用戶在不同處理中其文件之間毫無關係。利用數據庫可對數據進行集中控制和管理,並通過數據模型表示各種數據的組織以及數據間的聯繫。
(5)數據一致性和可維護性,以確保數據的安全性和可靠性。主要包括:①安全性控制:以防止數據丟失、錯誤更新和越權使用;②完整性控制:保證數據的正確性、有效性和相容性;③並發控制:使在同一時間周期內,允許對數據實現多路存取,又能防止用戶之間的不正常交互作用;④故障的發現和恢復:由數據庫管理系統提供一套方法,可及時發現故障和修復故障,從而防止數據被破壞[1]。
數據倉庫
目前,數據倉庫一詞尚沒有一個統一的定義,著名的數據倉庫專家w.h.inmon在其著作《building the data warehouse》一書中給予如下描述:數據倉庫(data warehouse)是一個面向主題的(subject oriented)、集成的(integrate)、相對穩定的(non-volatile)、反映歷史變化(time variant)的數據集合,用於支持管理決策[2]。對於數據倉庫的概念我們可以從兩個層次予以理解,首先,數據倉庫用於支持決策,面向分析型數據處理,它不同於企業現有的操作型數據庫;其次,數據倉庫是對多個異構的數據源有效集成,集成後按照主題進行了重組,並包含歷史數據,而且存放在數據倉庫中的數據一般不再修改。