打开主菜单

求真百科

時間序列

時間序列
原圖鏈接

時間序列(英語:time series)是一組按照時間發生先後順序進行排列的數據點序列。

  • 通常一組時間序列的時間間隔為一恆定值(如1秒,5分鐘,12小時,7天,1年),因此時間序列可以作為離散時間數據進行分析處理。
  • 時間序列廣泛應用於數理統計、信號處理、模式識別、計量經濟學、數學金融、天氣預報地震預測、腦電圖、控制工程、航空學、通信工程以及絕大多數涉及到時間數據測量的應用科學與工程學。
  • 時間數列是指將某一現象所發生的數量變化,依時間的先後順序排列,以揭示隨著時間的推移,這一現象的發展規律,從而用以預測現象發展的方向及其數量。

時間序列的組成因素與作用

  • 時間序列的定義:時間序列也叫動態序列,是指把某種現象在不同時間上的各個變量值按照時間的先後順序排列而形成的一種序列。
  • 時間序列由以下兩個因素組成:
    • 時間要素,某一現象發生的時間,包括時間單位和時間長短;
    • 數據要素,即現象在不同時間上的變量值。
  • 時間序列通常有以下幾個作用:
    • 深入揭示現象變化的數量特徵;
    • 反映現象發展變化的趨勢和規律;
    • 揭示現象變化的內在原因,為預測和決策提供可靠的數量信息。例如、我們通過啤酒銷量的時間序列表來預測啤酒銷量的發展趨勢;
  • 時間序列能夠構成,是因為現象的發展變化是多種因素影響的綜合結果,由於各種因素的作用方向和影響程度不同,使具體的時間序列呈現出不同的變動形態。
  • 時間序列分析的任務就是要正確地確定時間序列的性質,對影響時間序列的各種因素加以分解和測定,以便對未來的狀況作出判斷和預測。這些因素按照性質可以劃分為:長期趨勢、季節變動、循環變動和不規則變動。[1]

時間序列資料的特性

  • 對於時序資料的特點的分析,會從資料的寫入、查詢和儲存這三個維度來闡述,通過對其特點的分析,來推演對時序資料庫的基本要求。
  • 資料寫入的特點:
    • 寫入平穩、持續、高併發高吞吐:時序資料的寫入是比較平穩的,這點與應用資料不同,應用資料通常與應用的訪問量成正比,而應用的訪問量通常存在波峰波谷。
    • 寫多讀少:時序資料上95%-99%的操作都是寫操作,是典型的寫多讀少的資料。
    • 實時寫入最近生成的資料,無更新:時序資料的寫入是實時的,且每次寫入都是最近生成的資料,這與其資料生成的特點相關,因為其資料生成是隨著時間推進的,而新生成的資料會實時的進行寫入。
    • 資料寫入無更新,在時間這個維度上,隨著時間的推進,每次資料都是新資料,不會存在舊資料的更新,不過不排除人為的對資料做訂正。
  • 資料查詢和分析的特點:
    • 按時間範圍讀取:通常來說,你不會去關心某個特定點的資料,而是一段時間的資料。所以時序資料的讀取,基本都是按時間範圍的讀取。
    • 最近的資料被讀取的概率高:最近的資料越有可能被讀取,以監控資料為例,你通常只會關心最近幾個小時或最近幾天的監控資料,而極少關心一個月或一年前的資料。
    • 多精度查詢:按資料點的不同密集度來區分不同的精度,例如若相鄰資料點的間隔週期是10秒,則該時序資料的精度就是10秒,若相鄰資料點的時間間隔週期是30秒,則該時序資料的精度就是30秒。時間間隔越短,精度越高。
    • 精度越高的資料,能夠還原的歷史狀態更細緻更準確,但其儲存的資料點會越多。
    • 多維分析:時序資料產生自不同的個體,這些個體擁有不同的屬性,可能是同一維度的,也可能是不同維度的。
  • 資料儲存的特點
    • 資料量大:拿監控資料來舉例,如果我們採集的監控資料的時間間隔是1s,那一個監控項每天會產生86400個數據點,若有10000個監控項,則一天就會產生864000000個數據點。在物聯網場景下,這個數字會更大。整個資料的規模,是TB甚至是PB級的。
    • 冷熱分明:時序資料有非常典型的冷熱特徵,越是歷史的資料,被查詢和分析的概率越低。
    • 具有時效性:時序資料具有時效性,資料通常會有一個儲存週期,超過這個儲存週期的資料可以認為是失效的,可以被回收。[2]

目录

参考來源

  1. 數據分析和挖掘. 每天一點統計學——時間序列分析概論. 每日頭條. 2017-03-22 [2020-09-24] (中文). 
  2. 每天一點統計學——時間序列分析概論. ITREAD01.COM. 2018-12-17 [2020-09-24] (中文).