求真百科欢迎当事人提供第一手真实资料,洗刷冤屈,终结网路霸凌。

时间序列查看源代码讨论查看历史

事实揭露 揭密真相
跳转至: 导航搜索
时间序列
原图链接

时间序列(英语:time series)是一组按照时间发生先后顺序进行排列的数据点序列。

  • 通常一组时间序列的时间间隔为一恒定值(如1秒,5分钟,12小时,7天,1年),因此时间序列可以作为离散时间数据进行分析处理。
  • 时间序列广泛应用于数理统计、信号处理、模式识别、计量经济学、数学金融、天气预报地震预测、脑电图、控制工程、航空学、通信工程以及绝大多数涉及到时间数据测量的应用科学与工程学。
  • 时间数列是指将某一现象所发生的数量变化,依时间的先后顺序排列,以揭示随著时间的推移,这一现象的发展规律,从而用以预测现象发展的方向及其数量。

时间序列的组成因素与作用

  • 时间序列的定义:时间序列也叫动态序列,是指把某种现象在不同时间上的各个变量值按照时间的先后顺序排列而形成的一种序列。
  • 时间序列由以下两个因素组成:
    • 时间要素,某一现象发生的时间,包括时间单位和时间长短;
    • 数据要素,即现象在不同时间上的变量值。
  • 时间序列通常有以下几个作用:
    • 深入揭示现象变化的数量特征;
    • 反映现象发展变化的趋势和规律;
    • 揭示现象变化的内在原因,为预测和决策提供可靠的数量信息。例如、我们通过啤酒销量的时间序列表来预测啤酒销量的发展趋势;
  • 时间序列能够构成,是因为现象的发展变化是多种因素影响的综合结果,由于各种因素的作用方向和影响程度不同,使具体的时间序列呈现出不同的变动形态。
  • 时间序列分析的任务就是要正确地确定时间序列的性质,对影响时间序列的各种因素加以分解和测定,以便对未来的状况作出判断和预测。这些因素按照性质可以划分为:长期趋势、季节变动、循环变动和不规则变动。[1]

时间序列资料的特性

  • 对于时序资料的特点的分析,会从资料的写入、查询和储存这三个维度来阐述,通过对其特点的分析,来推演对时序资料库的基本要求。
  • 资料写入的特点:
    • 写入平稳、持续、高并发高吞吐:时序资料的写入是比较平稳的,这点与应用资料不同,应用资料通常与应用的访问量成正比,而应用的访问量通常存在波峰波谷。
    • 写多读少:时序资料上95%-99%的操作都是写操作,是典型的写多读少的资料。
    • 实时写入最近生成的资料,无更新:时序资料的写入是实时的,且每次写入都是最近生成的资料,这与其资料生成的特点相关,因为其资料生成是随著时间推进的,而新生成的资料会实时的进行写入。
    • 资料写入无更新,在时间这个维度上,随著时间的推进,每次资料都是新资料,不会存在旧资料的更新,不过不排除人为的对资料做订正。
  • 资料查询和分析的特点:
    • 按时间范围读取:通常来说,你不会去关心某个特定点的资料,而是一段时间的资料。所以时序资料的读取,基本都是按时间范围的读取。
    • 最近的资料被读取的概率高:最近的资料越有可能被读取,以监控资料为例,你通常只会关心最近几个小时或最近几天的监控资料,而极少关心一个月或一年前的资料。
    • 多精度查询:按资料点的不同密集度来区分不同的精度,例如若相邻资料点的间隔周期是10秒,则该时序资料的精度就是10秒,若相邻资料点的时间间隔周期是30秒,则该时序资料的精度就是30秒。时间间隔越短,精度越高。
    • 精度越高的资料,能够还原的历史状态更细致更准确,但其储存的资料点会越多。
    • 多维分析:时序资料产生自不同的个体,这些个体拥有不同的属性,可能是同一维度的,也可能是不同维度的。
  • 资料储存的特点
    • 资料量大:拿监控资料来举例,如果我们采集的监控资料的时间间隔是1s,那一个监控项每天会产生86400个数据点,若有10000个监控项,则一天就会产生864000000个数据点。在物联网场景下,这个数字会更大。整个资料的规模,是TB甚至是PB级的。
    • 冷热分明:时序资料有非常典型的冷热特征,越是历史的资料,被查询和分析的概率越低。
    • 具有时效性:时序资料具有时效性,资料通常会有一个储存周期,超过这个储存周期的资料可以认为是失效的,可以被回收。[2]

参考来源

  1. 数据分析和挖掘. 每天一点统计学——时间序列分析概论. 每日头条. 2017-03-22 [2020-09-24] (中文). 
  2. 每天一点统计学——时间序列分析概论. ITREAD01.COM. 2018-12-17 [2020-09-24] (中文).