打开主菜单

求真百科

统计学( statistics ),是在数据分析的基础上,研究测定、收集、整理、归纳和分析反映数据数据,以便给出正确消息的科学。这一门学科自17世纪中叶产生并逐步发展起来,它广泛地应用在各门学科,从自然科学社会科学人文学科,甚至被用于工商业及政府的情报决策。随着大数据时代来临,统计的面貌也逐渐改变,与信息计算等领域密切结合,是数据科学中的重要主轴之一[1]

譬如自一组数据中,可以摘要并且描述这份数据的集中和离散情形,这个用法称作为描述统计学。另外,观察者以数据的形态,创建出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及总体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学数理统计学则是讨论背后的理论基础的学科。

目录

统计学的观念

为了将统计学应用到科学工业以及社会问题上,我们由研究总体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个总体甚至可能由许多次同样的观察程序所组成;由这种数据搜集所组成的总体我们称它叫时间序列

为了实际的理由,我们选择研究总体的子集代替研究总体的每一笔数据,这个子集称做样本。以某种经验设计实验所搜集的样本叫做数据。数据是统计分析的对象,并且被用做两种相关的用途:描述推论

描述统计学处理有关叙述的问题:是否可以摘要的说明数据的情形,不论是以数学或是图片表现,以用来代表总体的性质?基础的数学描述包括了平均数标准差等。图像的摘要则包含了许多种的表和图。主要是就说明数据的集中和离散情形。

推论统计学被用来将数据中的数据模型化,计算它的概率并且做出对于总体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关系性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括方差分析,时间序列,以及数据挖掘

统计计算

计算机在20世纪后半叶的大量应用对统计科学产生了极大的影响。早期统计模型常常为回归线性模型,但强劲的计算机及其算法导致非线性模型(如神经网络)和新式算法(如广义线性模式等级线性模型支持向量机)的大量应用。

计算机性能的增强使得需要大量计算的再取样算法成为时尚,如置换检验、自助法。Gibbs取样法也使得贝叶斯模型[2]更加可行。计算机革命使得统计在未来更加注重“实验”和“经验”。大量普通或专业的统计软件现已面市。

视频

统计学 相关视频

一小时搞定统计学
学好统计学,人生能够开哪些挂

参考文献