求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

變更

前往: 導覽搜尋

统计学

增加 183 位元組, 4 年前
無編輯摘要
''' 统计学 ''' 是在 [[ 数据分析 ]] 的基础上,研究 [[ 测定 ]] 、收集、整理、 [[ 归纳 ]] 和分析反映数据数据,以便给出正确消息的 [[ 科学 ]] 。这一门学科自17世纪中叶产生并逐步发展起来,它广泛地应用在各门学科,从 [[ 自然科学 ]] [[ 社会科学 ]] [[ 人文学科 ]] ,甚至被用于工商业及 [[ 政府 ]] 的情报决策。随着大数据时代来临,统计的面貌也逐渐改变,与 [[ 信息 ]] [[ 计算 ]] 等领域密切结合,是数据科学中的重要主轴之一。
譬如自一组数据中,可以摘要并且描述这份数据的集中和离散情形,这个用法称作为描述统计学。另外,观察者以数据的形态,创建出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及总体,这种用法被称做推论统计学。这两种用法都可以被称作为 [[ 应用统计学 ]] [[ 数理统计学 ]] 则是讨论背后的 [[ 理论基础 ]] 的学科。
==统计学的观念==
为了将统计学应用到科学、工业以及社会问题上,我们由研究总体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个总体甚至可能由许多次同样的观察程序所组成;由这种数据搜集所组成的总体我们称它叫时间序列。
为了 实际的理由 将统计学应用到[[科学]]、[[工业]]以及[[社会问题]]上 ,我们 选择 研究总体 开始。这可能是一个国家的人民,石头中 子集代替研究 [[水晶]],或者是某家特定工厂所生产的[[商品]]。一个 总体 甚至可能由许多次同样 每一笔 观察程序所组成;由这种 数据 ,这个子 称做样本。以某种经验设计实验 搜集 组成 样本 总体我们称它 做数据。数据是统计分析的对象,并且被用做两种相关的用途:描述和推论 [[时间序列]]
描述统计学处 为了实际的 有关叙述 由,我们选择研究总体 问题:是否可以摘要 子集代替研究总体 说明 每一笔 数据 的情形 不论是 这个[[子集]]称做样本。 某种经验设计实验所搜集的样本叫做数据。 学或 图片表现 统计分析的对象 并且被 来代表总体 做两种相关 性质?基础的数学 用途:[[ 描述 包括了平均数 ]] 标准差等。图像的摘要则包含了许多种的表和图。主要是就说明数据的集中和离散情形 [[推论]]
描述统计学处理有关叙述的问题:是否可以摘要的说明数据的情形,不论是以[[数学]]或是图片表现,以用来代表总体的性质?基础的数学描述包括了[[平均数]]和[[标准差]]等。[[图像]]的摘要则包含了许多种的表和图。主要是就说明数据的集中和离散情形。 推论统计学被用来将数据中的 [[ 数据模型 ]] 化,计算它的 [[ 概率 ]] 并且做出对于总体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关系性的预测(相关性),或是将关系 [[ 模型化 ]] (回归)。其他的模型化技术包括方差分析,时间序列,以及 [[ 数据挖掘 ]]
==统计计算==
[[ 计算机 ]] 在20世纪后半叶的大量应用对统计科学产生了极大的影响。早期统计模型常常为回归线性模型,但强劲的计算机及其算法导致 [[ 非线性模型 ]] (如 [[ 神经网络 ]] )和新式算法(如 [[ 广义线性模式 ]] [[ 等级线性模型 ]] [[ 支持向量机 ]] )的大量应用  计算机性能的增强使得需要大量计算的再取样算法成为时尚,如置换检验、[[自助法]]。Gibbs取样法也使得贝叶斯模型更加可行。[[计算机革命]]使得统计在未来更加注重“[[实验]]”和“经验”。大量普通或专业的[[统计软件]]现已面市
计算机性能的增强使得需要大量计算的再取样算法成为时尚,如置换检验、自助法。Gibbs取样法也使得贝叶斯模型更加可行。计算机革命使得统计在未来更加注重“实验”和“经验”。大量普通或专业的统计软件现已面市。==参考文献==
70,960
次編輯