统计学
统计学系列条目 |
机率论 |
---|
![]() |

统计学是在资料分析的基础上,研究测定、收集、整理、归纳和分析反映数据资料,以便给出正确讯息的科学。这一门学科自17世纪中叶产生并逐步发展起来,它广泛地应用在各门学科,从自然科学、社会科学到人文学科,甚至被用于工商业及政府的情报决策。随着巨量资料时代来临,统计的面貌也逐渐改变,与资讯、计算等领域密切结合,是数据科学中的重要主轴之一。
譬如自一组数据中,可以摘要并且描述这份数据的集中和离散情形,这个用法称作为叙述统计学。另外,观察者以数据的形态,建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。数理统计学则是讨论背后的理论基础的学科。
总览

很多人认为统计学是一种科学的数学分支,是关于收集、分析、解释、陈述资料的科学。[1]另一些人认为它是数学的一个分支,因为统计学是关于收集解释资料的。[2]由于它基于观测、重视应用,统计学常被看作是一门独特的数学科学,而不是一个数学分支。[3][4]很多统计学都不是数学的:如确保所收集来的资料能得出有效的结论;将资料编码、存档以使得讯息得以储存,可以在国际上进行比对;汇报结果、总结资料,以便统计员可以明白它们的意思;采取必要措施,保护资料来源物件的隐私。
统计学家通过专门的试验设计和调查样本来提升资料品质。统计学自身也为资料的机率模型提供了预测工具。统计学在其他学术科目上得到了广泛的应用,如自然科学、社会科学、政府、商业等。统计顾问可以帮助没有入户调查经验组织与公司进行问卷研究。
总结叙述收集来的资料被称之为叙述统计学。这在进行实验研究讯息交流中十分有用。另外,从资料的分布上也可以得出观测上的随机性和不确定性。
将资料中的数据模型化,计算它的机率并且做出对于母群体的推论被称之为推论统计学。推论是科学进步的重要因素,因为它可能从随机变数中得出资料的结论。推论统计学将命题进行更深入的研究,将结果进行检测。这些都是科学方式的一部分。叙述统计学和对新资料的分析更倾向于提供更多的讯息,逼近命题所述的真理。
「应用统计学」包括叙述统计学和推论统计学中的应用成分。[5]理论统计学则注重统计推论背后的逻辑证明,以及数理统计学。数理统计学不但包括推导估测推论法的机率分布,还包括了计算统计和试验设计。
统计学与机率论联络紧密,并常以后者为理论基础。简单地讲,两者不同点在于机率论从母群体中推导出样本的机率。统计推论则正好相反——从小的样本中得出大的母群体的讯息。
统计学的历史
统计手法最早可以追溯至公元前5世纪。最早的统计著作来自公元9世纪的《密码破译》(Manuscript on Deciphering Cryptographic Messages)一书,由阿拉伯人肯迪编着。在书中,肯迪详细记录了如何使用统计资料和频率分析进行密码破译。根据沙乌地阿拉伯工程师易卜拉欣·阿凯笛(Ibrahim Al-Kadi)的说法,统计学和密码学分析便如此一同诞生了[6][7]
佛罗伦斯银行家、执政官乔瓦尼·维伦编订了佛罗伦斯14世纪历史书籍Nuova Cronica ,包括了如人口、法令、商贸、教育、宗教场所在内的统计资料,被誉之为历史上统计学入门的第一本书。[8]一些学者将1663年约翰·格兰特根据死亡率统计表编订出版的《自然与政治观察》(Natural and Political Observations)一书定格为统计学的诞生。[9]
统计学的英语词statistics是源于现代拉丁语statisticum collegium(国会)以及义大利语statista(国民或政治家)。德语Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是「研究国家的科学」。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。
统计学的初衷是作为政府(通常是中央政府)以及管理阶层的工具。它大量透过国家以及国际统计服务搜集国家以及本土的资料。另外依照各方面,普查则提供关母体的资讯。统计背后牵涉到更多数学导向的领域,如机率,或是从经验科学(特别在天文学)中获得的经验证据设定估计参数。在今日的世界里统计已经被使用在不仅仅是国家或政府的事务,更延伸到商业,自然以及社会科学,医疗等甚至更多方面。因为统计学拥有深厚的历史以及广泛的应用性,统计学通常不只被认为是数学所处理的物件,而是与数学本身的哲学定义与意义有密切的关联。许多知名的大学拥有独立的数理统计学系。统计学也在如心理学,教育学以及公共卫生学系中被视为是一门主科。
统计学的数学基础建立在17世纪布莱兹·帕斯卡和皮埃尔·德·费马发展的机率论上。机率论从研究机率得来。最小平方法由卡尔·弗里德里希·高斯于1794年第一次得出。现代电脑可以进行更大尺度的统计运算,生成了许多无法用人工计算的新公式。
统计学的观念
为了将统计学应用到科学、工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母群体甚至可能由许多次同样的观察程式所组成;由这种资料搜集所组成的母群体我们称它叫时间序列。
为了实际的理由,我们选择研究母群体的子集代替研究母群体的每一笔资料,这个子集称做样本。以某种经验设计实验所搜集的样本叫做资料。资料是统计分析的物件,并且被用做两种相关的用途:描述和推论。
- 叙述统计学处理有关叙述的问题:是否可以摘要的说明资料的情形,不论是以数学或是图片表现,以用来代表母群体的性质?基础的数学描述包括了平均数和标准差等。图像的摘要则包含了许多种的表和图。主要是就说明资料的集中和离散情形。
- 推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母群体的推论。这个推论可能以对/错问题的答案所呈现(假说检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析,时间序列,以及资料探勘。
相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变数(母群体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变数被称做相关的。但是实际上,我们不能直接推论这两个变数中有因果关系;参见相关性推论因果关系(逻辑谬误)。
如果样本足以代表母群体的,那么由样本所做的推论和结论可以被引申到整个母群体之上。最大的问题在于决定样本是否足以代表整个母群体。统计学提供了许多方法来估计和修正样本和搜集资料过程中的随机性(误差),如同上面所提到的透过经验所设计的实验。参见实验设计。
要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。
任何统计方法是有效的只有当这个系统或是所讨论的母群体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。
即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。一些统计科学的结果对于大众而言相当费解。举例来说,统计资料中显著的改变可能是由样本的随机变数所导致,但是这个显著性可能与大众而言难以理解。另外,某些统计学分析(尤其当涉及机率论时)得出的结论可能非常违悖一般人的直觉,如蒙提霍尔问题。人们(甚至包括一些科学家)往往需要统计的技巧(或怀疑)才能理解其正确性。
统计方法
实验与观察性研究
统计研究中的共同目标是分析因果关系,具体来讲就是从预估资料变化中得出结论,或是研究自变数与应变数之间的关系。因果统计研究主要有两种:实验研究和观察研究。在两种研究中,自变数改变对应变数所造成的影响可以被观测到。两种实验间的不同在于实验时如何进行的。两种实验都很厉害。实验研究包括将系统尺度进行研究、操纵系统、使用更多的尺度进行同样的实验来确定操作是否改变了尺度的值。与之相对的是观察研究,观察研究不包括实验性操作。在此,资料被收集,预估资料与回复资料间的相关系数被研究。
实验研究
统计实验的基本步骤如下:
- 设立研究计划,包括找到代表研究专案的资料,使用如下讯息:根据处理效应进行初步预估,备用假说,预估实验变率。对实验目标的选择和道德上的考虑也是必不可少的。统计学家推荐实验(至少)应与另一个相同标准、不同专案的参照组进行对比,以减少偏误。
- 试验设计,使用区组变数来减少干扰变数的影响,将物件进行随机处理,消除估算处理效用与实验误差中的偏误。在此阶段,实验参与者和统计学家填写实验草案,并依此指导实验行程,对实验资料的原始分析进行细化。
- 根据实验草案进行实验、变异数分析。
- 在第二次分析中进一步解析资料,为进一步研究提出新假说。
- 汇报研究结果并将其存档。
对人类行为的实验研究应该多加谨慎。著名的霍桑效应在西方电器公司位于伊利诺州的霍桑工厂(Hawthorne Works)进行心理学实验,研究工作环境改变对生产率的影响。研究人员尝试增强照明,观察它是否有助于提高管线工人的生产率。研究人员首先检测了工厂的生产率,尔后改变车间的照明强度,观察结果。结果是生产率在实验环境下的确提升了。然而,该实验因其流程误差在今天饱受批评,特别是实验缺乏参照组和双盲。霍桑效应指仅从观测来得出结论。该实验中生产率的提升不是因为照明强度的改变,而是因为工人们发觉他们被围观了。
观察研究
观察研究的具体例子是研究吸烟与肺癌之间的相关系数。这种研究常用调查来收集所需讯息的观测结果,并对其进行统计分析。在本案例中,研究人员会收集吸烟和不吸烟者的观察资料,进行病例对照研究,然后观察每组中肺癌患者的数量。
测量的尺度
根据Stevens(1951)对数字的尺度分类,统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目、顺序、等距、等比)在统计过程中各具有不等的实用性。等比尺度(Ratio measurements)拥有零值及资料间的距离是相等被定义的;等距尺度(Interval measurements)资料间的距离是相等被定义的,但是它的零值并非绝对的无,而是自行定义的(如智力或温度的测量);顺序尺度(Ordinal measurements)的意义并非表现在其值而是在其顺序之上;名目尺度(Nominal measurements)的测量值则不具量的意义。
统计术语
虚无假说
对统计讯息的解释时常涉及到构建虚无假说,在该假设中,所有因素对变数都不起任何作用。
对新手来说最佳的比喻就是法庭窘境了。虚无假说H0认为被告是清白的,而对立假说H1则认为被告有罪。起诉是因为怀疑被告有罪。H0(现状)与H1对立并且被认可,除非H1被「超过合理质疑」的证据证伪。然而,「无法排除H0」并不能代表被告清白,只是说证据无法将其定罪。所以,陪审团没有必要在H0「无法推翻」的情况下将其「接受」。当虚无假说无法被「证明」时,可以通过强度检测判断假设是否近似成立,即进行型二错误检测。
误差
当对样本的个体观察偏离了中心资料,如样本或母群体平均数,误差就出现了。许多统计方法尝试将中位数乘法的误差最小化,这种方法被称之为「最小平方法」。
生成统计资料的过程也会产生误差。很多类似误差被是随机(噪音)性的,或是系统(偏倚)性的。但很多其他类型的重大误差(如疏忽:分析员把单位填错了)也是不容忽视的。
区间估计
许多时候研究只观察母群体的样本部分,所以结果并不能完全代表整个母群体。任何来自样本的估算只能得到母群体的近似值。信赖区间是统计学家用来表述样本结果离整个母群体真实数值之间的差距。这常被表述为95%信赖区间。形式上,数值为95%信赖区间意味着如果在同样情况下重复样本分析(这回生成不同的资料集),95%的区间会得出符合(母群体)情况的实际结果。这并不意味着真实数值的机率也在95%信赖区间之内。从频率论的角度来说,这样的说法毫无意义,因为真实数值不是一个随机变数。真实数值要么在,要么不再给定的区间里。然而,任何资料在被抽取样本,设计信赖区间之前,将要被计算的区间确实有95%的机率能代表真实数值:在这一点上,区间的极限仍然是有待被观测的随机变数。利用贝氏统计信赖区间可以得出区间包涵真实数值的机率:这种方法对「机率」有另一种解释,即贝氏机率。
显著性的差异
对于给出的问题,统计学很少回答简单的是或否。它的解释常常是以统计的显著性差异出现,汇报可以将虚无假说精确证伪的机率值(这也被称作是p值、假定值)。
显著性差异并不一定代表所有的结果在现实世界里都很显著。例如对药品的研究得出其具有统计的显著性差异,但是实际上药品可能毫无益处。这样的药品不会很有效地帮助病人康复。
由于假说检定中可能更加偏向于某一假设(如虚无假说),在大尺度研究中可能会对微小差异过度夸张,因此这中方法受到批评。显著性差异所得出的重大差额并不一定在现实中有意义,但是我们仍旧可以据此设计出相应的实验。
在报告假设是否被证伪时,一些方法不仅仅报告显著性差异和p值。p值并不代表效应的尺度。更好更常用的方法使报告信赖区间。虽然该值是从相同的假设测试或p值计算过程中得出的,但是它对效应的尺度及其不确定性都给出了描述。
例子
以下列出一些有名的统计检定方法以及可供验证实验数据的程式
- t检定
- 变异数分析
- 卡方分配
- 费雪最小显著差异法(Fisher's Least Significant Difference test)
- 曼-惠特尼U检定(Mann-Whitney U)
- 回归分析
- 相关性
- 皮尔森积动差相关系数
- 史匹曼等级相关系数
统计学的范畴
延伸的科目
有些科学广泛的应用统计的方法使得他们拥有各自的统计术语,这些学科包括:

- 社会统计(包括所有的社会科学)
- 文献统计分析
- 化学与程式分析(所有有关化学的资料分析与化工科学)
- 运动统计学,特别是棒球以及曲棍球
统计对于商业以及工业是一个基本的关键。他被用来了解与测量系统变异性,程式控制,对资料作出结论,并且完成资料取向的决策。在这些领域统计扮演了一个重要的角色。
统计计算
电脑在20世纪后半叶的大量应用对统计科学产生了极大的影响。早期统计模型常常为回归线性模型,但强劲的电脑及其演算法导致非线性模型(如神经网路)和新式演算法(如广义线性模式、等级线性模型、支持向量机)的大量应用。
电脑效能的增强使得需要大量计算的再取样演算法成为时尚,如置换检定、自助法。Gibbs取样法也使得贝叶斯模型更加可行。电脑革命使得统计在未来更加注重「实验」和「经验」。大量普通或专业的统计软体现已面市。
滥用

统计资料时常被滥用,对结果的解释时常有利于演讲者。[10]对统计的怀疑与误导可被称为:「世上有三种谎言:谎言,该死的谎言,统计数字」。许多对统计的滥用可能出于无意,也可能出于故意。《如何用统计来说谎》一书(How to Lie With Statistics)[10]揭露了许多类似诡计,并在统计的应用与滥用中,回顾了许多案例中的统计方法(e.g. Warne, Lazo, Ramos, and Ritter(2012)。[11]
预防统计滥用包括使用合适的图表、规避偏误。[12]当结论被轻率概化,超过了它所能代表的范围时,滥用就出现了。这常常是因无意或故意忽视样本偏误所导致的。[13] 条形统计图可能是最容易使用、最容易理解的图表了,它可以用手或电脑绘制而成。[13]不巧的是,许多人忽视其中的偏误、误差,因为他们不留意。因此,虽然图表品质低劣,但人们常常愿意去相信。[13]只有当样本可以代表母体时,统计结果才是可信、精确的。[14]哈弗(Huff)称:「样本的可靠性可以被偏误破坏...给你自己点怀疑的空间吧。」[15]
参考文献
- ^ Moses, Lincoln E. (1986) Think and Explain with Statistics, Addison-Wesley, ISBN 978-0-201-15619-5 . pp. 1–3
- ^ Hays, William Lee, (1973) Statistics for the Social Sciences, Holt, Rinehart and Winston, p.xii, ISBN 978-0-03-077945-9
- ^ Moore, David (1992). "Teaching Statistics as a Respectable Subject". In F. Gordon and S. Gordon. Statistics for the Twenty-First Century. Washington, DC: The Mathematical Association of America. pp. 14–25. ISBN 978-0-88385-078-7.
- ^ Chance, Beth L.; Rossman, Allan J. (2005). "Preface". Investigating Statistical Concepts, Applications, and Methods. Duxbury Press. ISBN 978-0-495-05064-3.
- ^ Anderson, D.R.; Sweeney, D.J.; Williams, T.A.. (1994) Introduction to Statistics: Concepts and Applications, pp. 5–9. West Group. ISBN 978-0-314-03309-3
- ^ Al-Kadi, Ibrahim A. (1992) "The origins of cryptology: The Arab contributions」, Cryptologia, 16(2) 97–126. doi:10.1080/0161-119291866801
- ^ Singh, Simon (2000). The code book : the science of secrecy from ancient Egypt to quantum cryptography (1st Anchor Books ed.). New York: Anchor Books. ISBN 978-0-385-49532-5.
- ^ Villani, Giovanni. Encyclopædia Britannica. Encyclopædia Britannica 2006 Ultimate Reference Suite DVD. Retrieved on 2008-03-04.
- ^ Willcox, Walter (1938) "The Founder of Statistics". Review of the International Statistical Institute 5(4):321–328. JSTOR 1400906
- ^ 10.0 10.1 Huff, Darrell (1954) How to Lie With Statistics, WW Norton & Company, Inc. New York, NY. ISBN 978-0-393-31072-6
- ^ Warne, R. Lazo, M., Ramos, T. and Ritter, N. (2012). Statistical Methods Used in Gifted Education Journals, 2006–2010. Gifted Child Quarterly, 56(3) 134–149. doi:10.1177/0016986212444122
- ^ Drennan, Robert D. Statistics in archaeology. Pearsall, Deborah M. (编). Encyclopedia of Archaeology. Elsevier Inc. 2008: 2093–2100. ISBN 978-0-12-373962-9.
- ^ 13.0 13.1 13.2 Cohen, Jerome B. Misuse of Statistics. Journal of the American Statistical Association (JSTOR). 1938年12月, 33 (204): 657–674. doi:10.1080/01621459.1938.10502344.
- ^ Freund, J. F. Modern Elementary Statistics. Credo Reference. 1988.
- ^ Huff, Darrell; Irving Geis. How to Lie with Statistics. New York: Norton. 1954.
The dependability of a sample can be destroyed by [bias]... allow yourself some degree of skepticism.
参见
外部连结
|
|
|
|
|
#
- 1889年
- 2013年波士頓馬拉松爆炸案
- 3-甲基戊烷
- AP統計學
- A型和B型性格
- BP检验
- CP
- F-分布
- Fama-French三因子模型
- JASP
- Jarque-Bera检验
- J语言
- LDA
- Lasso算法
- RMS
- SAT
- SPSS
- SageMath
- T-标准化
- The DoDo Men
- Wolfram Alpha
- Worldometer
- Β-二项式分布
- Η
- Σ
- Χ
- 一致估计量
- 一般线性模型
- 三角形分布
- 上昇時間
- 世界一流大学和一流学科建设
- 世界第一簡單系列
- 东南大学数学学院
- 东西大学 (美国)
- 中介變項
- 中值绝对离差
- 中华人民共和国学科分类
- 中南大学数学与统计学院
- 中国图书馆分类法 (C)
- 中国大陆性侵犯问题
- 中国学科分类国家标准/910
- 中国统计学会
- 中心矩
- 中華統計學誌
- 乔治·沙克伯勒-伊夫林爵士
- 乡村人口
- 事件 (概率论)
- 二項式分布
- 于韦斯屈莱大学
- 互协方差
- 互相关
- 交互作用 (统计学)
- 人口统计学
- 人工智能
- 人工神经网络
- 人类群居学
- 人类阴茎尺寸
- 伊莱·赫克歇尔
- 会员卡
- 伪科学
- 伪随机性
- 伯克森悖论
- 估计理论
- 估计量
- 估计量的偏差
- 似然函数
- 何塞·路易斯·埃斯佩特
- 佩托悖论
- 保序回归
- 保險
- 信息与计算科学
- 信息可视化
- 信息论
- 信賴區間
- 倖存者偏差
- 倾向评分匹配
- 偏最小二乘回归
- 停时
- 傅里叶变换
- 傅里叶正弦、余弦变换
- 傅里叶级数
- 全国哲学社会科学工作办公室
- 公众科学
- 公共行政学
- 共轭先验
- 典型相关
- 典範轉移
- 农业科学
- 决定系数
- 决策树学习
- 函数列表
- 刀切法
- 分位函数
- 分位圖
- 分位數迴歸
- 分子生態學
- 分子运动论
- 分子进化遗传学分析
- 分层广义线性模型
- 分类变量
- 刚果攀鼠亚科
- 删失
- 利特尔伍德定律
- 化学信息学
- 化学计量学
- 化學
- 北京大学数学科学学院
- 华中科技大学
- 华中科技大学数学与统计学院
- 协方差函数
- 协方差矩阵
- 卡尔·威廉·路德维希·沙利叶
- 卡方分佈
- 卡门·米罗
- 卷积
- 参数统计
- 双标图
- 双生子研究
- 反特征值理论
- 变异系数
- 古植食龍屬
- 可解释变异
- 可辨识性
- 司徒頓t分布
- 各国自杀率列表
- 合并方差
- 吉布斯采样
- 吉森大学
- 吉洪诺夫正则化
- 吴定良
- 哈拉尔德·克拉梅尔
- 商学院
- 喬治·伯納德·丹齊格
- 噪声的颜色
- 四分位数
- 国家社会科学基金项目的分类法
- 国家统计研究所 (葡萄牙)
- 国家统计研究所 (西班牙)
- 国际数理统计学会
- 国际统计学
- 国际足球等级分排名
- 图书馆信息学
- 图同构
- 國家社會科學基金
- 圓周率
- 圣迭戈州立大学
- 地球科学
- 均方误差
- 垃圾科学
- 垃圾进,垃圾出
- 型一錯誤與型二錯誤
- 埃伯利理学院
- 埃奇沃斯級數
- 埃米尔·涂尔干
- 埃贡·皮尔逊
- 基础科学
- 塞巴斯蒂安·特龙
- 声景生态学
- 复旦大学管理学院
- 多項式序列
- 多项式回归
- 大众科学
- 大數法則
- 大气科学
- 大间隔最近邻居
- 天文统计学
- 奇异值分解
- 女士品茶
- 孟晓犁
- 安德烈·马尔可夫
- 完全性 (统计学)
- 完备性
- 对数
- 对数分布
- 对数正态分布
- 小威廉·麦克切斯尼·马丁
- 尹锡悦
- 山东工商学院
- 工程学
- 工程物理學
- 差分隐私
- 巴苏定理
- 布尔值函数
- 布莱克-舒尔斯模型
- 帕累托分析法
- 平均倒数排名
- 平均绝对误差
- 平滑
- 幾何分佈
- 广东省高水平大学
- 应志良
- 廣義線性模型
- 开尔文方程
- 异常值
- 弗兰西斯·培根
- 弗拉基米尔·瓦普尼克
- 強抽樣與弱抽樣
- 强化学习
- 形式科學
- 彼得·彼得罗维奇·谢苗诺夫-天山斯基
- 彼得·毕克尔
- 心理学
- 慕尼黑大学
- 應用科學
- 戴维·多诺霍
- 戴维·布莱克韦尔
- 戴维·科克斯
- 托马斯·贝叶斯
- 抽象化 (計算機科學)
- 拉普拉斯分布
- 损失函数
- 授予博士、硕士学位和培养研究生的学科、专业目录
- 政治学
- 故障樹分析
- 教育研究
- 数学学科分类标准
- 数据分析
- 数据可视化
- 数理语言学
- 数理逻辑
- 數學譜系計畫
- 斯皮尔曼等级相关系数
- 方差
- 方开泰
- 日志文件
- 易会满
- 普通教育發展證書
- 曾鲲化
- 最大似然估计
- 最大后验概率
- 最小角回归
- 期望值
- 朱迪亚·珀尔
- 朴素贝叶斯分类器
- 机器学习
- 权重
- 杜威十進位圖書分類法列表
- 条件独立
- 查尔斯·M·斯坦因
- 标准化
- 标准化 (统计学)
- 样本
- 样条函数
- 格里高利·曼昆
- 格鲁布斯检验法
- 梅特罗波利斯-黑斯廷斯算法
- 楊安澤
- 極端風險
- 概率
- 概率质量函数
- 模式识别
- 模糊逻辑
- 横截面数据
- 機率公設
- 機率空間
- 正态分布
- 武汉大学
- 武汉大学数学与统计学院
- 武汉大学校友列表
- 母數
- 比利时统计局
- 民主和平论
- 沃德·亚伯拉罕
- 沃特·安德鲁·休哈特
- 河上丈太郎
- 泊松回归
- 注册会计师
- 测度
- 测度收敛
- 测量精度
- 测量误差
- 浙江工商大学
- 海上保安大学校
- 清华大学
- 渡渡鸟
- 温伯格文理学院
- 測驗
- 湖南大学金融与统计学院
- 滨州医学院
- 演化
- 潜变量
- 潜在类别模型
- 点估计
- 爱德思
- 牛津通识读本
- 物理化学
- 物質科學
- 特征 (机器学习)
- 特征值和特征向量
- 特征选择
- 独立 (概率论)
- 独立同分布
- 独立成分分析
- 玉林市初中学业水平考试
- 王若度
- 环境科学
- 玻尔兹曼分布
- 玻尔兹曼分布
- 理科
- 理論
- 瑞典统计局
- 生物信息学
- 生物医学工程
- 生物学
- 生物心理学
- 生物統計學
- 用於數學、科學和工程的希臘字母
- 病态 (数学)
- 白雜訊
- 百万乱数表
- 百分位排名
- 百科详编
- 皮埃尔-西蒙·拉普拉斯
- 盖伊奖章
- 相关 (概率论)
- 相关函数
- 真納大學
- 知识工程和机器学习实验室
- 知识网络
- 矩估计
- 矩阵
- 矩阵微积分
- 社会学
- 社会工程
- 社会科学
- 社会科学史
- 社會科學學士
- 神经信息学
- 离差
- 离散化
- 种群生态学
- 科学
- 科学分支
- 科学可视化
- 科学哲学
- 科学方法
- 科学理论
- 科学知识社会学
- 科學懷疑論
- 科學界
- 科學證據
- 科拉多·吉尼
- 科际整合
- 空间分析
- 第一轮世界一流大学和一流学科建设高校及建设学科名单
- 第四产业
- 等级分
- 算术平均数
- 算法作曲
- 管理学
- 粉红噪声
- 粒子濾波器
- 系統識別
- 約翰·艾奇森
- 累积量
- 紹爾-謝拉赫引理
- 統計廳
- 線性判別分析
- 線性回歸
- 繁殖力
- 约翰·斯诺 (医学家)
- 级数
- 线性代数
- 经络
- 经验分布函数
- 结果 (随机试验)
- 统计噪声
- 统计年刊
- 统计语言学
- 统计量
- 维基百科的可靠性
- 网络理论
- 罗格斯大学布希校区
- 置换检验
- 美国公共卫生服务军官团
- 美国种族薪资差距
- 耶拿大学
- 耿贝尔分布
- 自协方差
- 舍曲林
- 艾迪生韦斯利
- 芝加哥大学
- 莫兰指数
- 莫里斯·弗雷歇
- 菲利普·斯諾登
- 董明珠
- 蔡笑晚
- 虚拟变量
- 血型
- 行为科学
- 行为遗传学
- 被取代的科學理論
- 被認定是偽科學的主題列表
- 西南财经大学
- 西蒙·库兹涅茨
- 观察性研究
- 规模以上企业
- 計算社會科學
- 變數
- 计算机科学
- 计算机科学学士
- 计算机视觉
- 计算物理学
- 计算生物学
- 计算科学家
- 计算能力
- 计量经济学
- 设计矩阵
- 语料库语言学
- 误差函数
- 谜 (音乐团体)
- 貝氏機率
- 贝叶斯信息量准则
- 贝叶斯推断
- 费雪变换
- 越南乳业
- 輔仁大學管理學院
- 轉移矩陣
- 辅助统计量
- 边缘科学
- 迈克尔·乔丹 (学者)
- 迈克尔·沃特曼
- 迈克尔·路易斯·弗兰德利
- 迪基-福勒检验
- 迴歸分析
- 逆問題
- 逆威沙特分佈
- 逆方差加权
- 透明度报告
- 逻辑代数
- 逻辑斯谛函数
- 運籌學
- 遗传学
- 遗传度
- 邏輯迴歸
- 那特硁
- 邦费罗尼校正
- 郝柏林
- 郭木财
- 鄱阳湖大坝
- 醫療衛生科學
- 重庆工商大学
- 重抽样
- 重要性采样
- 钱伯海
- 钱颖一
- 长尾
- 门线技术
- 陈善林
- 陈春平 (1970年)
- 降维
- 随机分析
- 随机变量的收敛
- 随机性
- 随机数
- 随机数列
- 集成学习
- 霍森-科佩尔曼算法
- 非农业人口
- 面板数据
- 鞅 (概率论)
- 韦伯分布
- 顺序统计量
- 预后
- 首都师范大学
- 香港統計學會
- 马特恩协方差函数
- 马里安·雷耶夫斯基
- 高斯-马尔可夫定理
- 高斯函数
- 高斯过程
- 高木兼宽
- 魏宗舒
- 黎曼ζ函數