自由度 (统计学)

统计学中,自由度(英语:degree of freedom, df)是指当以样本的统计量来估计总体参数时,样本中独立或能自由变化的数据的个数,称为该统计量的自由度[1]。一般来说,自由度等于独立变量数减掉其衍生量数[2];举例来说,方差的定义是样本减平均值(一个由样本决定的衍生量)的平方之和,因此对N个随机样本而言,其自由度为N-1[3]

数学上,自由度是一个随机向量的维度数,也就是一个向量能被完整描述所需的最少单位向量数。举例来说,从电脑萤幕到厨房的位移能够用三维向量来描述,因此这个位移向量的自由度是3。自由度也通常与这些向量的坐标平方和,以及卡方分布中的参数有所关联。

范例

  • 若存在两个变量 ,  ,而  那么他的自由度为1。因为其实只有 才能真正的自由变化, 会被 选值的不同所限制。
  • 估计总体的平均数 )时,由于样本中的 个数都是相互独立的,任一个尚未抽出的数都不受已抽出任何数值的影响,所以自由度为 
  • 估计总体的方差 )时所使用的统计量是样本的方差 ,而 必须用到样本平均数 来计算。 在抽样完成后已确定,所以大小为 的样本中只要 个数确定了,第 个数就只有一个能使样本符合 的数值。也就是说,样本中只有 个数可以自由变化,只要确定了这 个数,方差也就确定了。这里,平均数 就相当于一个限制条件,由于加了这个限制条件,样本方差 的自由度为 
  • 统计模型的自由度等于可自由取值的自变量的个数。如在回归方程中,如果共有 个参数需要估计,则其中包括了 个自变量(与截距对应的自变量是常量)。因此该回归方程的自由度为 
  • 如果用刀剖柚子,在北极点沿经线方向割3刀,得6个角。这6个角可视为3对。6个角的平均角度一定是60度。其中半边3个角中,只会有2个可以自由选择,一旦2个数值确定第3个角也会唯一地确定。在总和已知的情况下,切分角的个数比能够自由切分的个数大1。

参考文献

  1. ^ Degrees of Freedom. "Glossary of Statistical Terms". Animated Software. [2008-08-21]. (原始内容存档于2018-09-17). 
  2. ^ Walker, H. M. Degrees of Freedom. Journal of Educational Psychology. April 1940, 31 (4): 253–269. doi:10.1037/h0054588. 
  3. ^ Lane, David M. Degrees of Freedom. HyperStat Online. Statistics Solutions. [2008-08-21]. (原始内容存档于2018-06-28).