四分位数

四分位数(英语:Quartile)是统计学分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。

概念

  • 第一四分位数 ),又称较小四分位数,等于该样本中所有数值由小到大排列后第25%的数字。
  • 第二四分位数 ),又称中位数,等于该样本中所有数值由小到大排列后第50%的数字。
  • 第三四分位数 ),又称较大四分位数,等于该样本中所有数值由小到大排列后第75%的数字。

第三四分位数与第一四分位数的差距又称四分位距InterQuartile Range, IQR)。

运算过程

关于四分位数值的选择尚存争议[1]

主要选择四分位的百分比值 ,及样本总量 有以下数学公式可以表示:[2]

 
  • 情况1:如果 是一个整数,则取第 和第 的平均值
  • 情况2:如果 不是一个整数,则取下一个最近的整数。(比如 , 则取 

举例

 
图示中箱形图(有四分位数及四分位距)和概率密度函数 为描述一个常规总量 的分布情况

一个算法如下(可以兼用TI-83计算器):

  1. 利用中位数使数据分成两列(不要把中位数放入已分好的数列)。
  2. 第一四分位数为第一组数列的中位数;第三四分位数为第二组数列的中位数。

以下例子可以用来参考。

例1

数据总量: 

由小到大排列的结果: 

 
例2

数据总量: 

 
例3

数据总量: 

 

应用

不论 变异量数数值为何,均视为一个分界点,以此将总数分成四个相等部分,可以通过比较 ,分析其数据变量的趋势。

参考文献