指数分布

概率论统计学中,指数分布(英语:Exponential distribution)是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进入机场的时间间隔、电话打进客服中心的时间间隔、中文维基百科新条目出现的时间间隔、机器的寿命等。

指数分配
概率密度函数
机率密度函数
累积分布函数
累积分配函数
参数
值域
概率密度函数
累积分布函数
期望值
中位数
众数
方差
偏度
峰度
矩生成函数
特征函数

记号

指数分布即形状参数α为1的伽玛分布

若随机变量 服从参数为  的指数分布,则记作

  

两者意义相同,只是  互为倒数关系。只要将以下式子做 的替换即可,即,指数分布之概率密度函数为:

 

 


累积分布函数为:

 

 


其中λ > 0是分布的参数,即每单位时间发生该事件的次数; β 为尺度参数,即该事件在每单位时间内的发生率。两者常被称为率参数(rate parameter)。指数分布的区间是[0,∞)。

特性

期望值与方差

随机变量X (X参数为λ或β) 的期望值是:

 

例如:如果你平均每个小时接到2次电话,那么你预期等待每一次电话的时间是半个小时。

X方差是:

 

X偏态系数是: V[X] = 1

无记忆性

指数函数的一个重要特征是无记忆性(Memoryless Property,又称遗失记忆性)。这表示如果一个随机变量呈指数分布,它的条件概率遵循:

 

与泊松过程的关系

泊松过程是一种重要的随机过程。泊松过程中,第k次随机事件与第k+1次随机事件出现的时间间隔服从指数分布。而根据泊松过程的定义,长度为t的时间段内没有随机事件出现的概率等于

 ,

长度为t的时间段内随机事件发生一次的概率等于  , 所以第k次随机事件之后长度为t的时间段内,第k+n次 (n=1, 2, 3,...)随机事件出现的概率等于 。这是指数分布。这还表明了泊松过程的无记忆性。

四分位数

率参数λ的四分位数函数(Quartile function)是:

 
  • 第一四分位数: 
  • 中位数 
  • 第三四分位数: 

因此,四分位距为ln(3)/λ

参数估计

最大似然法

给定独立同分布样本x = (x1, ..., xn),λ的似然函数(Likelihood function)是:

 

其中:

 是样本期望値。

似然函数对数导数是:

 

参数λ的最大似然估计(Maximum likelihood)值是:

 

参见

参考文献

  1. Donald E. Knuth (1998). The Art of Computer Programming, volume 2: Seminumerical Algorithms, 3rd edn. Boston: Addison-Wesley. 编辑