马尔可夫网络

马尔可夫网络,(马尔可夫随机场无向图模型)是关于一组有马尔可夫性质随机变量的全联合概率分布模型。

马尔可夫网络类似贝叶斯网络用于表示依赖关系。但是,一方面它可以表示贝叶斯网络无法表示的一些依赖关系,如循环依赖;另一方面,它不能表示贝叶斯网络能够表示的某些关系,如推导关系。马尔可夫网络的原型是易辛模型,最初是用来说明该模型的基本假设[1]

形式化定义

形式上,一个马尔可夫网络包括:

  • 一个无向图G = (V,E),每个顶点vV表示一个在集合 随机变量,每条边{u,v} ∈ E表示随机变量uv之间的一种依赖关系。
  • 一个函数集合 (也称为因子或者团因子有时也称为特征),每一个 的定义域是图G的团或子团k. 每一个 是从可能的特定联合的指派(到元素k)到非负实数的映射。

联合分布函数

联合分布(吉布斯测度)用马尔可夫网络可以表示为:

 

其中 是向量, 是随机变量 在第k个团的状态( 是在第k个团中包含的节点数。),乘积包括了图中的所有团。注意马尔可夫性质在团内的节点存在,在团之间是不存在依赖关系的。这里, 配分函数,有

 .

实际上,马尔可夫网联络经常表示为对数线性模型。通过引入特征函数 ,得到

 

 

以及划分函数

 

其中, 是权重, 是势函数,映射团 到实数。这些函数有时亦称为吉布斯势;术语源于物理,通常从字面上理解为在临近位置产生的势能

对数线性模型是对势能的一种便捷的解释方式。一个这样的模型可以简约的表示很多分布,特别是在领域很大的时候。另一方面,负的似然函数凸函数也带来便利。但是即便对数线性的马尔可夫网络似然函数是凸函数,计算似然函数的梯度仍旧需要模型推理,而这样的推理通常是难以计算的。

马尔可夫性质

马尔可夫网络有这样的马尔可夫性质:图的顶点u在状态 的概率只依赖顶点u的最近临节点,并且顶点u对图中的其他任何节点是条件独立的。该性质表示为

 

顶点u的最近临节点集合 也称为顶点u马尔可夫链

推理

在贝叶斯网络中,计算节点 集合对给出的另外节点 集合的条件分布可以通过的所有可能的 指派值求和,这是精确推理。精确推理是NP-hard问题,一般相信不存在快速计算方法。近似推理技术如马尔科夫蒙特卡洛置信度传播通常更加可行。一些马尔可夫随机场的子类,如树,有多项式时间复杂度的推理算法,发现这样的子类也是活跃的研究课题。也有一些马尔可夫随机场的子类允许有效最大后验概率估计,或者最可能的指派值;应用的例子包括关联网络。

条件随机场

一个马尔可夫网络的重要变体是条件随机场,每个随机变量可以条件依赖于一组全局的观察 。这个模型中,每个函数 是从指派值到团k和从观察 到非负实数的映射。这样的马尔可夫网络更适于不对观察建立分布模型的区分性模型,不是生成性模型。

参见

参考

  1. ^ Ross Kindermann and J. Laurie Snell, 马尔可夫随机场及其应用页面存档备份,存于互联网档案馆)(1980)美国数学协会, ISBN 0-8218-5001-6