简单匹配系数

简单匹配系数(英语:simple matching coefficient,缩写SMC),又称为兰德相似系数Rand similarity coefficient),是用于比较样本信合之间相似性与多样性统计量[1]

A
0 1
B 0
1

假设两个对象A与B分别有n个二值属性,则SMC的定义为:

其中

表示AB的数值都为1的属性数量;
表示A的数值为0、而B的数值为1的属性数量;
表示A的数值为1、而B的数值为0的属性数量;
表示AB的数值都为0的属性数量。

类似地,可以定义简单匹配距离simple matching distance,缩写SMD)为,用于量度样本集合间的不相似度。[2]

SMC与汉明相似度间呈线性关系:。而其与欧基里得距离间的关系为,其中n为属性总数。SMC与雅卡尔指数也很相似,区别在于在雅卡尔指数的定义中分子与分母都没有项。

参考文献

  1. ^ 存档副本. [2018-09-14]. (原始内容存档于2017-12-24). 
  2. ^ 存档副本. [2018-09-14]. (原始内容存档于2018-07-27).