欧式距离马氏距离(马氏距离相对明氏距离的优点)

统计距离包含欧式距离和马氏距离

统计距离不包含欧式距离和马氏距离,它是马氏距离的另一种说法,与欧式距离不存在包含关系。

在一元的情形下,定义两个点Y1和Y2之间的距离。

欧式距离为两者作差的绝对值|Y1- Y2|,可以直观的理解为每个分量之间的差异平方和,再开根号。计算公式如下图所示:

而统计距离/马氏距离为:经过标准化的作差绝对值Y1- Y2|/Sy,或者称为标准化过后的距离,其中Sy代表样本的标准差。类似于一元情形|Y1- Y2|/sy,我们定义Y1=(Y11...Y1p)和Y2=(Y21...Y2p)之间的统计距离/马氏距离计算公式如下图所示:

欧式距离是马氏距离的特殊情形

1、欧式最常见,几何/数学用的大多是这个,是在m维空间中两个点之间的真实距离.同样2个点a和b,无论空间坐标系如何定义,距离都相同.

2、马氏距离是数据的协方差距离,计算是与总体样本有关的,同样的两个样本a和b,放入两个不同的总体中,最后计算得出的两个样本间的马氏距离一般是不相同的,除非这两个总体的协方差矩阵相同。

3、它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。

4、对于一个均值为μ,协方差矩阵为Σ的多变量向量,其马氏距离为(x-μ)'Σ^(-1)(x-μ)。

5、从数学上来看,Mahalanobis距离是表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。Mahalanobis距离与欧氏距离不同的是它考虑到各种特性之间的联系。

6、(例如:一条关于身高的信息会带来一条关于体重的信息,或者关于电脑价格的信息会带来一条关于电脑自带软件的信息,因为两者是有关联的),并且是尺度无关的(scale-invariant),即独立于测量尺度。

欧式与马氏距离区别

欧式最常见,几何/数学用的大多是这个,是在m维空间中两个点之间的真实距离.同样2个点a和b,无论空间坐标系如何定义,距离都相同.马氏距离是数据的协方差距离,计算是与总体样本有关的,同样的两个样本a和b,放入两个不同的总体中,最后计算得出的两个样本间的马氏距离一般是不相同的,除非这两个总体的协方差矩阵相同;