发布信息

9个机器学习算法经常出现距离计算公式

     2024-10-17 21:22:49     604

本文目录导航:

9个机器学习算法经常出现距离计算公式

学习指标1 欧式距离(Euclidean Distance):直观而言,这是权衡两点在空间中直线距离的最经常出现方式,咱们从小学到高中接触到的两点距离计算多基于此。

举例:曼哈顿距离(Manhattan Distance):实践驾驶在曼哈顿街区从一个十字路口到另一个十字路口的总距离,即为“曼哈顿距离”,亦称“市区街区距离”。

举例:切比雪夫距离 (Chebyshev Distance):国内象棋中,国王从格子(x1,y1)移动到格子(x2,y2)起码须要的步数即为切比雪夫距离。

举例:闵可夫斯基距离(Minkowski Distance):定义为一组距离度量公式的概括性表白。

两个n维变量间距离的计算基于参数p,其中p选择了距离的详细方式。

当p=1时,为曼哈顿距离;p=2时,为欧式距离;当p趋势无量大时,切比雪夫距离。

小结:1. 闵氏距离包含了曼哈顿距离、欧式距离和切比雪夫距离,但存在缺陷:在不同单位的量纲处置上不加辨别,且未思考各量的不同散布。

规范化欧氏距离 (Standardized Euclidean Distance):改良方法,经过规范化各维度的散布,处置上述疑问。

举例:余弦距离(Cosine Distance):经过比拟两向量的方向差异权衡其相似度,范围在[-1,1],余弦值越凑近1示动向量方向越分歧。

举例:汉明距离(Hamming Distance):权衡两个等长字符串之间的差异,经过计算起码的交流次数。

在消息编码等畛域有运行。

举例:杰卡德距离(Jaccard Distance):权衡两个汇合的辨别度,基于它们的交加与并集的比例。

举例:马氏距离(Mahalanobis Distance):思考样本间的协方差,扫除量纲差异,权衡样本间的相似度,与欧式距离相比愈加片面。

举例:小结:马氏距离思考了变量间的关系性,且量纲有关。

在计算两个样本集间的相似度时,它能更准确地反映出差异。
9个机器学习算法经常出现距离计算公式

曼哈顿距离和欧几里得距离

(1)出租车几何或曼哈顿距离(ManhattanDistance)是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,是种经常使用在几何度量空间的几何学用语,用以表明两个点在规范坐标系上的相对轴距总和。

图中红线代表曼哈顿距离,绿色代表欧氏距离,也就是直线距离,而蓝色和黄色代表等价的曼哈顿距离。

曼哈顿距离——两点在南北边向上的距离加上在东西方向上的距离,即d(i,j)=|xi-xj|+|yi-yj|。

关于一个具备正南正北、正东正西方向规定规划的城镇街道,从一点抵达另一点的距离正是在南北边向上游览的距离加上在东西方向上游览的距离,因此,曼哈顿距离又租车距离。

(2)在数学中,欧几里得距离或欧几里得度量是欧几里无暇间中两点间“个别”(即直线)距离。

经常使用这个距离,欧氏空间成为度量空间。

关系联的范数称为欧几里得范数。

较早的文献称之为毕达哥拉斯度量。

计算公式,如图所示;

图一

图二

Manhattan distance是怎样定义的?

Definition: The distance between two points measured along axes at right angles. In a plane with p1 at (x1, y1) and p2 at (x2, y2), it is |x1 - x2| + |y1 - y2|.

相关内容 查看全部