聚类算法分析（聚类算法Mean-shift）

只能伪装 2023-03-25 02:19:50

聚类算法分析（聚类算法Mean-shift）(1)

Mean-shift概述

Mean-shift又称均值迁移算法，它是指在数据集中选定一个点，然后以这个点为圆心，为半径，画一个圆(二维下是圆)，求出这个点到所有点的向量的平均值，而圆心与向量均值的和为新的圆心，然后迭代此过程，直到满足一点的条件结束。

Mean-shift向量计算公式为：

聚类算法分析（聚类算法Mean-shift）(2)

其中：

聚类算法分析（聚类算法Mean-shift）(3)

用核函数来衡量每个样本的贡献，计算公式为：

聚类算法分析（聚类算法Mean-shift）(4)

图解过程：

聚类算法分析（聚类算法Mean-shift）(5)

Mean-shift函数

核心函数：

sklearn.cluster.MeanShift(核函数：RBF核函数)

主要参数：

bandwidth ：半径(或带宽)，float型。

如果没有给出，则使用sklearn.cluster.estimate_bandwidth计算出半径(带宽).（可选）

seeds :圆心（或种子），数组类型，即初始化的圆心。（可选）

bin_seeding ：布尔值。如果为真，初始内核位置不是所有点的位置，而是点的离散版本的位置，其中点被分类到其粗糙度对应于带宽的网格上。将此选项设置为True将加速算法，因为较少的种子将被初始化。默认值：False.如果种子参数(seeds)不为None则忽略。

主要属性：

cluster_centers_ : 数组类型。计算出的聚类中心的坐标。

labels_ :数组类型。每个数据点的分类标签。

分享"TES工作室"公众号内容到3个500人以上的学校群聊或者朋友圈展示24小时，截图给客服，可以获取python具体实现过程案例。

若有疑问可扫描文末二维码进群咨询。

出品/TES工作室

聚类算法分析（聚类算法Mean-shift）(6)