聚类算法分析(聚类算法Mean-shift)
Mean-shift概述
Mean-shift又称均值迁移算法,它是指在数据集中选定一个点,然后以这个点为圆心,为半径,画一个圆(二维下是圆),求出这个点到所有点的向量的平均值,而圆心与向量均值的和为新的圆心,然后迭代此过程,直到满足一点的条件结束。
Mean-shift向量计算公式为:
其中:
用核函数来衡量每个样本的贡献,计算公式为:
图解过程:
Mean-shift函数
核心函数:
sklearn.cluster.MeanShift(核函数:RBF核函数)
主要参数:
bandwidth :半径(或带宽),float型。
如果没有给出,则使用sklearn.cluster.estimate_bandwidth计算出半径(带宽).(可选)
seeds :圆心(或种子),数组类型,即初始化的圆心。(可选)
bin_seeding :布尔值。如果为真,初始内核位置不是所有点的位置,而是点的离散版本的位置,其中点被分类到其粗糙度对应于带宽的网格上。将此选项设置为True将加速算法,因为较少的种子将被初始化。默认值:False.如果种子参数(seeds)不为None则忽略。
主要属性:
cluster_centers_ : 数组类型。计算出的聚类中心的坐标。
labels_ :数组类型。每个数据点的分类标签。
分享"TES工作室"公众号内容到3个500人以上的学校群聊或者朋友圈展示24小时,截图给客服,可以获取python具体实现过程案例。
若有疑问可扫描文末二维码进群咨询。
出品/TES工作室
推荐阅读:
投影寻踪回归模型
马科维茨投资组合模型
数学建模——抢险救援问题
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com