准差优化初始聚类中心-数控滚圆机钢管滚圆机滚弧机折弯机张家港
作者:lujianjun | 来源:欧科机械 | 发布时间:2019-06-23 10:47 | 浏览次数:

传统k_means算法采用随机法选择初始聚类中心,易造成聚类结果陷入局部最优解和聚类精度低的问题,而且易受孤立点的影响。为了解决这一问题,提出了一种基于密度标准差优化初始聚类中心的改进算法。该算法先计算数据集样本的平均值和标准差,接着计算每个数据点的密度分布函数值,然后计算样本的平均密度和密度标准差,若小于密度标准差,则划分为孤立点;搜索密度分布函数值数组中的最大值,那么最大值对应的样本点即为初始聚类中心,并将以初始聚类中心为原点,以样本平均值为半径的圆内各点的密度函数值赋值为0,如此重复,直到找到k个初始聚类中心。该算法基于Python语言在PyCharm软件平台实现。本文由公司网站滚圆机网站采集转载中国知网资源整理!www.gunyuanji.name实验结果表明,这种基于密度标准差优化初始聚类中心的算法消除了孤立点的影响,具有更高的准确率和更好的聚类结果电脑知识与技术本栏目责任编辑:唐一东人工智能及识别技术入集合G,其余点放入集合Q;利用新提出的改进算法对集合Q进行聚类准差优化初始聚类中心-数控滚圆机钢管滚圆机滚弧机折弯机张家港电动液压滚圆机滚弧机倒角机,得到各个类的初始聚类中心。孤立点不参与聚类,将归为一类显示。因为孤立点不参与聚类过程中的各种计算,所以不影响聚类中心的值,故本文新提出的改进算法对孤立点不敏感。为了验证本文改进算法对孤立点不敏感,测试数据有70个数据点,其中孤立点5个,约占总数的7%,用传统k_means算法和本文改进的k_means算法进行测试,结果如下图1和图2所示。图2中五个黑色三角形的数据点是孤立点,而在图1中可以看到五个点分别聚类到三个类中。图1和图2对比发现,有孤立点的聚类结果和无孤立点的聚类结果是不同的。图1传统k_means算法聚类结果图2本文改进k_means算法聚类结果4实验结果分析本文将传统的k_means算法和基于密度标准差的k_means优化算法进行了实验对比,选择了专用于测试数据挖掘算法的UCI数据库[16]中的Iris数据集、Wine数据集和模拟实验数据集作为本文测试数据集。本文由公司网站滚圆机网站采集转载中国知网资源整理!www.gunyuanji.name本文算法采用Python语言实现,测试环境是操作系统:Windows1064位;算法调试运行工具:PyCharm。4.1模拟实验数据和结果分析实验使用的两个数据集如图3、图4所示,数据集使用随机数随机生成如表1所示。分别在两个数据集上运行传统k_means算法和改进k_means算法,传统k_means算法运行结果如图5、图6所示,改进k_means算法运行结果如图7、图8所示。表1模拟数据集图3数据集1算法聚类结果4实验结果分析本文将传统的k_means算法和基于密度标准差的k_means优化算法进行了实验对比,选择了专用于测试数据挖掘算法的UCI数据库[16]中的Iris数据集、Wine数据集和模拟实验数据集作为本文测试数据集。本文算法采用Python语言实现,测试环境是:CPU:Intel(R)Corei5-2520CPU@2.50GHz;内存:4GB;操作系统:Windows1064位;算法调试运行工具:PyCharm。4.1模拟实验数据和结果分析实验使用的两个数据集如图3、图4所示,数据集使用随机数随机生成如表1所示。分别在两个数据集上运行传统k_means算法和改进k_means算法,传统k_means算法运行结果如图5、图6所示,改进k_means算法运行结果如图7、图8所示。表1模拟数据集图3数据集1图4数据集2图5传统k_means算法-数据集1图6传统k_means算准差优化初始聚类中心-数控滚圆机钢管滚圆机滚弧机折弯机张家港电动液压滚圆机滚弧机倒角机本文由公司网站滚圆机网站采集转载中国知网资源整理!www.gunyuanji.name