您当前的位置:首页 > 行业资讯

支持向量机优化基于K-means的蚁群聚类算法

时间:2015-08-05  来源:扁平线圈电感厂家  点击:

摘 要: 基于K-means算法思想改进蚁群聚类算法聚类规则,提出一种新的K-means蚁群聚类算法,并通过实验验证其聚类效果;引入具有全局最优性的支持向量机SVM,取各类中心附近适当数据训练支持向量机,然后利用已获模型对整个数据集进行重新分类,进一步优化聚类结果,使聚类结果达到全局最优。UCI数据集实验结果表明,新的算法可以明显提高聚类质量。
关键词: K-平均算法;蚁群算法;聚类;支持向量机

聚类是数据在算法的指导下进行无人监督的分类。以K-means[1]和 K-medoid[2]为代表的划分法是常用聚类算法中的一种。常用聚类算法多面向数值属性,而蚁群聚类算法(AntClust)[3-4]能处理任意类型的数据,具有强鲁棒性和适应性,但其聚类结果受数据集大小和参数影响较大,针对这些问题,本文首先使用K-means算法思想改进蚁群聚类算法规则,提出一种新的K-means蚁群聚类算法(KM-AntClust),使聚类中数据归属有更合理的判定依据,使聚类结果局部最优。KM-AntClust继承了AntClust的优势,且从距离的角度明了地反映蚂蚁与巢的归属关系,使聚类有合理的理论支撑,聚类效果得到提高。但K-means算法收敛准则的主观性及聚类过程中心的累积误差,虽然使各类中心附近的数据能找到最优的归属,但离类中心较远的数据因误差累积不一定都能找到最佳归属,降低了聚类效果。支持向量机SVM是在统计学理论的VC维理论和结构风险最小化原理基础上发展起来的一种新的机器学习方法,具有适应性强、全局优化、训练效率高和泛化性强等优点,其全局最优性弥补了K-means算法的不足。为此在KM-AntClust基础上引入SVM,以各类中心为基准选取适当数据训练支持向量机,然后利用已获模型对整个数据集进行重新分类,从而使聚类结果达到全局最优。UCI数据集实验结果表明新算法的聚类效果得到了进一步提高。
1 蚁群聚类算法简介
Labroche等提出的蚁群聚类方法AntClust[3-4]利用化学识别系统原理聚类。它不需假设对象的表示,仅用相似度sim(i,j)表示对象i和j的关系。每只人工蚁均有标签Labeli、基因Genetici、模板Templatei[5]以及两个判断参数Mi、Mi+。算法规则如下:
(1)两只无巢蚂蚁相遇时创建一个新巢;
(2)无巢蚂蚁与有巢蚂蚁相遇则将无巢蚂蚁归到对方所属巢中;
(3)两只同巢蚂蚁i、j相遇,若相互接受,则增大Mi、Mj和Mi+、Mj+的值;
(4)两只同巢蚂蚁i、j相遇,若互不接受,则减小Mi、Mj和Mi+、Mj+的值并将M+值小的蚂蚁移出巢;
(5)两只不同巢蚂蚁相遇并相互接受则将两巢合并;
(6)若不出现以上各情况,则不做任何操作。
2 使用K-means优化蚁群聚类模型
2.1 蚁群聚类算法聚类质量不高原因分析
蚁群聚类算法具有较好的鲁棒性和适应性,但其聚类结果不稳定,主要原因如下:
(1)规则(4)依据Mi+判断踢出蚂蚁。根据算法思想,Mi+为随机量, 其值不仅与蚂蚁所属巢规模有关,还与循环次数相关。Mi+是蚂蚁i被巢成员接受的程度,而不是反映蚂蚁与巢的依存关系,Mi+大并不能说明此巢是蚂蚁i的最优归属,故依此踢出蚂蚁产生累积误差导致聚类质量降低。
(2)循环迭代参数Iter和删除概率Pdel的设置。循环次数NBIter=Iter×N不足[5],数据覆盖率低;太大导致过学习,聚类效果均受影响。参数Pdel太大聚出的类数目较少,相反则类过多,影响聚类质量。因此,参数Iter和Pdel的确定是保证聚类质量的重要环节。
2.2 使用K-means改进蚁群聚类规则
K-means聚类算法基于误差平方和最小准则,聚类结果通常不受初始中心的影响,较为稳定。对于大数据集,其强伸缩性和高效性常使聚类结果以局部最优结束。
引入K-means算法改进聚类规则,优化后的算法简称KM-AntClust。设di为蚂蚁i到其所属巢中心的距离,规则改进如下:
(1)两只无巢蚂蚁i、j相遇时创建一个新巢并计算巢中心;
(2)无巢蚂蚁i与有巢蚂蚁j相遇则将蚂蚁i归到蚂蚁j所属巢中并更新该巢中心;
(3)同巢互不接受的两只蚂蚁i、j相遇时,计算di、dj,将d值大的蚂蚁踢出巢并更新巢中心;
(4)两只不同巢的蚂蚁相遇且相互接受时,将两巢合并并更新巢中心;
(5)若不出现以上各情况,则不做任何操作。
3 使用SVM优化K-means蚁群聚类算法
3.1 支持向量机SVM
支持向量机[6-7]SVM是在统计学理论的VC维理论和结构风险最小化原理的基础上发展起来的一种新的机器学习方法。它的基本思想是将输入空间通过一种非线性变换映射到一个高维的特征空间,然后在这个新的高维特征空间中求解原始问题的最优解[8-9]。

大电流电感

多通道抗凝血药物筛选检测仪的研制介绍一种以透射比浊法为设计原理,单片机89C52为核心的96通道高速抗凝血药物筛选平台。该仪器自动完成血液(血浆)凝血时间的实时检测及数据采集,数据采集的精度、速度及灵敏度较传统的凝血时间测量仪器有较

车身模块中新的失效保护方法 (1) 在今天的车身控制模块(BCM)设计中,有见识的工程师机都尽可能不再使用机电式继电器。他们的下一个发展方向是停用熔断器。但是,停用熔断器是一个非常必要的解决方案吗?是一个用更加复杂的解决方案取代一个简

解密消费电器变速控制绝招——数字电源管理很多厨房和车库电器、电动工具以及其他小家电中所用的传统通用型电动机一般都不能精确地控制速度。电动机基本上只有关和开两种状态,这对于某些应用来说确实是足够了。但通过数字电源管理系统来进行精确变速控制可以

注塑加工厂


上一篇通信测试仪器解析

下一篇USB 2.0端口的ESD保护


  
  温馨提示
网站首页 | 产品展示 | 科技前沿 | 行业资讯
本公司专业研发、设计、生产、销售贴片电感、插件电感、功率电感、大电流电感、扁平线圈电感、一体成型电感。
专业电感生产制造商,品质优异、交期快。
在线客服
热线电话