共查询到20条相似文献,搜索用时 15 毫秒
1.
聚类分析是数据挖掘和机器学习的一个重要分支,应用范围广,但在聚类分析过程中大量敏感信息的泄露对用户构成威胁。因此,在聚类分析过程中实现隐私保护至关重要。传统基于差分隐私(DP)的k-means聚类算法由于存在盲目选择初始中心点、对异常点敏感度较高等问题,导致在保护数据隐私时,出现聚类可用性较低的情况。针对该问题提出一种改进的基于差分隐私保护的(IDP)k-means聚类算法以提高聚类可用性,并进行理论分析和对比实验。理论分析表明,该算法满足ε-差分隐私;仿真实验结果表明,在同一隐私预算下,k-means算法改进后在聚类可用性上优于其它差分隐私k-means聚类算法,在同一数据集与同一隐私参数下,改进k-means算法在数据可用性方面比传统算法提高了将近5个百分点。 相似文献
2.
差分隐私是能够提供严谨数学证明的隐私保护模型,针对传统差分隐私保护方法在混合型数据集中应用效果差、处理后破坏数据可用性等问题,提出一种面向混合型数据集自适应聚类的差分隐私保护算法.结合快速聚类及k-prototype聚类算法的特点,首先根据混合数据集的不同数据类型属性,采用不同的相异度计算方式实现对不同数据类型属性的距... 相似文献
3.
4.
为解决k-means聚类算法在聚类过程中隐私泄露风险,在满足ε-差分隐私保护前提下,提出一种隐私保护的RDPk-means聚类方法。该方法与传统随机选取初始点方式不同,采取基于网格密度的方式选取初始聚类中心,并在UCI数据集中进行有效性验证。采用543条数据生成2个聚类簇和19 020条数据生成3个聚类簇分别进行实验。结果表明,该聚类方法在不同的数据规模和维数情况下可以很好地保护数据隐私,能保证聚类结果的可用性。 相似文献
5.
连续属性离散化问题是机器学习的重要方面,是数据预处理问题之一。文章提供的基于粗糙集的层次聚类算法(RAHCA)是对层次聚类算法的一种改进,它能够自动调整参数,以寻求更优的聚类结果。实验结果验证了该算法的可行性,特别是在符号属性聚类方面有着较好的聚类性能。 相似文献
6.
连续属性离散化问题是机器学习的重要方面,是数据预处理问题之一。文章提供的基于粗糙集的层次聚类算法(RAHCA)是对层次聚类算法的一种改进,它能够自动调整参数,以寻求更优的聚类结果。实验结果验证了该算法的可行性,特别是在符号属性聚类方面有着较好的聚类性能。 相似文献
7.
8.
9.
基于层次的模糊K均值聚类算法研究 总被引:1,自引:0,他引:1
苏瑞 《安阳师范学院学报》2010,(2):47-50
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。 相似文献
10.
聚类是发现数据分布和隐含模式的一项重要技术,但单一的聚类算法很难达到预期的效果.基于四种聚类算法,根据算法准确率,利用层次分析法以估计权重,构造一个基于四类算法融合的聚类器,经实验检验,该聚类器比单一聚类器的聚类效果好. 相似文献
11.
刘园园 《青岛职业技术学院学报》2010,23(3):52-54,67
针对聚类算法易陷入局部优化的缺点,将中心定位算子遗传算法与层次聚类方法动态结合,通过遗传算法的全局寻优特点弥补层次聚类算法的不足.在算法的后期融入Chameleon思想,提高了算法的准确性.通过对UCI中的三个数据集样本进行测试,表明聚类效果优于传统聚类方法. 相似文献
12.
李玲玲 《贵州教育学院学报》2011,(9):11-14
凝聚型层次聚类和模糊C-均值聚类是聚类中的两种常用算法,每种算法都有其自己的优点、缺点及适用的对象和范围。针对FCM算法的对初始值敏感,以及目标函数没有考虑类间距离的缺点,通过使用距离阚值,把凝聚型层次聚类与模糊C-均值聚类算法相结合,产生一种新的基于距离闲值的FCM算法,实验结果表明。这种算法能够自动的判断迭代的终止条件、快速有效的找到最佳聚类结果,从而实现对模糊C-均值聚类算法的自动优化。 相似文献
13.
14.
15.
张浩 《温州职业技术学院学报》2013,(1):84-86
在传统聚类模型的基础上,提出一种基于向量空间模型的层次聚类算法,用于文本数据的挖掘。实验结果表明,基于向量空间模型的层次聚类算法从挖掘的准确率上更具有性能优势。 相似文献
16.
聚类算法是数据挖掘算法中的重要方法之一.本文在分析了FCM算法和基于遗传聚类算法的不足基础上,提出了一种基于免疫单亲遗传和模糊C均值的混合聚类算法,克服了FCM的局部最优问题以及普通遗传算法聚类时的搜索速度和聚类精度的矛盾,实验表明该算法是有效的. 相似文献
17.
18.
19.
叶正旺 《通化师范学院学报》2013,(12):36-38
入侵检测技术是网络安全中重要的组成部分,它弥补了防火墙和数据安全保护的缺陷,能够通过对一些入侵特征进行分析并预警,以达到防患于未然.该文进行了基于聚类技术的入侵检测算法的研究,提出了一种基于信息熵的聚类算法,并应用在入侵检测系统中进行特征提取,通过聚类形式化描述,提出数据记录信息熵和相对熵聚类的聚类算法. 相似文献
20.
层次聚类算法是一类重要的聚类分析方法。传统的层次聚类算法的时间为O(n2)空间复杂度很大,这使得聚类分析在大型数据集上的应用受到限制。该文提出一种基于分治递推改进算法,该算法将大大减少算法的时间复杂度和空间复杂度。 相似文献