非线性数据变换及其在离群聚类中的应用 |
| |
引用本文: | 徐雪松.非线性数据变换及其在离群聚类中的应用[J].人天科学研究,2009(10). |
| |
作者姓名: | 徐雪松 |
| |
作者单位: | 南京中医药大学信息技术学院 |
| |
摘 要: | 为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对从高维采样数据中恢复得到低维数据集,通过本文提出的离群数据假设,并结合本文给出的离群聚类方法对所得数据对象投影分量是否是离群数据进行判别。仿真实验的结果表明了该方法能够有效地发现高维数据集中的离群点。与此同时,该算法具有参数估计简单、参数影响不大等优点,为离群点检测问题的机器学习提供了一条新的途径。
|
关 键 词: | 维数消减 主成分 离群数据 聚类 |
Nonlinear Data Transformation and Its Application in Clustering with Outliers |
| |
Abstract: | The data dimension reduction is the main method that can enhance the outliers mining efficiency based on higher-dimension data set.A novel outlier detection algorithm is proposed after analyzing the advantages and disadvantages of the classical outlier mining algorithm in the paper.In this paper,it can transform nonlinear large-scale data into linear data in the feature space,and introduce a nonlinear data transformation to reduce data dimension.On the basis of outlier data hypothesis,outlier data is determ... |
| |
Keywords: | Dimensionality Reduction Principal Component Outliers Clustering |
本文献已被 维普 等数据库收录! |
|