首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
提出了一个微粒群优化算法(autoPSO)自动聚类高维数据。autoPSO优化了Davies-Bouldin(DB)有效性函数,并将聚类问题转化为一个界约束的连续函数的优化问题。用一个实数矩阵和一个二进制向量来表示微粒,使得同一迭代中能够表示具有不同聚类数目的划分;并且,在二进制向量的控制下指导相关联的实数矩阵交叉操作,保持算法良好的种群多样性,避免算法早熟收敛。通过高维模拟数据集的实验结果表明,本文算法不需要预设聚类数目k,能够自动正确识别高维数据的聚类。  相似文献   

2.
本文提出了一种新的用户浏览模式的聚类算法,该算法应用马尔可夫链与模糊逻辑理论,通过对Web会话文件的处理,赋予类标记,实现了根据访问模式对用户的分类,以便个性化推荐和指导能够针对不同类别的用户进行。  相似文献   

3.
在分析基于工艺元的典型工艺信息组织模式的基础上,提出一种基于数据挖掘技术的从工艺数据中获取工艺元知识的方法.该方法采用文本聚类的思想扫描工艺数据库,将数据库中工艺描述划分为不同的类提取出常用工艺语句并设计了相应的处理算法,通过改进Apriori方法设计的Apriori-seq算法用于对工艺规程序列进行挖掘获取工艺元.同时,开发出在制造工艺序列数据中进行知识发现的原型系统SCU-KDPS,应用表明本文的研究方法有较高的知识发现效率.  相似文献   

4.
应用矩阵初等变换的一些性质解决有限维向量空间中若干问题和求两个多项式的最大公因式.这些内容丰富和扩展了相关知识.  相似文献   

5.
本文基于国内外最新研究成果对电子商务中应用的web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题,给出了基于web日志的客户群体聚类算法及web页面聚类算法。利用这些web挖掘技术可有效挖掘用户个性特征,从而指导电子商务网站资源的组织和分配。  相似文献   

6.
提出一种结合二维PCA和二维LDA的降维方法,并将方法应用于人脸识别研究.对传统的半监督模糊聚类算法进行改造,使之可以直接用于二维数据矩阵进行动态聚类,并据此设计了一种动态学习算法.实验结果表明,与其他降维方法和聚类算法比较,这种结合了二维LDA的半监督聚类模型具有更好的识别率.  相似文献   

7.
沙莎  赵越 《湘南学院学报》2009,30(5):72-75,81
将传统相似三角形匹配方法和快速二维聚类匹配方法进行融合,再利用基于灰度的方法对部分伪匹配三角形进行剔除,实现了一种新的抗旋转、缩放的特征点匹配算法.融合后的算法对有效点的要求降低,同时通过在复数向量空间中进行相似三角形检索及参数聚类,提高了算法的效率.  相似文献   

8.
基于向量空间模型的文档聚类算法研究   总被引:3,自引:0,他引:3  
随着网络信息的迅速增长,文档聚类技术成为了人们研究的热点课题.探讨了几种基于向量空间模型的文档聚类算法,如常见的k—means算法和凝聚层次算法,针对它们的不足提出了改进的BK-means算法和多层CFK-means算法.最后,根据一定的评价标准,得出Bk—means算法是文档聚类算法中较好的算法.  相似文献   

9.
介绍了一种对文献关键词进行层次聚类的算法,首先把文献关键词聚类为概念,从而生成一个概念树,然后用概念向量表示文献,每篇文献对应一个概念子树.在检索时,采用改进的余弦相似性方法,根据概念向量计算文献的相似性,把与给定文献最相似的文献返回给用户.用这种算法能很好地对文献进行相似性检索.  相似文献   

10.
给出了n维线性空间V中基向量组的标准正交化过程的新方法,这种方法仅仅采用列的初等变换的方法,该方法思路简洁,算法简单,计算机编程设计简单有效.  相似文献   

11.
在讨论Web使用挖掘在网络学习中的应用过程中,提出一种改进的基于向量的聚类算法.在算法中,首先以学习站点的URL为行、以UserID为列建立页面用户关联矩阵,元素值为学习者的访问次数,然后使用欧氏距离进行度量向量之间的相似性,对列向量进行相似性分析得到相似学习者群体,对行向量进行相似性度量获得相关Web页面.分析表明,Web使用挖掘在网络学习中的应用是可行、有效的.  相似文献   

12.
对Web日志挖掘数据预处理阶段的会话识别方法进行了探索,考虑了站点页面内容和结构的差异性以及访问者的个体差异性等因素,提出了一种采用以站点首页结合动态时间阀值的新会话识别方法。该方法以站点首页作为用户新会话开始标识,并引入了动态时间阀值的方法来确定用户会话的边界。实验结果表明,该方法能够识别出更多的真实用户会话,有效地提高了会话识别的准确率。  相似文献   

13.
随着互联网技术的发展和Web用户和数据的飞速增长,有必要对网络的用户进行追踪和分析.本文首先分析了Web使用挖掘的数据源,然后详细介绍了数据清洗、用户识别、网页浏览识别和路径完善四种预处理功能,最后简单介绍了用户模式分析评价方法.  相似文献   

14.
INTRODUCTION Automatic face recognition has become a very active research area in the last decade due to the new interest in, and need for, surveillance and security, telecommunication and digital libraries, hu-man-computer intelligent interaction, and smart en-vironments. The small sample size (SSS) problem is often encountered because the number of the samples is much smaller than the dimension of the sample space in face recognition. It results in the singularity of the within-class …  相似文献   

15.
异常挖掘研究综述   总被引:1,自引:0,他引:1  
异常挖掘是数据挖掘的一个重要分支,已逐渐成为许多领域的有用工具。本文介绍了异常的基本含义以及异常挖掘的意义。对现有异常挖掘方法按照它们使用的主要技术进行了分类,对一些典型方法的基本思想进行了介绍,并指出了这些方法存在的局限。最后对异常数据挖掘的一些主要研究方向进行了展望。  相似文献   

16.
针对数据挖掘技术较为抽象并且难以理解等问题,设计了数据挖掘课程的教学与实验方案.方案包含了数据分类、聚类、降维以及关联规则等数据挖掘子技术.将传感器、互联网、社交媒体等不同类型的数据作为实验数据集,采用云计算技术提高计算与存储的效果,提高教学与实验的效率.设计了图形交互界面,能够以图形形式与表格输出数据分类、聚类、降维...  相似文献   

17.
Cluster analysis is a group of statistical methods that has great potential for analyzing the vast amounts of web server-log data to understand student learning from hyperlinked information resources. In this methodological paper we provide an introduction to cluster analysis for educational technology researchers and illustrate its use through two examples of mining click-stream server-log data that reflects student use of online learning environments. Cluster analysis can be used to help researchers develop profiles that are grounded in learner activity??like sequence for accessing tasks and information, or time spent engaged in a given activity or examining resources??during a learning session. The examples in this paper illustrate the use of a hierarchical clustering method (Ward??s clustering) and a non-hierarchical clustering method (k-Means clustering) to analyze characteristics of learning behavior while learners engage in a problem-solving activity in an online learning environment. A discussion of advantages and limitations of using cluster analysis as a data mining technique in educational technology research concludes the article.  相似文献   

18.
将基于多个嵌入图组合形式的半监督判别分析(SDA)以及核SDA(KSDA)应用于全监督的语音情感识别.在语音信号样本情感成分的预处理阶段,从样本语段中提取出多种特征及其统计参数,包括基音、过零率、能量、持续长度、共振峰和MFCC(Mel频率倒谱系数).在将样本特征送入分类器之前的维数约简阶段,使用经过参数优化的SDA或KSDA进行降维.Berlin语音情感数据库上的实验表明,在使用多类SVM分类器时的全监督语音情感识别中,SDA优于其他一些先进的基于谱图学习的维数约简算法,如LDA,LPP,MFA等,而KSDA通过核化的数据映射,能够取得比上述所有算法更好的识别效果.  相似文献   

19.
对空间数据挖掘与传统数据挖掘进行比较。根据数据挖掘的目的分类,对已有的空间数据挖掘的主要方法及特点进行分析,包括空间数据概化、空间规则挖掘、空间分类、空间趋势预测、空间聚类、空间离群点查找等。对国内外空间数据挖掘的现状作了总结和评述。最后,对未来可能的研究方向也作了分析展望。  相似文献   

20.
Morin and Marsh (2015) proposed a methodological framework to disentangle shape and level effects in latent profile analyses. We discuss limitations of this framework (based on a logic similar to that of higher-order measurement models), and suggest that these limitations are easily solved by a more thorough examination of the variable-centered measurement models underlying profile indicators. This study presents complementary variable- and person-centered approaches aiming to assess the dimensionality of psychometric constructs. Psychometric measures often assess separate conceptually-related facets of global overarching constructs, based on the assumption that these overarching constructs exist as global entities including specificities mapped by the facets. The framework proposed here explicitly models this dimensionality in both variable- and person-centered analyses. To illustrate this revised psychometric framework, we use ratings of psychological health collected from 1,232 teachers, and show how this revised framework provides a clearer picture of teachers’ profiles of psychological health.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号