首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 344 毫秒
1.
针对时间序列相似性研究中存在动态时间弯曲DTW复杂度过高与分段思想易造成特征丢失的问题,提出了一种基于形状和升降性提取序列数据重要特征点的DTW相似性搜索算法,利用关键特征点快速筛选相似候选子序列集合,计算各个原始子序列的DTW距离,与改进的分段DTW距离度量方法进行实验比较。结果表明,该方法提高了相似性搜索效率,并具备更高的相似度。  相似文献   

2.
时间序列的相似性度量是时间序列数据挖掘研究中的一个重要问题,是进行序列查询、分类、预测的一项基础工作。寻求一种好的度量对提高挖掘任务的效率和准确性有着至关重要的意义。目前从事这方面的研究除了少许理论论述外,几乎都采用一种固定的方法,即提出具体要求并提供实验数据。然而,大多数实验方法不是使用范围有限就是侧重点不同。为了提供一个比较全面的实验验证,用1NN分类算法进行了大量的时间序列交叉验证实验,重新评估了其中的弹性度量,并使用不同应用领域的28个时间序列数据集进行比较,结果表明,该方法具有更高的准确性。  相似文献   

3.
时间序列模式有利于提高时间序列数据挖掘的效率和准确率.本文在时间序列分段线性表示法的基础上,提出了一种FKD时间序列模式表示.该模式具有简单直观、拟合误差小等特点.通过实验验证,FKD时间序列模式表示是有效的,有利于时间序列的异常挖掘.  相似文献   

4.
时间序列的异常检测的应用越来越广泛,本文是讨论在基于分段线性的FKD时间序列模式表示基础上时间序列的异常检测。文中提出了一种基于滑动窗口的时间序列模式偏离和窗口异常度的概念,并在此基础上提出了基于滑动窗口的时间序列模式异常的检测算法。通过实验证明了该算法是合理的、有效的。  相似文献   

5.
针对传统因果关系算法不能分析非平稳时间序列和可变时滞时间序列数据因果关系的问题,本文提出一种基于分段聚合近似可变时滞转移熵(PAAVL-TE)的因果关系算法。利用分段聚合近似法对时间序列进行转换,提取时间序列的特征信息,运用动态时间弯曲距离寻找相似程度最高的时间序列计算可变时滞时间序列的转移熵,实现了非平稳时间序列的因果分析。通过计算机仿真模拟实验将提出的算法与存在的算法相比较,证实算法有效性。将该算法用于北京市昌平区PM2.5浓度和气象数据分析,表明本文算法具有广泛的应用性。  相似文献   

6.
为了提高用户之间相似度度量的性能,充分利用用户的社会信息,提出一种考虑潜在用户分组信息的相似度度量方法.该方法首先为用户的分类属性建立权值分类树,并基于此分类树,采用统一框架计算用户分类信息和数值信息的距离;然后利用该距离改进k-means聚类方法,以计算用户的潜在用户分组;最后结合用户分组信息改进传统相似度度量方法.基于真实数据集Movie Lens进行实验,并与其他传统方法对比,结果表明,与传统方法相比,所提方法提高了协同过滤中的预测精度.  相似文献   

7.
为了满足基于Web的XML数据信息的近似搜索、数据挖掘、信息分类以及数据交换的需求,分析了XML文档相似性度量方法一集合度量方法、线性度量方法和代价度量方法。提出基于权重代价的机器学习的XML文档相似性度量算法。实验表明该算法扩展了XML文档查询范围,提高了文档的查全率和查准率。  相似文献   

8.
在模式分类领域,分类器特征输入的选择对分类效果是至关重要的.我们提出了一种新的基于相对熵的特征选择AdaBoost方法.在该算法中,引入相对熵度量两类间的距离.在每一轮中,选择最优特征作为二维分量分类器的输入.随着权值的改变,在每一轮中特征的选择也不同.最后,由一组弱分类器结合而成的强分类器.实验表明,与遍历搜索的AdaBoost算法相比,该算法的检测正确率提高了5%,而时间缩短了20%以上.  相似文献   

9.
为提高教育资源的检索效率和准确性,提出了一个基于本体与粗糙集的教育资源检索模型.该模型使用粗糙集理论对教育资源实例基于知识点分类,并且定义了一个模板使用多个加权描述关键字来表示教育资源实例.通过对查询关键字与描述关键字的相似度综合计算,从而提高对教育资源的检索效率.  相似文献   

10.
从成员查询的特点出发,对各种位图索引求解成员查询的过程进行介绍。针对分段位图编码模式求解成员查询时,会出现重复扫描位图的情况,提出一种基于分段位图索引求解成员查询的高效算法。  相似文献   

11.
It is an important part of green mining to control the disasters of coal mining which have caused irreversible damages to buildings and ecological environment. Strip mining is one of the efficient measures to control surface subsidence and mining damage. However, the research on the laws of the surface subsidence are still deficient in multi-coal seam strip mining at present. Based on the Fast Lagrangian Analysis of Continua (short for FLAC3D) numerical simulation software, the laws of the surface subsidence and horizontal movement were systematically studied for different depths, different mining widths, different distances between seams, different mining thickness, different parameters between seams and the special relations of the upper pillar and the lower pillar in the vertical direction in multi-seam strip mining. The function relation between the maximum subsidence and the maximum horizontal movement with the depth, the mining width, the seam distance, mining thickness, different parameters between seams and the partial offset are summarized respectively. Finally the formula integrating the surface maximum subsidence value and the maximum horizontal movement was deduced. The results can be used for reference theory and measure in forecasting the surface displacement in multi-coal seam strip mining.  相似文献   

12.
数据挖掘是一门交叉学科,它为建立传统教学中很难获取或不可能获取的模型提供了捷径.从数据挖掘的概念、分类、一般过程及其出现的必然性和可能性入手,根据教育信息化的六大特点:教材多媒体化、资源全球化、教学个性化、活动合作化、管理自动化、环境虚拟化,及远程教育系统中的事实维表、评价项目维表、知识维表、时间维表、学生维表等多维数据模型,分析了数据挖掘在教育信息化、远程教育系统中的具体应用,并对其潜在价值作了简要阐述.  相似文献   

13.
基于数据挖掘的医学图像分类方法研究是多媒体数据挖掘的一个重要组成部分。在分析和总结了现有各种特征提取方法的基础上,提出了基于核密度估计聚类和关联规则的医学图像分类算法和关联规则的医学图像分类器框架。该算法先用核密度估计的聚类算法实现医学图像的聚类,在聚类的结果上提取局部特征,在局部特征上用关联规则实现医学图像的分类。实验结果表明可以较好的提高医学图像分类的准确率。  相似文献   

14.
远程教学系统是从事远程教学的重要环境。本文在分析传统远程教学系统不足的基础上,引入Agent技术及数据挖掘技术,设计了一种基于Web的智能远程教学系统。利用Agent技术及数据挖掘技术,提高了系统的整体性能,满足了远程教学的智能化需求。  相似文献   

15.
随着计算机和网络的广泛应用,远程教育学生规模不断扩大;与此同时,学生流失问题也日益凸显。较高的学生流失率增加了远程教育机构的生均办学成本,给远程教育机构的社会声誉造成负面影响。因此,研究学生流失规律及影响因素,以降低学生流失率,成为提高远程教学质量很好的切入点。已有研究采用访谈、问卷、描述性统计等方法,对流失率与学习阶段、性别、年龄、专业等的关系进行了探究。按照持续比较法,我国远程教育学生流失的影响因素包括学习者因素、教育机构因素、环境因素3大类和11小类:人口统计学因素、学前准备及技能、学习心理因素、学业表现、专业及课程设计、教育机构支持、交互、工学矛盾、家庭支持、计划外事件和社会支持。降低学生流失率一方面可以基于我国远程教育的现实情景,对学生流失各因素间的相互关系进行研究,在此基础上建立结构化的学生流失模型,对学生流失的决策过程进行清晰的解释;另一方面可以采用数据挖掘方法,利用教务管理系统和学习管理系统数据,建立学生流失预测模型,在流失行为发生前发现潜在的流失学生,以便教育机构可以有针对性的采取挽留措施。  相似文献   

16.
决策树是数据挖掘中的一种重要分类方法.在此以粗糙集理论中的正域为启发式函数,设计了一种新的、有效的决策树构造方法.该算法具有较大的灵活性.能从测试属性空间逐次删除已使用过的属性.避免对这些属性进行重复测试,减少测试空间,降低了树的复杂性,从而提高了分类效率.最后,实例验证了算法的可行性与有效性.  相似文献   

17.
该文提出一种基于决策树的分类挖掘技术,在论述分类挖掘的基础上分析决策树分类挖掘系统的建立思想、步骤及算法,并把该系统应用到优化学生资源管理的实验中,实验结果证明了该方法的可行性。  相似文献   

18.
基于网络的远程学习交互活动试验研究   总被引:1,自引:0,他引:1  
本文作者以迈克尔·穆尔(Michael Moore)关于远程教育交互活动的分类为理论框架,开展基于网络的教学模式改革试验研究。试验结果表明,在远程英语学习中开展基于网络的学生与学习资源、学生与学生,以及学生与教师之间的在线交互活动对于提高学生的英语应用能力具有明显的促进作用。  相似文献   

19.
邮件过滤是反垃圾邮件的一种重要方法,其中基于邮件内容的过滤又是一种重要的、有效的过滤手段.基于电子邮件是一种半结构化的数据,并且,电子邮件中主要包括的是文本信息,因此,本文将文本挖掘的分类技术和方法引入到邮件过滤系统模型中,以实现对垃圾邮件的过滤.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号