首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 468 毫秒
1.
基于Apriori改进算法的局部反馈查询扩展   总被引:1,自引:0,他引:1  
提出面向查询扩展的Apriori改进算法,采用三种剪枝策略,极大提高挖掘效率;针对现有查询扩展存在的缺陷,提出基于Apriori改进算法的局部反馈查询扩展算法,该算法用Apriori改进算法对前列初检文档进行词间关联规则挖掘,提取含有原查询词的词间关联规则,构造规则库,从库中提取扩展词,实现查询扩展。实验结果表明该算法能够提高信息检索性能,与现有算法比较,在相同查全率水平级下其平均查准率有了明显提高。  相似文献   

2.
关联规则的时态对用户是个非常重要的信息,利用时态关联规则分析,可以得到一系列相关性的项目集合,从而为决策提供更加有利的帮助和支持。现在对于时态关联规则的挖掘主要局限于单一数据库的情况,从多数据库中挖掘时态关联规则还未引起人们的重视,但是多数据库的时态关联规则对于决策分析是非常重要的。本文提出了一种从多数据库中挖掘时态关联规则的方法,并设计了一种算法,实验表明该方法是有效的。  相似文献   

3.
基于XML和关联规则的Web挖掘研究*   总被引:4,自引:1,他引:4  
首先对Web挖掘、关联规则分析及XML作了简要介绍,提出了基于XML和关联规则的Web挖掘研究思想,随后对XML结构挖掘、XML内容挖掘和基于XML的Web日志挖掘进行讨论,建立了一个较为完整的XML挖掘体系。  相似文献   

4.
对1991-2010年间的16 656条我国SSCI文献数据进行关联规则分析。在对关联规则结果进行冗余规则剪除、有效性检验和模板匹配的基础上,得到基于主导地区、合作模式和成果流向角度的我国SSCI文献的数量关联特征。通过关联特征发现:我国主导的社会科学研究合作范围狭窄、合作对象单一,在跨国合作中不占据主导地位,缺乏把握成果流向的话语权。  相似文献   

5.
数据挖掘技术的改进在图书馆个性化服务中的应用   总被引:8,自引:0,他引:8  
Apriori 算法是关联规则挖掘的一个经典算法,在分析关联规则挖掘算法的基础上,提出利用HASH表技术及减少生成候选集的数量对经典Apriori 算法进行改进,从而提高图书馆数据资源的利用率,加强图书馆个性化服务。  相似文献   

6.
介绍了数据挖掘中的关联规则和基于Apriori算法的关联规则数据挖掘技术,并使用关联规则挖掘对医学图书馆中的流通数据进行了实例分析.  相似文献   

7.
[目的/意义] 对阿尔茨海默病(AD)进行基因-疾病关联挖掘,以捕捉潜力研究方向。[方法/过程] 基于LBD理论构建开放式知识发现架构,结合MeSH词表、DisGeNET等医学术语、组学数据对PubMed中AD文献进行知识挖掘,采用关联规则与算法排序等方法对部分基因重合的强关联主题共现疾病和优先候选基因进行筛选,结合时间切片和其他LBD工具对比加以验证。[结果/结论] 对88 334篇AD文献进行基因-疾病识别,并与2 120种AD基因进行匹配;以XYZ分析视角对识别出的992种主题共现疾病及11 899种候选基因进行关联排序;精炼10种强关联疾病与25种优选候选基因,结合文献报道加以论述。通过LBD挖掘目标疾病-共现疾病-基因之间潜在关联,可快速捕捉潜力研究方向,缩小基因测序范围,为新研究假设的生成提供重要指导依据。  相似文献   

8.
完全加权关联规则挖掘是关联规则挖掘的一个重要分支。本文在论述完全加权关联规则挖掘技术的基础上,探讨其在数字图书馆信息处理中的应用价值,并给出一种基于完全加权关联规则挖掘的数字图书馆信息检索模型。  相似文献   

9.
本文通过数据挖掘中的关联规则算法研究,经典Apfiofi算法进行分析,使用一款优秀的源数据挖掘平台WEKA,通过数据预处理属性筛选后使用Apfiofi算法进行关联规则挖掘,对专升本报名数据进行关联规则分析,挖掘存在有价值的信息,为今后院校招生专业设置等提供指导信息。  相似文献   

10.
研究利用数据挖掘中的关联规则挖掘分析及论文数据库,进行相关文献推荐,提出适用于进行相关文献推荐的改进的混合加权关联规则挖掘算法,并通过用户行为分析确定相关文献集和垂直权重,采用Google搜索引擎的PageRank算法确定水平权重,获得一些有意义的分析结果。  相似文献   

11.
关联规则挖掘算法通常生成大量的规则,但由于资源的限制,只有少量规则可能被筛选出来使用。因此关联规则的兴趣度评价成为数据挖掘领域中的一个重要问题。考虑到关联规则兴趣度评价本质上是一个多属性决策问题,本文首先基于关联规则的客观兴趣度度量和用户的主观偏好,建立了关联规则评价指标体系;然后提出一种基于组合评价方法的关联规则评价的框架及其具体实现步骤,以解决多种评价方法评价结果不一致的问题;最后以某超市购物篮数据分析为例,基于整体差异的组合评价方法实现了关联规则的组合评价以验证所提评价方法的可行性和有效性。  相似文献   

12.
针对目前移动内容服务系统缺乏自动构建情境服务规则机制的问题,在情境化用户偏好本体模型的基础上,提出量化频繁标引格结构以建立用户内容偏好与情境之间的语义关联,为规则冲突问题和上下文数据可用性问题提供了解决方案。频繁标引格相对于频繁格进一步减少了产生规则所需的结点数目,更便于不同规则的提取和相关参数的计算。设计了频繁标引格分层构建的算法和推荐规则提取的优先级机制,通过实验验证了算法的有效性,并与相关方法进行了比较分析。  相似文献   

13.
一种基于数据挖掘技术的馆藏资源个性化推荐服务   总被引:2,自引:0,他引:2  
本文介绍了一种如何将ID3决策树算法和关联规则应用于馆藏文献信息资源的个性化推荐服务当中去的方法.文中首先对读者借阅历史记录进行了挖掘和分析,利用决策树算法挖掘出可推荐的相关读者对象,再依据关联规则提取借阅历史记录并对其进行分析和挖掘,从中找出相关潜在的有用或有价值的规则,然后依据这些规则选择出最适合推荐的项目推荐给读者.该方式是为实现个性化推荐服务所进行的一种新的探讨,具有算法收敛性好,计算方法简单有效,可靠性高,推荐效果显著等优势,与传统推荐技术相比,能够更加全面、准确、清晰地进行文献推荐.理论和实践结果表明,所提出的这种方法是一种行之有效的形式.  相似文献   

14.
关联规则兴趣度度量方法的比较研究   总被引:1,自引:1,他引:1  
关联规则挖掘是数据挖掘中重要的研究课题,已有许多有效的实现算法。然而,这些算法找到的关联规则数目太多,用户无法对其进行分析。为了克服这个问题,出现了一些关联规则衡量标准来分析规则的有趣性,在本文里我们在给出的实例上比较分析了一些关联规则客观兴趣度度量指标,提出了使用关联规则客观兴趣度度量指标的一些建议。  相似文献   

15.
创新性的访问控制、灵活的数据布置策略以及更加完善的摄取决策等用户新需求的出现推动着iRODS的到来.本文从定位、核心目标和体系结构等角度对iRODS进行了介绍.并深入分析了iRODS规则库、规则类型、规则运行流程以及规则引擎等,较为全面地剖析了基于规则的分布式数据管理系统.  相似文献   

16.
根据互信息、RBF神经网络和关联规则原理,提出了一种抽取WEB文本分类规则的新方法。先根据互信息选择和各类相关程度大的若干词条,然后采用RBF神经网络方法对选择的特征进行进一步提取,得到维数较小的文本特征向量空间。之后再根据挖掘出的关联规则获取WEB文本分类规则,建立文本分类器,在保证了分类精度的前提下抽取出利于理解的文本分类规则。  相似文献   

17.
Until the 2002 revision to AACR2 was adopted, cataloging rules for updating loose-leaf publications were orphans—they were excluded from previous Anglo–American rule compilations. To offer guidance to catalogers, over the years the Library of Congress issued a series of rule interpretations and supplemental resources outlining best practices and rules for cataloging loose-leafs. This article chronicles the publication, or lack of practical publication, of cataloging rules for updating loose-leafs and the impact on libraries. Also included is a review of the various organizations instrumental in garnering support for the creation and acceptance of a new paradigm and standards and concepts that would ensure the inclusion of cataloging rules for updating resources. Finally, the impacts on libraries and cooperative organizations resulting from the implementation of the new rules are examined.  相似文献   

18.
大多数传统的数据挖掘算法,通常是在二进制值的事务数据库中在单一层次上发现属性之间的关联关系即关联规则,但是大多数的数据库包含有大量量化的值。通常人们采用分区的方法处理量化值,然而这种处理方法带来分区过硬的问题。本文使用模糊的方法从Web日志中发现模糊泛化的Web网页之间的关联规则,它们能够体现出带模糊浏览时间的网页之间的关联关系。通过实例分析表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效的模糊泛化关联规则的提取。  相似文献   

19.
数据挖掘技术在图书馆读者分析中的应用   总被引:6,自引:0,他引:6  
钱强  李英 《图书情报工作》2009,53(12):121-124
使用SOM聚类方法对上海某大学图书馆数据库中的借阅数据进行挖掘分析,对读者进行聚类,用关联规则挖掘方法对某类读者的计算机类图书借阅记录进行挖掘,分析对每一类读者的借阅特征,以找出其借书规则,从而为图书馆管理提出建议。   相似文献   

20.
针对科技基础性工作项目汇交数据质量审查人工效率低、易出错的现状,设计了基于自定义约束规则的项 目汇交数据质量审查模型。模型由构建器、规则库和判断器3个部分构成,其中构建器主要是用于约束规则的配置;规 则库由一系列规则集构成,每个规则集都从数据的完整性、一致性和约束性3个方面进行约束规则的定义,完成定义的 规则集构成一个审查模板;判断器主要是将审查模板应用于一个数据集进行审查并输出审查意见。实践证明,该模型 能够满足科技基础性工作项目汇交数据质量审查的工作要求,提高了科技基础性工作项目汇交数据质量审查的质量和 效率,同时也为其他类似数据质量审查工作提供了技术参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号