首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对目前适用于中文文本非等级关系提取方法偏少以及关联规则筛选方法忽略了集中出现在部分文本集中的领域词汇关系的问题,通过对中文文本的统计分析,尝试定义一套中文非等级关系提取的规则,同时提出一种加入平均值变量的改进的关联规则。实践证明,基于自定义的语法规则提取方法能够有效地从中文文本中提取出主、谓、宾语,进而提取出非等级关系,改进的关联规则方法能够提取出集中出现在部分文本集中的领域词汇非等级关系。  相似文献   

2.
介绍了数据挖掘中的关联规则和基于Apriori算法的关联规则数据挖掘技术,并使用关联规则挖掘对医学图书馆中的流通数据进行了实例分析.  相似文献   

3.
学术资源本体非等级关系抽取研究   总被引:1,自引:1,他引:0  
蒋婷  孙建军 《图书情报工作》2016,60(20):112-122
[目的/意义] 概念非等级关系抽取是本体构建的必要步骤,学术文献作为一种重要的学术资源类型,本文主要利用其结构特点来进行本体概念非等级关系的抽取。[方法/过程] 首先,在本体概念抽取的基础上,对文献中概念的类型进行分类,以便于后期关系动词搭配的概念类型来排除不符合条件的三元组;其次,确定学术文献中的关系类型,并采用C-value方法抽取表示关系的动词,进行本体关系的表示;再次,评价概念对的关联性,利用互信息法对概念对进行排序并去除非相关概念对,实验表明该方法非常有效;最后评价概念对与关系动词的关联,分析影响三元组关联的因素,再采用实验确定模型挖掘三元组,实验比较现有的关联规则挖掘的方法。[结果/结论] 结果表明本文提出的三元组选择模型效果明显超过现有的关联规则挖掘方法,并且在语料集扩大的情况下这种优势更为明显。  相似文献   

4.
关联规则兴趣度度量方法的比较研究   总被引:1,自引:1,他引:1  
关联规则挖掘是数据挖掘中重要的研究课题,已有许多有效的实现算法。然而,这些算法找到的关联规则数目太多,用户无法对其进行分析。为了克服这个问题,出现了一些关联规则衡量标准来分析规则的有趣性,在本文里我们在给出的实例上比较分析了一些关联规则客观兴趣度度量指标,提出了使用关联规则客观兴趣度度量指标的一些建议。  相似文献   

5.
数据挖掘技术在图书馆读者分析中的应用   总被引:6,自引:0,他引:6  
钱强  李英 《图书情报工作》2009,53(12):121-124
使用SOM聚类方法对上海某大学图书馆数据库中的借阅数据进行挖掘分析,对读者进行聚类,用关联规则挖掘方法对某类读者的计算机类图书借阅记录进行挖掘,分析对每一类读者的借阅特征,以找出其借书规则,从而为图书馆管理提出建议。   相似文献   

6.
应用关联规则挖掘方法从中文社会科学引文索引(CSSCI)数据库提供的论文引用情况中挖掘关联规则,进而探讨社会科学各学科间相关性问题。本文首先介绍关联规则的基本概念;然后对所需数据进行整理,并从三个角度考虑,分别计算频繁项目的支持度与置信度,得到三个关联规则表;最后对得到的关联规则进行分析,得出结论。  相似文献   

7.
提出将关联规则方法应用到微群核心用户挖掘中,选取新浪微群作为具体实验对象,分别利用关联规则方法、主流的社交网络方法和常用的评价指标体系方法对采集到的真实微群数据集进行对比分析,验证模型的有效性。同时发现常用的评价指标体系方法需要根据微群的具体问题进行调整,而关联规则方法可自动处理,说明关联规则方法具有普适性。  相似文献   

8.
本文通过数据挖掘中的关联规则算法研究,经典Apfiofi算法进行分析,使用一款优秀的源数据挖掘平台WEKA,通过数据预处理属性筛选后使用Apfiofi算法进行关联规则挖掘,对专升本报名数据进行关联规则分析,挖掘存在有价值的信息,为今后院校招生专业设置等提供指导信息。  相似文献   

9.
以概念格理论为基础,用形式概念分析的方法通过对数字图书馆用户使用方法的关联规则挖掘,建立灵活的规则挖掘机制,并依据提取的关联规则对数字图书馆用户进行用法细分,对在更大程度上满足更多用户的个性化需求进行尝试。  相似文献   

10.
关联规则的时态对用户是个非常重要的信息,利用时态关联规则分析,可以得到一系列相关性的项目集合,从而为决策提供更加有利的帮助和支持。现在对于时态关联规则的挖掘主要局限于单一数据库的情况,从多数据库中挖掘时态关联规则还未引起人们的重视,但是多数据库的时态关联规则对于决策分析是非常重要的。本文提出了一种从多数据库中挖掘时态关联规则的方法,并设计了一种算法,实验表明该方法是有效的。  相似文献   

11.
对1991-2010年间的16 656条我国SSCI文献数据进行关联规则分析。在对关联规则结果进行冗余规则剪除、有效性检验和模板匹配的基础上,得到基于主导地区、合作模式和成果流向角度的我国SSCI文献的数量关联特征。通过关联特征发现:我国主导的社会科学研究合作范围狭窄、合作对象单一,在跨国合作中不占据主导地位,缺乏把握成果流向的话语权。  相似文献   

12.
针对传统图书自动推荐系统准确性不高的缺点,提出利用数据挖掘中的关联规则算法技术将读者借阅的图书、性别、年龄、职称、职业、受教育程度、爱好等多维关系生成关联规则,再将读者基本信息与这些规则进行比较,把匹配的关联规则推荐给读者,就能解决传统推荐系统的不足,提供更加灵活的个性化图书推荐服务。文章以湖南图书馆2011年读者借阅数据为例,利用Microsoft SQL Server 2008为工具进行了关联规则算法的数据挖掘分析。  相似文献   

13.
基于主题等级概念知识库的信息自动检索应用研究   总被引:2,自引:0,他引:2  
王兰成  田梅 《情报学报》2004,23(1):40-44
网络技术与智能信息技术为计算机的应用创造了新的环境 ,基于主题等级概念知识库的信息自动检索已成为当前开拓研究和能产生实效的新课题。本文初步实现了主题等级概念知识库 ,研究并提供了关联词表的实现算法 ,设计了词族索引的关系模式 ,并运用于主题信息的自动概念检索。  相似文献   

14.
关联规则兴趣度的度量   总被引:16,自引:2,他引:14  
本文对PS公式(关联规则兴趣度的一种度量公式,简单有效)的数学特性进行了深入的讨论,指出了它的优点和不足,并在此基础之上提出了一个新的度量规则兴趣度的方法.这种度量方法综合考虑了用户主观偏好、规则准确度、规则相关度对规则兴趣度的影响,克服了支持度-可信度框架的缺陷,可以用来简化寻找令人感兴趣规则的过程,优化现有的关联规则挖掘算法,因此,具有很好的应用前景.  相似文献   

15.
根据互信息、RBF神经网络和关联规则原理,提出了一种抽取WEB文本分类规则的新方法。先根据互信息选择和各类相关程度大的若干词条,然后采用RBF神经网络方法对选择的特征进行进一步提取,得到维数较小的文本特征向量空间。之后再根据挖掘出的关联规则获取WEB文本分类规则,建立文本分类器,在保证了分类精度的前提下抽取出利于理解的文本分类规则。  相似文献   

16.
关联规则挖掘算法通常生成大量的规则,但由于资源的限制,只有少量规则可能被筛选出来使用。因此关联规则的兴趣度评价成为数据挖掘领域中的一个重要问题。考虑到关联规则兴趣度评价本质上是一个多属性决策问题,本文首先基于关联规则的客观兴趣度度量和用户的主观偏好,建立了关联规则评价指标体系;然后提出一种基于组合评价方法的关联规则评价的框架及其具体实现步骤,以解决多种评价方法评价结果不一致的问题;最后以某超市购物篮数据分析为例,基于整体差异的组合评价方法实现了关联规则的组合评价以验证所提评价方法的可行性和有效性。  相似文献   

17.
基于XML和关联规则的Web挖掘研究*   总被引:4,自引:1,他引:4  
首先对Web挖掘、关联规则分析及XML作了简要介绍,提出了基于XML和关联规则的Web挖掘研究思想,随后对XML结构挖掘、XML内容挖掘和基于XML的Web日志挖掘进行讨论,建立了一个较为完整的XML挖掘体系。  相似文献   

18.
提出一种新的领域本体学习方法,结合形式概念分析(FCA)与关联规则挖掘从非结构化文本中获取情报学本体。该方法从文本集中通过种子-扩展机制的方法获取领域核心概念,构建文档概念格(文档×关键词矩阵),在此基础上通过形式概念分析方法来识别概念之间的等级关系,通过关联规则挖掘概念间的相关关系。最后,采用基于"黄金标准"的方法对本体学习的结果进行评价,结果表明:通过这种方法构建的本体可以达到较高的领域知识覆盖率,而且能够识别概念之间部分隐含的关系,从而验证该方法在领域本体的构建中实用且有效。  相似文献   

19.
肖强  钱晓东 《图书情报工作》2011,55(16):136-139
针对传统关联规则算法中事务扫描的重复性以及最小支持度设定的不确定性,导致关联规则挖掘算法扫描事务数据库运行效率低下的问题,提出一种基于K-means的Web访问用户关联规则挖掘算法,该算法利用K-means算法聚类的效果,将Web访问用户数据集聚类为不同的小数据集,采用不同的最小支持度,分别对Web访问用户聚类小数据集进行关联规则挖掘。分析和实验结果证明,该算法可有效提高传统关联规则挖掘算法的效率,同时也可有效避免传统关联算法中扫描中的重复性。  相似文献   

20.
利用关联规则对高校图书馆借阅信息进行挖掘,可以找出读者的借阅习惯,从而可以根据读者借阅习惯,能实时、有针对性、主动地为读者提供读者感兴趣的图书.但在实际的运用中,经过统计发现,基于传统的关联规则进行推荐模式存在着关联规则发现困难以及并没有反映出读者借阅习惯的变化问题.论文试图对挖掘出的结果进行分析比较处理,进行特殊的加权处理,从而为用户推荐出命中率高的个性化的推荐模型.实际测试表明:经过加权处理后的关联规则推荐模型能够及时反映出用户的变化,能够满足为用户提供更专业的个性化推荐.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号