共查询到10条相似文献,搜索用时 15 毫秒
1.
提出一种新的基于负关联规则与频繁项集挖掘的信息检索系统模型,详细阐述系统模型的设计思想、各模块的功能,以及检索系统实现的三种关键技术(即频繁项集挖掘技术、负关联规则挖掘技术和查询优化扩充技术)及其检索算法。实验结果表明,该检索系统能有效提高和改善信息检索性能。 相似文献
2.
王强 《现代图书情报技术》2008,3(8):63-69
设计并采用Java语言实现基于事务数据库标识列表的频繁项集的产生算法——TidlistApriori。通过与采用Hash-Tree的Apriori算法进行比较,表明TidlistApriori能够提高频繁项集的产生效率,可以成为主题关联挖掘的有效算法工具。 相似文献
3.
4.
挖掘最大频繁项集的优势在于得到的项目数量较少.相比频繁项集和频繁闭合项集挖掘算法,此类算法具有较高的时间和空间效率.根据数据流的特点,结合滑动窗口,提出一种基于有序复合策略的数据流最大频繁项集挖掘算法(E-FPMFI).当数据流流过时,以基本窗口为单位,更新获取数据流片段信息,单遍扫描片段信息得到频繁项目并存储于频繁项目列表内.算法的核心思想:构建有序FP-tree,采用混合子集剪枝技术削减搜索空间,合并同一分支中支持数相等的邻接结点,压缩生成有序复合FP-tree,挖掘最大频繁项集时避免超集检验.经实验验证, E-FPMFI算法具有较好的时空效率和良好的可扩展性. 相似文献
5.
面向查询扩展的特征词频繁项集挖掘算法 总被引:1,自引:0,他引:1
为了获取高质量的扩展词,提出一种面向查询扩展的基于文本数据库的特征词频繁项集挖掘算法。该算法采用支持度衡量特征词频繁项集,给出新的剪枝策略,并结合原始查询,挖掘同时含有查询词项和非查询词项的特征词频繁项集,以提高挖掘效率。实验表明,与传统的挖掘算法相比,本算法更有效、更合理。 相似文献
6.
关联规则挖掘是解决电子商务推荐问题的重要方法之一.针对传统关联规则挖掘算法在解决移动电子商务环境个性化推荐问题时反复扫描数据库,频繁项挖掘效率低,关联规则挖掘准确率低以及规则大量冗余等不足,提出一个基于事务矩阵和用户兴趣度的关联规则挖掘算法(Matrix-and-Interestingness-based Association Rules Mining,MIbARM).该算法仅需扫描一次数据库,并在挖掘过程中不断缩小算法搜索空间以避免生成冗余候选项,同时避免了冗余规则挖掘,从而提高了挖掘效率.最后,在四组人工数据和160种参数组合的数值实验环境下,引入Apriori、CBAR 及BitTableFI算法对MIbARM进行对比验证.结果表明,在不减少有趣规则的前提下,MIbARM不但可有效避免冗余候选项集的产生,而且大幅减少了冗余规则数量,极大提高了算法的搜索效率,同时提升了个性化推荐的质量,更适用于移动电子商务环境下的个性化推荐问题. 相似文献
7.
应用社会网络分析的方法解决多属性关联规则挖掘的问题,这是解决这类问题全新的视角.首先,从啤酒的不同品牌与尿不湿不同颜色的搭配引出了多属性关联规则挖掘的问题,并指出这类问题也包含着广泛的评价和推荐问题;而后,基于社会网络分析的视角,建立了相应的图模型及与之等价的矩阵,通过对图和矩阵的分析,引出了多属性关联规则挖掘的方法;为了进一步使方法有助于程序化表达,将既有的方法通过引入"指标向量"实现了统一表达,这有助于程序递归的实现;最后,给出了本文方法的算法步骤,并将其应用在一个100 000评估量规模的数据集上对方法进行实证分析.结果表明:本文通过社会网络分析的视角将抽象的关联规则挖掘变得可视化,这便于矩阵表达的引入,使得到的方法具有算法复杂度低、直观和易于把握的特征,相比于既有的多属性关联规则挖掘算法有优势. 相似文献
8.
针对面向结构特性的科技文献分类问题,通过关联规则的分类方法将科技文献划分为不同的类型:综述型、理论型和应用型。首先对科技文献数据分词等进行预处理;然后通过PredictiveApriori关联算法挖掘关于类别特征项的频繁项集,构造科技文献分类的分类器;接着对分类科技文献进行分类规则匹配,判定所属类别;最后通过实验对分类性能进行评估,并通过对比证明了本方法的有效性。 相似文献
9.
介绍一种Apriori的改进算法,该算法通过寻找大于最小支持计数的最大频繁项集,可以直接得到最终频繁项集,将改进算法应用到图书馆书目推荐服务中,并对改进算法与Apriori算法进行算法的性能分析及实验数据的运行时间对比,实验证明改进算法在运行速度和挖掘性能上较经典Apriori算法有显著提高。 相似文献
10.