首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 656 毫秒
1.
针对传统协同过滤推荐算法在大数据环境下存在数据稀疏性及计算复杂性等问题,提出一种双向聚类协同过滤推荐算法。该算法首先从用户维度和项目维度两个方向分别进行属性聚类,然后在目标用户和目标项目所在类簇中分别使用改进后的相似度计算方法进行协同过滤推荐,最后通过平衡因子综合预测评分并形成最终推荐列表。在 MovieLens 公开数据集上进行实验,结果表明,该算法(DCF)相比传统协同过滤推荐算法(TCF)、基于用户聚类的协同过滤推荐算法(UCF)以及基于项目聚类的协同过滤推荐算法(ICF),在平均绝对误差上分别降低了 16%、8.1%、7.5%,有效提高了推荐精度。  相似文献   

2.
针对协同过滤算法中存在数据稀疏的问题,提出一种基于融合用户标签和蚁群的协同过滤微博推荐算法。将表示用户兴趣的标签引入推荐模型中,利用标签和用户以及标签和微博的关联度,建立用户对微博的兴趣度模型。另外结合蚁群聚类和协同过滤为目标用户进行用户聚类,计算出对目标用户的待推荐微博集。最后利用用户对微博的兴趣度模型从待推荐微博集中选出Top-N为目标用户进行推荐。实验引入标签和蚁群算法的有效性,将测试结果与传统协同过滤推荐算法和纯基于标签的微博推荐算法进行比较,该算法不仅改善了协同过滤算法中数据稀疏和冷启动的问题,而且推荐准确度有明显提高。  相似文献   

3.
协同过滤推荐系统是电子商务系统中最成功、最重要的技术之一,而在协同过滤算法中用户相似度的计算是影响算法效率的重要因素。针对传统协同过滤算法中数据稀疏导致的近邻选择不准确问题,引入灰关联分析理论进行项目聚类和用户相似度计算,并以此为基础提出了一种新的协同过滤算法,既解决了对象匹配的不足,又提高了近邻选择的准确性。实验表明,该算法可以有效解决大规模数据下用户评分数据极端稀疏带来的问题,显著提高系统的推荐质量。  相似文献   

4.
个性化推荐系统被越来越多地应用到各类网站中,以解决信息增长带来的信息迷失和信息过栽问题,而协同过滤算法是个性化推荐系统的重要算法之一,但是传统的协同过滤算法存在数据稀疏、冷启动等问题,为了解决这些问题,在综合WEB日志挖掘和聚类两个因素基础上,提出基于WEB日志和聚类的协同过滤算法,并将该算法与传统的协同过滤算法进行分析比较,验证了该算法能够提高推荐的精确度和实时性.  相似文献   

5.
协同过滤算法在互联网飞速发展的今天得到了广泛应用。由于数据量的膨胀式发展,传统推荐系统的推荐效率受到前所未有的挑战。提出一种改进的协同过滤推荐算法,对数据库数据先进行聚类操作,将用户对项目的平均评分和项目被评价过的次数作为二位网格的维,再根据项目相似性,运用CLIQUE网格聚类算法进行基于项目的聚类。应用协同过滤推荐算法在对应的聚类簇中找到推荐项目。实验证明,该方法能明显提高推荐系统的推荐效率。  相似文献   

6.
本文首先介绍了当前电子商务个性化推荐的主流技术——协同过滤技术,接着分析了该算法中影响推荐质量的两个主要问题——稀疏性问题和扩展性问题,然后引入聚类算法对传统的协同过滤算法进行改进,最后对之前所提出的改进算法进行了仿真实验.经过实验验证,改进算法的推荐准确性比传统算法的推荐准确性有所提高,特别是在用户评价数据集极端稀疏的情况下改进算法体现出了较好的推荐性能.  相似文献   

7.
为解决传统协同过滤推荐算法数据稀疏、可扩展性差等问题,采用改进预测评分矩阵的协同过滤算法。首先使用基于线性回归分析的加权Slope One算法,在传统Slope One算法中加入可信度,提高共同评分基数;然后采用网上标准数据集movielens作为测试数据,结合协同过滤算法进行top-N推荐。实验结果表明,使用改进预测评分矩阵的协同过滤算法的MEA较小,在近邻数大于25时达到0.74,表明该算法改善了传统协同过滤算法数据稀疏、扩展性差问题,降低了推荐误差,提高了推荐系统准确度。  相似文献   

8.
针对协同过滤系统中数据稀疏导致推荐质量下降的问题,提出了一种基于时间和共同评分项目数的协同过滤算法。其基本思想是:首先定义关于时间信息函数来降低预测误差,两个用户对共同评分的物品产生行为的时间间隔越远,他们之间的相似度就会越小;其次,定义和共同评分项目数量有关的函数,惩罚数量很少的两个用户之间相似度。实验表明,改进的算法通过调整用户相似度,比传统的协同过滤算法具有更好的推荐质量。  相似文献   

9.
为了解决传统协同过滤算法中的数据稀疏问题,本文给出了基于社区过滤技术的估值填充推荐算法.其内涵是利用聚类思想对估值填充公式进行改进,在项目种类社区中计算顾客评分尺度和商品受欢迎度,同时,论文对给出的算法进行了仿真实验,证实了该算法在稀疏商品数据集中有着较好的推荐效果.  相似文献   

10.
协同过滤算法在电子商务网站推荐系统中的应用非常广泛,其通过分析大量用户的历史行为数据,挖掘用户的兴趣,向用户推荐合适的物品。然而,协同过滤算法存在数据稀疏性问题。针对该问题,提出一种基于用户特征和商品特征的组合协同过滤推荐算法。通过用户基本属性特征、物品分类属性特征以及用户的历史评分记录,计算用户的相似性和物品的相似性,获得近邻用户和相似物品;依据改进的基于物品协同过滤和基于用户协同过滤组合推荐算法,为项目进行评分。实验表明,该方法能降低预测结果的平均绝对误差,提高推荐精度。  相似文献   

11.
对于有个性化推荐需求的电子商务系统,传统协同过滤推荐算法对商品的用户项目矩阵构建比较单一,难以解决数据稀疏以及推荐结果精度较低等问题。为此,提出一种改进的基于信任度的协同过滤算法,根据用户历史行为,对用户项目评分矩阵进行细分量化,综合考虑用户间关系,引入信任因子维持用户信任关系中的非对称性,通过共同评分项计算用户评分信任度。最终融合信任度与信任因子,计算获得最佳邻居集并产生最终推荐列表。在淘宝官方UserBehavior数据集下进行实验,结果表明,该算法降低了推荐稀疏性,提高了推荐精度。  相似文献   

12.
在科技高速发展的今天,海量数据处理问题受到人们广泛关注。将K means聚类算法与Hadoop平台相结合是处理海量数据问题的一条可靠途径。简单介绍Hadoop和K means算法以及K means聚类算法MapReduce并行化实现,并阐述目前Hadoop平台下K means算法的几种优化方式,最后提出研究展望。  相似文献   

13.
《柳州师专学报》2015,(6):108-110
K-means算法是一种基于划分的方法,该算法对初始聚类中心的选取依赖性极大,初始中心值的不同导致聚类效果不稳定.为此,本文利用几何概率的思想,认为每个数据点都是等概率的存在于数据集,通过计算每个数据点的点概率值,结合距离因素,选择K个点作为初始聚类中心.实验证明,改进后的K-means算法聚类效果更好.  相似文献   

14.
K-means算法在聚类过程中随机选取k个初始聚类中心,容易造成聚类结果不稳定。针对该问题,提出PCA-TDKM算法:使用主成分分析法对数据对象集合的属性进行降维,提取出主属性,去掉无关属性,从而加速聚类过程;基于最小生成树算法及树的剪枝方法将数据对象划分为k个初始聚类簇,然后进行剪枝生成k棵子树,计算每棵子树中所有数据对象的均值,作为初始聚类中心;利用基于密度与最大最小距离的算法思想进行聚类。将PCA-TDKM算法与K-means、KNE-KM、QMC KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定、聚类准确率高。  相似文献   

15.
为提高推荐算法挖掘数据长尾信息的能力,降低推荐结果流行度,使推荐结果更多样,在传统协同过滤推荐算法基础上,分别将热门项目与活跃用户的惩罚因子引入相似性计算中,依据准确度、覆盖率、流行度等评价标准,在上海某电商平台销售数据集上进行比较,并通过多组实验验证不同参数对推荐算法的影响。结果显示,加入惩罚因子后基于用户的协同过滤推荐算法在N值取10、K值取3时,流行度为3.97,比传统方法降低了7.31%;加入惩罚因子后基于项目的协同过滤推荐算法在N值取10、K值取3时,准确率为7.65%,比传统方法提高了5.25%。由此证明加入惩罚因子的协同过滤推荐算法在保持算法准确率的同时,可在一定程度上降低推荐结果流行度。  相似文献   

16.
针对传统协同过滤算法中存在的数据稀疏和用户兴趣变化问题,提出一种改进的协同过滤推荐算法(IPTDCF)。在用户相似度计算中融入评分交集项目占比因子,针对用户兴趣变化问题在评分预测计算中融入时间衰减函数,提高推荐算法的准确性。仿真实验表明,改进后的算法在推荐准确度上优于传统算法。  相似文献   

17.
陈琍 《钦州学院学报》2006,21(6):36-37,41
从数据挖掘方法中常用的聚类算法的基本原理,将聚类算法中的K—means算法用于客户关系管理系统中,实现客户分类.并且对K—means算法进行了改进,根据客户信用特征对客户进行预分类,提高了算法的效率.  相似文献   

18.
K-means算法作为较为普遍的聚类算法,聚类效果受孤立点、噪声点和初始聚类中心影响较大。结合Isolation Forest算法计算数据中每个样本的异常度系数,根据离群值过滤比例计算得到异常度系数阈值,对高度异常值加以隔离,并对隔离后的数据集使用平均插值法求得初始聚类中心。运用改进K-means算法对真实数据集进行聚类分析,与此同时,通过比较多个离群值过滤比例下的聚类结果,找到离群值过滤比例的最优取值。仿真结果表明,相比于原始算法,新算法显著提升了聚类准确性,聚类效果更佳。  相似文献   

19.
K-means算法是聚类分析划分方法中的一种常用方法,也是目前在数据分析方法中最有应用前景的方法之一。但K mean算法对初始聚类中心十分敏感,这对处理学生成绩等数据而言,会导致聚类结果极为不稳定。为此,提出基于改进遗传算法的K means聚类算法。该算法利用遗传算法解决初始聚类中心,提高聚类结果的稳定性,但存在前期过早收敛和后期收敛过慢的缺点。将改进遗传K means聚类算法应用于高职高专的学生考试成绩分析中,可以很好地解决传统遗传聚类算法对聚类结果的不稳定性问题,并通过聚类结果对学生考试成绩进行分类评价,利用所获得的数据聚类结果指导教学,从而提高教学质量。  相似文献   

20.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号