共查询到20条相似文献,搜索用时 728 毫秒
1.
2.
3.
针对协同过滤算法中存在数据稀疏的问题,提出一种基于融合用户标签和蚁群的协同过滤微博推荐算法。将表示用户兴趣的标签引入推荐模型中,利用标签和用户以及标签和微博的关联度,建立用户对微博的兴趣度模型。另外结合蚁群聚类和协同过滤为目标用户进行用户聚类,计算出对目标用户的待推荐微博集。最后利用用户对微博的兴趣度模型从待推荐微博集中选出Top-N为目标用户进行推荐。实验引入标签和蚁群算法的有效性,将测试结果与传统协同过滤推荐算法和纯基于标签的微博推荐算法进行比较,该算法不仅改善了协同过滤算法中数据稀疏和冷启动的问题,而且推荐准确度有明显提高。 相似文献
4.
5.
胡三宁 《三门峡职业技术学院学报》2015,(2):140-144
提出了一种基于用户兴趣及标签相似度的混合推荐算法,构建基于标签的用户兴趣模型,通过计算与资源相似度完成推荐,同时融合时间因素研究用户兴趣变化,提高了基于内容的推荐中相似度计算的准确率;根据用户兴趣相似度聚类用户,通过兴趣协同推荐减少对评分矩阵的依赖,一定程度上解决了协同过滤中推荐数据缺失问题;同时,结合用户基本信息有望缓解冷启动问题。实验表明该算法具有一定的有效性及可行性。 相似文献
6.
7.
user-based协同过滤算法在B2C电子商务中是一种重要的推荐方法,但是用户共同评价项目的稀缺性导致了协同过滤算法质量的下降。鉴于此,在考虑用户评分数据的基础上,对用户评分记录进行聚类平滑。考虑用户购买记录作为数据源之一,并用曼哈顿距离相似度计算方法计算用户购买记录,将两者线性组合得到混合相似度,使用混合相似度进行推荐,通过实验计算两者线性组合的最佳权重系数,比传统的利用用户评分记录和用户购买记录的精确度高。实验结果表明,基于混合相似度的协同过滤推荐能有效提高由于数据稀缺性造成的推荐准确度。 相似文献
8.
张丹 《佳木斯教育学院学报》2006,(3)
文本相似度计算是文本分类、文本聚类、自动文摘、信息抽取的基础.文本相似度计算性能直接影响到文本分类、文本聚类、自动文摘的质量.另外文本相似度还应用于诸多自然语言处理任务中,本文对文本相似度计算问题进行了深入的研究,并根据自然语言的特点提出了通过比较两个文本关键语义对来计算文本的语义相似度. 相似文献
9.
林滨 《福建工程学院学报》2016,(1):80-85
针对文本类型数据的分类进行研究,用VSM模型和TF IDF技术对文本文件进行了数据样本抽取加权,得到文本相似度矩阵;采用不同样本距离计算方法和K-Means算法对数据进行了聚类实验,获得聚类结果并进行了分析和总结;基于实验结论,研究了不同距离计算方法之间的区别以及适用的数据类型。 相似文献
10.
针对传统协同过滤推荐算法在大数据环境下存在数据稀疏性及计算复杂性等问题,提出一种双向聚类协同过滤推荐算法。该算法首先从用户维度和项目维度两个方向分别进行属性聚类,然后在目标用户和目标项目所在类簇中分别使用改进后的相似度计算方法进行协同过滤推荐,最后通过平衡因子综合预测评分并形成最终推荐列表。在 MovieLens 公开数据集上进行实验,结果表明,该算法(DCF)相比传统协同过滤推荐算法(TCF)、基于用户聚类的协同过滤推荐算法(UCF)以及基于项目聚类的协同过滤推荐算法(ICF),在平均绝对误差上分别降低了 16%、8.1%、7.5%,有效提高了推荐精度。 相似文献
11.
为实现对可信Web 服务的推荐,提出基于用户及相似用户使用经验的Web服务信任模型,该模型一方面定义用户自身服务使用经验为直接信任度;另一方面,依据相似用户使用经验定义推荐信任度。采用TOP K算法,选出与用户最相似的K个最近邻,根据直接信任度与间接信任度预测出服务性能后进行服务推荐。模拟实验结果表明,该方法能有效进行Web服务推荐。 相似文献
12.
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意.论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软)聚类算法HTSC.对HTSC算法进行了理论分析,并对其中的核心算法进行了初步的实验验证.该算法可对搜索引擎返回的结果进行模糊聚类,以方便用户从中找到真正需要的信息. 相似文献
13.
郑辉 《常熟理工学院学报》2021,35(5):75-80
为了提高个性化推荐的准确度,提出一种基于全局相似度的在线资源个性化推荐算法.首先分别基于用户和在线资源对其各自相似性进行计算,运用K-means聚类方法根据对用户偏好和在线资源属性及评分的相似性计算结果对其进行划簇,实现用户与在线资源聚类划分,以此实现精准的个性化在线资源推送.实验结果显示,本文方法推荐的最小平均绝对误差为0.77,查准率随着数据覆盖率的增加可达到60%以上,推荐耗时基本稳定在20 s以内.在推荐准确度、查全率以及效率方面均有良好表现. 相似文献
14.
提出使用文本相似度算法与DBSCAN聚类算法相结合的方法对文本进行聚类,实现对文本的管理。首先对文本进行特征提取和分词操作,在分词过程中会产生大量的特征词汇,而有些特征词汇对文本特征的表达并无实际意义。因此,在文本特征提取过程中根据特征词汇对文本特征表达的贡献度进行取舍,以提高文本聚类的效率和准确性。利用TF IDF方法对特征词汇进行加权,并且对文本进行相似度计算,将相似度低于阈值的文本作为孤立点进行处理。利用DBSCAN算法对文本进行聚类,将相似的文本聚为一类。 相似文献
15.
传统的协同过滤算法难以解决“稀疏性”和“冷启动”等问题。鉴于此,提出一种融合用户相似度和信任度的方法。首先根据用户对共同项目的评分创建初始信任度,通过信任关系的传递规则,建立没有直接信任关系的用户之间的信任关系,然后融合用户相似度与信任度,用于传统的协同过滤推荐系统,找出用户的最近邻居集,进行项目的评分预测,从而产生推荐列表。实验表明,改进后的算法能有效提高系统推荐的准确性。 相似文献
16.
由于向量空间模型在文本聚类中的应用,而必须对文本特征进行降维。本方法首先利用特征的概率分布计算特征之间的相似度,在此基础上对特征进行聚类;然后在文本聚类的结果上计算各个特征的信息增益值;最后在各个特征类上取出一定比例的最重要的特征达到特征选择的目标。实验表明,该改进算法在聚类的准确度方面较以前的方法有所提高,可以有效地用于文本自动聚类。 相似文献
17.
18.
社交网络的快速发展,微博成为主要的社交媒体平台,针对如何预测微博文本的未来互动数,对微博进行有效的分发控制的问题,提出一种基于并行决策树的微博互动数所属级数预测的方法。首先,对用户以往发表的微博进行用户特征和微博文本特征的处理;然后,使用并行决策树分类算法对训练数据进行分类模型的构建;最后使用得到的分类模型对新微博文本的互动数所属级数进行分类预测。通过对比算法的实验,验证了所提方法具有较高的分类精度和较好的可扩展性,能够对微博所属级数进行有效的分类预测。 相似文献
19.
社交网络中各种推广应用都依赖于用户兴趣的获取。用户兴趣获取方法多种多样,但大多集中于用户关注信息、用户浏览网页的分析,用户发表的语义信息与兴趣的潜在联系很少被深度发掘。提出基于标签的话题分割模型,将所有文本转化为带标签的文本以便聚类。通过分析话题变化状态推测用户兴趣迁移状况,注重社交网络用户兴趣及迁移状况与话题动态变化过程的潜在关联,利用Word2vec对话题进行相似度分析,充分利用词的上下文信息表征丰富的语义信息,通过分析社交网络平台数据,得到用户兴趣分布、兴趣动态变化过程以及话题迁移状况。将结果进行拟合后发现,用户的兴趣及变化状况很大程度上取决于用户发表的话题。 相似文献