首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对目前社交网络服务数据中充斥着大量垃圾数据和广告数据的现状,提出一种基于Mahout框架的数据过滤算法.首先,采用Mahout框架对原始数据中的语素进行分析,得出具有特定语素的单词;然后,根据语素分析结果数据分类生成器为每个生成的语素词分配相应的权重,并得出对应句子的评估值;最后,将评估值与不同类别数据的参考值加以比较完成数据的分类,从而实现社交网络服务数据中有价值数据的过滤.仿真实验结果表明,该算法具有较好的过滤效果.  相似文献   

2.
本文提出了一个基于学习者访问聚类的远程教育智能推荐系统.系统使用基于代理的系统结构,由离线的数据预处理和基于学习者访问的URL聚类以及在线推荐引擎两部分组成.进一步,研究提出了一个基于学习者浏览兴趣的推荐规则集生成算法框架,在学习者浏览兴趣度量时综合考虑了学习者浏览时间和对页面的访问次数.最后,研究设计了一个基于推荐规则集和站点URL路径长度的URL推荐算法.与使用基于关联规则或基于学习者事务的推荐系统相比,该系统在推荐准确性上有较大的提高.  相似文献   

3.
随着编程技术的快速发展和互联网广泛应用,对开发者的技术要求也在迅速提高。该设计旨在建构一个专注于服务互联网行业职业开发者和编程爱好者的技术交流平台,该系统前端采用Lay UI以及Thymeleaf模板引擎;数据存取使用Redis高性能缓存框架;内嵌Shiro安全框架,可拦截低权限访问,保证系统信息安全;在设计系统时添加使用基于ALS算法离线推荐模块,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。随着我国各类互联网从业者规模的扩大和数量的增多,本平台对于从事互联网企业的开发者提升自身能力、扩展眼界有巨大帮助作用.  相似文献   

4.
张孟春 《教育技术导刊》2017,16(11):197-199
针对数据分析融合平台建设中数据集成开发效率低、数据集成慢和数据网络分散等问题,提出跨网络传输的分布式ETL框架设计。通过对主流ETL工具进行分析,总结了ETL的工作原理及过程,设计了一种基于消息中间件面向数据集成的分布式ETL框架。使用该框架处理数据集成任务时,提交数据集成过程的描述文件进行数据处理。基于元模型驱动和面向切面设计思想,设计数据任务执行引擎和控制模型。基于该框架开发的工具可使数据开发人员从大量重复的数据操作中解脱出来,将更多精力放在数据的逻辑处理上。  相似文献   

5.
近年来,基于社交网络的推荐系统随着社交媒体和大数据的蓬勃发展,逐渐成为推荐系统重点研究方向。将社交网络用户社会化属性信息和评论内容与深度学习等技术结合,可有效解决传统推荐系统数据稀疏和冷启动等问题。首先回顾传统推荐系统常用方法,介绍社交网络推荐系统主要流程和基本框架,然后介绍最新相关研究方向和应用情况,最后对基于社交网络的推荐系统发展趋势进行分析与展望。  相似文献   

6.
首先分析了互联网文本中命名实体分布特征;然后使用UIMASDK构建一个文本分析引擎在文档中寻找命名实体,将结果写入抽取信息数据库EIDB中;最后对文本中包含的命名实体的强关联关系进行了关联分析。实验证明该框架非常有效。  相似文献   

7.
大数据时代下信息爆炸式增长,全文检索技术是提高信息检索效率的有效方法。Lucene是一个采用Java编写的全文搜索引擎框架,它运用了面向对象的设计思想,提供了丰富的API。对Lucene的系统结构、索引流程、索引机制进行了详细分析,对应用Lucene引擎搭建全文搜索系统的关键问题进行了研究。  相似文献   

8.
基于情境感知的移动图书馆信息与服务推荐,主要在用户情境、移动情境、资源情境、服务情境四个维度下进行算法模型构建和感知技术设备应用,它是一个“情境-需求-服务”的自适应过程。在研究它泛在的普适化推荐服务和个性化推荐服务过程中,可以发现感知技术设备、算法和推理引擎的不同应用,主要是满足用户信息需求的以下特征,即情境信息的时效性、情境信息的准确性和完整性、情境信息的多种表达形式以及情境信息的互联与共享。  相似文献   

9.
基于Web数据挖掘的个性化e-learning解决方案推荐系统研究   总被引:1,自引:0,他引:1  
本文对国内外e-learning个性化推荐系统的现状进行了分析,建立了一种综合性的个性化e-learning解决方案推荐系统,解决了目前e-learning解决方案推荐系统中学习者兼容性、资源充足性、智能挖掘性、推荐整合性这四大挑战。并主要从技术上对个性化e-learning解决方案推荐系统进行构建,重点对Web数据挖掘算法设计、挖掘引擎设计、系统功能模型、数据库设计、推荐界面进行探讨。  相似文献   

10.
传统协同过滤算法仅利用评分信息进行推荐,而没有利用到更多用户特征与电影特征,推荐效果不佳。深度学习的普通应用,为特征提取打下了良好基础。通过爬取网站上的电影演员信息表,使用卷积神经网络对文本信息进行特征提取,采用结合注意力机制与场感知因子分解机的混合推荐方法,并使用用户—电影特征矩阵进行训练。在公开数据集 MovieLens 上进行实验测试,RMSE 达到 0.850,与 5 组推荐模型进行对比,RMSE 分别提18.0%、11.3%、7.60%、25.7%、6.80%。实验结果表明,该模型可以提高推荐效率。  相似文献   

11.
当前信息化成为高校科技园区发展的重要契机,运用数据挖掘技术进行信息创新在当前的高校科技园区的发展中越来越显示出重要的作用。本文对高校科技园区发展引擎的信息需求进行了分析,基于分析结果研究了数据挖掘技术在高校科技园区发展中的应用重点,最后基于数据挖掘技术重新设计了高校科技园区发展引擎框架。  相似文献   

12.
为改善传统个性化推荐算法精准度不高的问题,使用评论数据作为数据集,先对评论数据作文本预处理和特征提取,然后使用LDA主题模型对文本特征数据建模,得到主题词分布,将其作为标签,同时使用LSTM网络作文本分类,通过计算得到好评率。最后把用户需求和标签利用潜在语义标引计算相似度,根据相似度和好评率大小向用户推荐结果。实验结果表明,该方法能够向用户推荐符合其兴趣的个性化需求信息,且准确率高于96%,证明了该推荐算法的有效性。  相似文献   

13.
通过分析用户行为和Agent技术,提出基于用户行为的多Agent个性化信息推荐系统设计模型。对基于用户行为数据进行分析,整合用户的行为特性可以为用户带来更好的使用体验,多Agent技术能结合用户兴趣偏好信息及用户访问记录实现信息过滤并推理出用户的意图,从而提供个性化的推荐服务。  相似文献   

14.
针对协同过滤中存在的稀疏性问题,提出改进方法——BAS算法。该算法结合贝叶斯度量方法和奇异值降维分解方法,利用传统的基于奇异值分解获得活跃用户的邻居,通过改进后的相似性度量方法得出预测值。对改进后的算法进行理论分析和实验对比。结果表明,该方法在所用数据集上能够有效缓解数据稀疏性问题,并且改善推荐精度的准确性,在一定程度上提高了推荐引擎的推荐质量。  相似文献   

15.
个性化推荐系统是电子商务运作过程中的重要组成部分,计算机网络信息化的不断发展和当今数据的爆炸式增长,使得人们很难在海量信息中找寻出适合自身需求的数据和信息,信息过载状况时有发生。阐述了我国电子商务个性化推荐系统的作用,分析了当前主流电子商务推荐技术,对基于协同过滤的电子商务个性推荐算法进行了研究。  相似文献   

16.
对于数据流转相关应用的开发离不开工作流技术的支持。通过对数据流转业务的实际开发需求的分析,在关系数据库结构基础上推出了简单实用的工作流引擎(workflow引擎)。该工作流引擎模型由机构模型、信息模型和控制模型三部分组成。给出了相关的机构模型、信息模型和控制模型的设计原理以及具体的表示和实现方法。  相似文献   

17.
提出一种基于工作流的业务流程集成框架,该框架将各应用逻辑视作分布计算环境下的平台组件,采用面向服务的视图,将组件提供的服务封装到适配器中,使用XML消息协调服务间的交互,通过全局工作流引擎控制业务流程.给出了框架的分层架构模型,设计了框架的核心组件:工作流引擎、适配器和消息代理.以企业订单创建流程为例,验证了框架的有效性.  相似文献   

18.
协同过滤算法是当今推荐系统普遍使用的一种推荐算法。面对单机模型已逐渐承受不了大数据给推荐系统带来的负荷问题,提出基于Spark平台的一种项目相似度与ALS相结合的协同过滤推荐算法。它基于Spark分布式并行计算框架,可提高预测计算效率,减少系统响应时间。同时使用“基于项目相似度的协同过滤”与“交替最小二乘的协同过滤(ALS)”相结合的一种混合推荐方法,可提高系统推荐精度。通过在MovieLens数据集上的实验结果表明,该算法在算法融合与推荐精度上有着很好的效果。  相似文献   

19.
进入大数据时代,面对海量的文献信息资源,如何利用大数据技术给用户进行准确的个性化的文献资源推荐,是高校图书馆面临的一大难题。分析了目前高校图书馆文献推荐工作的现状和存在的问题,提出利用大数据进行文献推荐,主要从文献推荐系统中的文献推荐策略等几个方面进行。  相似文献   

20.
使用数据挖掘技术可以从用户的图书借阅数据中挖掘有价值的信息,获得用户的借阅行为,为用户提供个性化图书推荐服务。传统的关联规则算法在使用前不进行数据清洗,导致单一用户的单一借阅记录在整体数据集中相对地变成了离群点,使Apriori算法的运行时间显著增加。本文根据数据集的支持度、置信度和过滤度的阈值进行数据清洗,再使用Apriori算法对清洗后的数据集进行关联规则分析。实验结果表明在大数据量和小数据量的情况下,带有数据清洗的Apriori算法的分析耗时更短,强关联规则更强,在个性化图书推荐领域中效果显著。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号