首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 207 毫秒
1.
微博的普及导致微博平台数据量日益增长,因此从海量微博中快速准确地为微博用户推荐好友成为了巨大挑战。用户的社交网络和微博文本在一定程度上体现了用户的价值观和兴趣爱好,有相似兴趣的微博用户更有可能成为朋友。基于上述事实,以用户微博文本相似度为似然函数,使用K-means聚类对微博用户聚类,得到微博用户社交圈;在社交圈内部迭代计算用户之间的相似度,同时计算用户对其所在社交圈中其余用户的信任度;最后,根据用户之间的相似度和信任度完成微博好友推荐。实验结果表明,该算法优于传统的基于社交网络拓扑图的好友推荐方法。  相似文献   

2.
微博作为近年来的热门社交网络平台,其用户行为、兴趣模型及个性化推荐深受国内外学者关注。针对微博社交网络的弱关系特点,结合用户实时交互信息与用户基本信息,提出一种综合考虑用户基本信息与用户交互信息的用户相似度计算方法;进而在UserCF算法的基础上,提出一种基于微博交互信息的推荐算法。该算法考虑了微博平台的弱连接关系特点,能有效针对微博类社交网络进行用户推荐。通过实际社交数据集实验证明,该算法具有良好的执行效率与推荐效果。  相似文献   

3.
针对目前国内外学者对微博情感只作二分类研究,仅仅从正面和负面研究微博情感不足的问题,选取NLPCC2013-2014年多情感的微博数据集,重点研究常用的3种机器学习算法、3种特征选择以及特征权重方法对中文微博情感多分类的影响。实验表明:不管选择哪种特征权重,使用SVM的微博文本分类准确率都最高,KNN的准确率最低;不同特征权重下,信息增益作为特征选择的方法时,3个算法各自准确率都是最高的;当信息增益为特征选择,TF-IDF为特征权重时,支持向量机的文本分类准确率最高。由于微博简短、口语化,词袋模型忽视了词与词间的联系,导致微博情感分类准确率不高。  相似文献   

4.
利用傅立叶级数对散点小行星光变数据进行曲线拟合,以获得小行星表示参数,选取傅立叶级数为6的拟合方式对单体或双体小行星光变曲线进行分类,并用机器学习算法中的SVM和决策树建立预测模型。检验结果表明,SVM模型对单体和双体小行星的预测正确率达到95%,相较于决策树正确率提高了10%,为从小行星实际观测数据直接推测双体小行星潜在相关应用提供了参考。  相似文献   

5.
HTTP隧道是各种木马和间谍软件进行网络通信的主要途径,严重威胁了网络安全。比较有效的算法主要是统计指印方法,统计指印采用的特征较少,对训练集的依赖程度较高,算法的稳定性较差。决策树分类算法提取了网络数据流更多的有效特征。使用决策树分类算法对HTTP隧道数据进行了检测,通过实验结果对比,决策树算法的稳定性更好,精确度和效率更高。  相似文献   

6.
通过分析社交网络中信息传播的特点,构造了社交网络信息传播模型。以用户之间互动情况来定义用户间的信任值,以新浪微博为例研究了用户间的关系特征和社交网络中信息传播的特点。  相似文献   

7.
刘冲  杨磊  李娜 《教育技术导刊》2016,15(12):33-34
分类是数据挖掘的一个重要课题。分类的目的是建立一个分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个利用该模型形成分类规则并预测未来数据趋势。决策树归纳是经典的分类算法,构建决策树模型算法中最有影响力的方法是ID3算法。针对ID3算法缺点,使用预剪枝和后剪枝相结合的办法处理决策树中的过学习情况,可生成一个更简单、更精确的决策树。  相似文献   

8.
针对微博短文本特征难以提取的特点,结合微博文本的3种专属特殊符号:“@”、“//”和“#”分析微博文本的特点,从而对TF IDF算法进行改进,并且考虑用户兴趣时间的长短来进行微博短文本特征词的选取。实验结果表明,相对于原有算法,该算法能够有效提高微博短文本特征词提取的准确度。  相似文献   

9.
随着Web2.0和移动终端设备的发展,社交网络日益普及,寻找社交网络中的领域专家已成为研究热点。微博是当今流行的社交网络,以新浪微博数据为例,首先按用户发布的微博主题将用户划分为各个领域,然后提出在各领域内计算微博社交网络用户权威值的模型。模型充分考虑了用户发布的微博数目、用户粉丝数以及粉丝评论、转发和提及用户等行为对用户权威值的影响,最终计算出用户权威值。实验结果证实了该领域专家发现模型的合理性与可行性。  相似文献   

10.
为弥补目前国内学者只做单一算法研究且语料单一的缺陷,使用Word2vec词向量模型结合支持向量机(SVM)、卷积神经网络(CNN)和长短期记忆网络(LSTM)3种不同分类算法,研究了不同中文文本分类问题,包括微博语料的多维细粒度情感分类、酒店评价的倾向性分析和新闻文本的主题分类。将3种分类模型在不同文本中的分类效果进行对比,结果显示这3种算法对于不同的中文分类效果各有不同:不同维度的词向量对准确率等评价指标影响很大;支持向量机模型更适合于细粒度的微博情感分类;卷积神经网络、长短期记忆网络算法更适合于噪声小、文本长且规范的新闻主题分类任务。分类粒度会对算法准确性产生影响,粒度越细、任务越复杂,算法准确性越低。  相似文献   

11.
海量数据给微博舆情实时监控预警带来了严峻的挑战,将Hadoop关键技术引入微博舆情分析研究领域,以探寻分布式环境下的高效率短文本数据查询与推理方法,以微博数据结构为基础,结合云计算Hadoop关键技术特性,提出了一种海量微博数据分析预警框架.HDFS为海量微博的数据提供了存储,而MapReduce为海量微博的数据提供快速运算.采用Map(映射)和Reduce(规约)规则,对微博用户关系和内容数据的大规模数据集进行并行运算,以实现并行化高效预处理、深度分析和舆情实时五级预警.为验证计算效率与Reduce任务数之间关系,对Reduce任务数进行实验,结果表明,在Map一定的情况下,随微博数据集的增大到2 GB后,多任务数Reduce执行时间相比少任务数Reduce大大缩短.  相似文献   

12.
介绍了数据挖掘技术和模型的概念,提出了基于决策树的数据挖掘分类模型构造方法,并结合银行业信贷业务特点,对数据挖掘在贷款分析中的应用进行探讨。  相似文献   

13.
基于模糊分类规则树的文本分类   总被引:2,自引:0,他引:2  
针对传统的基于关联规则的文本分类方法在分类文本时需要遍历分类器中的所有规则,分类效率非常低的问题,提出一种基于模糊分类规则树(FCR-tree)的文本分类方法.分类器中的规则以树的形式存储,由于树型结构避免了重复结点的存储,节省了存储空间.模糊分类关联规则与一般分类规则相比,不仅包含了词条信息,还包含了词条出现频度对应的模糊集,所以FCR-tree的构建过程及树的结构不同于一般规则树CR-tree.为降低构建及遍历FCR-tree的难度,采用了构造多棵k-FCR-tree的方法.在搜索规则树时,如果结点中的词条没在待分类文本中出现,则不需要再搜索该结点引导的子树,大大减少了需要匹配的规则的数量.实验表明该方法是可行的,与遍历分类器的分类方法相比,分类效率有了明显提高.  相似文献   

14.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

15.
自从2007年国内出现第一家微博网站以来,微博营销成为企业营销的一种新兴的方式。2013年是中国微博迅速发展的一年,中国微博用户总数逐渐趋近网民数,用户规模已基本稳定和成熟,越来越多的企业借助微博平台开展产品和品牌推广及扩大企业影响力等营销活动,微博营销呈现出良好的发展空间和前景。本文回顾微博的发展,分析当前企业微博营销存在的局限性,用成功案例探讨企业微博营销的可行策略,对促进微博营销的开展具有重要的应用价值和现实意义。  相似文献   

16.
本文分析了基于正区域的决策树生成算法的不足,针对这些不足,提出了基于正区域及其分类纯度的决策树算法。该方法计算简单,易于理解,并用实例说明了该方法的优越性。  相似文献   

17.
针对智能监控中行人行为难于识别的问题,提出了一种基于改进支持向量机的行人行为分类的解决方法.针对背景建模和前景提取精确度的难题,把视频中有活动的部分表示成一组时空兴趣点;针对行动方式具有无固定方式和模糊特点的问题,先采用模糊聚类求每类行为样本聚类中心,再加入决策树思想,构建一种支持向量机决策树多值分离器进行行为分类.在国际上通用行为KTH数据库进行了实验,获得较高的识别率.  相似文献   

18.
经典决策树算法不能处理树构建和分类过程中的不确定数据,针对这一局限,提出基于概率分布的方法,把决策树分类技术扩展到含有不确定数据的环境中。然后,针对软件外包评价中普遍存在着不确定数据,应用决策树分类方法,对软件外包公司进行客观评价。实验表明,本文提出的基于不确定数据的决策树分类算法能够实现对软件外包评价的定量研究。  相似文献   

19.
新浪微博是一个提供微型博客服务的类Twitter网站.用户可以通过网页、WAP页面、手机短信、彩信发布消息或上传图片.新浪微博拥有过亿的注册用户,其粉丝价值在不断攀升.通过对新浪微博框架、裂变式传播模式等特征和碎片化信息整合能力进行分析以后,剖析了新浪微博的营销价值.并在此基础上,系统分析企业利用新浪微博的营销策略.  相似文献   

20.
对于银行、P2P等金融机构而言,如何在扩大业务规模的同时,有效控制并合理防范信用风险尤为重要。基于LightGBM算法,根据借款申请人提供的相关个人信息,建立分类预测模型,对借款人是否会逾期、是否该发放贷款进行预测研究。实验结果表明,相较于普通决策树算法,LightGBM预测精度提升了40.8%,且具有较好的鲁棒性,可满足信用评估要求。基于LightGBM的信用评估模型不仅拥有更快的训练速度和更高的训练效率,同时还占用更少的内存,具有支持数据并行处理能力。利用该模型可对用户信用风险进行较为准确的预测,对贷款机构风险管理有重要参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号