首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
旅游突发事件自动分类能快速地为旅游产业链中的各行业提供决策依据,介绍文本分类技术中朴素贝叶斯分类方法的基本原理,利用Java语言调用开源的机器学习软件Weka相关算法,构建一个朴素贝叶斯分类器,实验数据表明,朴素贝叶斯分类器在旅游突发事件自动分类中有较好的性能。  相似文献   

2.
通过分析树扩张型朴素贝叶斯(TAN)分类器,提出了一种选定根节点方法,此方法基于概率论的观点,构造生成树时选择两依赖属性中个数较大的属性作为根节点.依此对TAN分类器的构造方法进行了改进(改进的分类器简称CRTAN),将该分类方法与朴素贝叶斯分类器和TAN分类器进行了实验比较.实验结果表明,此分类方法的分类性能要优于TAN分类器.  相似文献   

3.
朴素贝叶斯文本分类模型是一种简单而高效的文本分类模型,但是它的独立性假设属性使其无法表示现实世界属性之间的依赖关系,从而影响它的分类性能。这里提出一种改进的基于贝叶斯定理的文本分类模型——“树桩网络(Stump Network)”,并将该方法与朴素贝叶斯文本分类器和TAN(Tree Augmented Naive Bayes)文本分类器进行实验比较,结果表明,在大多数数据集上该文本分类方法具有较高的分类正确率。  相似文献   

4.
贝叶斯文本分类方法研究   总被引:1,自引:0,他引:1  
朴素贝叶斯分类器是当前流行的一种文本分类算法 ,它的简易性使其适合于处理属性个数较多的分类问题 ;TAN (TreeAugmentedNaiveBayes)综合了朴素贝叶斯的简易性以及贝叶斯网表示依赖关系的能力 ,使其能容纳属性间存在的某种依赖关系。通过实验比较朴素贝叶斯和TAN ,可以发现TAN方法具有较好的分类性能。  相似文献   

5.
朴素贝叶斯理论是一种典型机器学习技术,能够应用于文本分类中。运用朴素贝叶斯理论阐述了贝叶斯分类器的样本训练和分类计算的过程,构造了一个文本分类器。试验表明,朴素贝叶斯理论在文本分类中有较好的分类效果。  相似文献   

6.
目前,已经有100多种认知诊断模型被开发出来,其中大多是基于Q矩阵的。Q矩阵在认知诊断测量中发挥着重要作用。DINA模型和朴素贝叶斯网分类器是两种围绕Q矩阵构建的认知诊断模型,通过分析两种模型中Q矩阵的构建过程及Q矩阵对两种模型的影响,研究Q矩阵在认知诊断测量中的应用。  相似文献   

7.
针对Android平台下恶意软件侵扰问题,提出一种基于权限—敏感API特征的加权朴素贝叶斯分类算法的检测方案。首先对Android应用程序中的配置文件进行解析,然后利用Apktool工具对APK文件进行反编译,提取出权限—敏感API特征集,并通过信息增益算法和卡方检验算法过滤冗余数据,最后利用加权朴素贝叶斯分类算法的恶意软件检测模型进行分类判断。实验结果证明,该系统能有效提高分类器的效率和恶意软件的检测率。  相似文献   

8.
RSS是一种基于RDF/XML描述的全新的互联网信息获取方式。但目前,RSS文档的分类完全依赖于预先设定,对于适应用户多变的需求存在着明显的不足。朴素贝叶斯分类器是解决自然语言文本文档分类问题的最有效的方法之一。通过构造朴素贝叶斯学习器,用户可以构造出符合自己要求的RSS分类结构。实验结果表明,这种基于朴素贝叶斯方法的分类器。可以很好地实现对RSS文档的自动分类。  相似文献   

9.
贝叶斯分类器的应用   总被引:1,自引:0,他引:1  
贝叶斯决策理论是统计模式识别中的一个基本方法。依据贝叶斯决策理论设计的分类器具有最优的性能,即所实现的分类错误率或风险在所有可能的分类器中是最小的,因此经常被用来衡量其他分类器设计方法的优劣。贝叶斯决策是一个很有效的分类工具,但它仍然存在着一定的错误率和风险,因此还需进一步的改善和完善。  相似文献   

10.
传统图像特征提取具有较高维度缺陷,造成算法分类效率低、复杂度高、分类速度慢、计算开销大等问题。为此提出AAM算法,定位关键点提取人脸表情几何特征。将朴素贝叶斯分类器结合特征属性重要度调节高斯核函数,使用K近邻算法实现分类决策,提出一种WNBC-KNN分类方法,从降低数据维度和分类算法两方面优化人脸表情分类。在CK+数据和JAFFE数据集上实验,识别率分别达到90%和86%。与传统的朴素贝叶斯算法比较,改进后的算法识别率分别提高6%和30%。  相似文献   

11.
为了根据不同中风患者的康复情况制定相应的中风治疗标准,对基于大数据改进中风康复训练行为的识别进行了研究。首先,通过Kinect获取人体20个骨骼关节点的数据信息,然后提取关节点极坐标的位置信息,定义运动特征分类集合,完成朴素贝叶斯分类器设计。根据捕获的各种人群数据信息,在云服务器上的数据分析系统加以量化和分析后进行阈值计算。基于此,可对中风康复训练动作识别阈值进行偏差处理,从而设定不同的患者人群最合适的动作标准。  相似文献   

12.
面对当前日益竞争的市场环境,以客户消费为研究对象,以客户消费因子为关键点,提出了一种基于客户消费行为预测的模糊朴素贝叶斯方法。针对客户消费影响因子所呈现的连续及离散性,分别建立了相应的模糊表示方法,以此为基础,对客户消费行为预测建立了朴素贝叶斯方法,并用实例对提出的方法进行了分析说明。  相似文献   

13.
通过对Web数据的特点进行详细的分析,在基于传统的贝叶斯聚类算法基础上,采用网页标记形式来有效地弥补朴素贝叶斯算法的不足,并将改进的方法应用在文本分类中,是一种很好的改进思路。最后实验结果也表明,此方法能够有效地对文本进行分类。  相似文献   

14.
对数据挖掘技术在研究生信息库中的应用进行了初步分析探讨,目的是从海量的学生数据库中提取人们感兴趣的数据信息,并创建数据挖掘模型。运用朴素贝叶斯分类的方法,对所给数据进行分类和预测,并指出了其技术难点及构建算法,最后,通过一个实例给出了该算法对于预测数据进行分类的详细过程。  相似文献   

15.
基于朴素贝叶斯的学生信息分类预测研究   总被引:1,自引:0,他引:1  
为从学生数据信息中挖掘有价值的信息为高校教学管理、人才培养等提供决策支持,本文采用朴素贝叶斯分类的方法,对学生信息数据进行分类与预测。通过分类的详细工作过程,可知朴素贝叶斯算法是一种简单而高效的分类算法,虽然其条件独立性假设并不总符合客观实际,但在学生信息分类预测研究中还是取得了很好的效果。  相似文献   

16.
朴素贝叶斯分类算法应用于毕业生就业预测分析,关键是建立有效的分类模型.文章提出了一种有效分类模型的发现算法,并研究了该算法实施中的零值属性计数、缺失数据问题及解决方法,能有效解决毕业生就业预测的可靠性问题.  相似文献   

17.
结合目前从音频和歌词角度对歌曲情感分析的研究以及歌词文本独有特点,提出一种基于文本标题与位置权重相结合的歌词情感分析方法。该方法考虑到出现在不同位置的特征词权值对于歌词分类的影响程度,采用层次分析法计算文本标题、歌词文本前、中、后不同位置特征词的位置权重。通过朴素贝叶斯、最大熵模型、支持向量机等不同分类器的训练实现歌曲快乐、伤感、安静、激昂4种情感分类。实验表明,加入文本标题与位置权重后的最优F1值相比之前提升了4个百分点,证明了该方法在提升歌词情感分类性能方面的有效性。  相似文献   

18.
本文在探讨模式匹配算法的基础上,针对高校考生报到率不稳定的实际情况,利用模式匹配算法,结合朴素贝叶斯方法,对考生报到结果进行预测,能够为高校的招生宣传和教学管理等工作提供有价值的参考依据。  相似文献   

19.
为快速准确进行DDoS(DistributedDenialofService,分布式拒绝服务)攻击检测,提出在Hadoop环境下,基于朴素贝叶斯的DDoS攻击检测算法。该算法主要有3个阶段:确定被检测数据文件的TCPflag属性,作为朴素贝叶斯的训练和检测属性;利用训练原理,两次扫描正常和异常流量文件,得到正常和非正常网络状态下属性的先验概率和条件概率;扫描待检测数据集,计算两种状态下的后验概率,并比较后验概率的大小,以此判断是否会受到攻击。实验结果表明,该算法具有对缺失数据不敏感、实现简单的优点。  相似文献   

20.
垃圾短信过滤是文本分类的一种,将用户收到的短信分为正常短信和垃圾短信,从而实现对垃圾短信的屏蔽。在朴素贝叶斯分类算法的基础上进行改进,针对短信内容较短包含信息不足的特点,引入同义词集对短信中特征词进行扩展,降低同义特征词分散给分类带来的负面影响。同时针对垃圾短信自身包含的特殊信息,提出模式概念,采用模式概念替换具有相同模式的特征词,使垃圾短信的特征更加集中,增强分类算法对垃圾短信的鉴别能力,最后通过实验对朴素贝叶斯算法以及改进后算法的分类性能进行了分析,验证了改进后算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号