首页 | 本学科首页   官方微博 | 高级检索  
     检索      

用稀疏贝叶斯概率模型做文本分类
引用本文:燕荣江.用稀疏贝叶斯概率模型做文本分类[J].环球赛鸽科技,2015(19).
作者姓名:燕荣江
作者单位:辽宁师范大学数学学院,辽宁大连,116029
摘    要:如今,当处理大量数据集的协变量时,相比小样本量的一个常见问题是:估计与每个协变量相关联的参数。当协变量的数量远远超过样本的数量,参数估计变得非常困难。在这项研究中,我们开发了一个稀疏的Probit贝叶斯模型(SPBM)的基础上吉布斯抽样,其利用双指数函数之前诱导收缩,并减少在模型协变量的数目。使用6个领域,如数学,在维基百科已下载的方法中进行评估。我们通过计算并根据执行训练和测试组的分类的阈值作为决策规则。利用遍布全球50个运行平均灵敏度和特异性我们的模型的表现相比,支持向量机(SVM)。该SPBM实现了高分类精度和几乎所有的分析领域优于SVM。

关 键 词:稀疏贝叶斯  参数估计  广义线性模型  机器学习  文本分类
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号