用稀疏贝叶斯概率模型做文本分类 |
| |
引用本文: | 燕荣江.用稀疏贝叶斯概率模型做文本分类[J].环球赛鸽科技,2015(19). |
| |
作者姓名: | 燕荣江 |
| |
作者单位: | 辽宁师范大学数学学院,辽宁大连,116029 |
| |
摘 要: | 如今,当处理大量数据集的协变量时,相比小样本量的一个常见问题是:估计与每个协变量相关联的参数。当协变量的数量远远超过样本的数量,参数估计变得非常困难。在这项研究中,我们开发了一个稀疏的Probit贝叶斯模型(SPBM)的基础上吉布斯抽样,其利用双指数函数之前诱导收缩,并减少在模型协变量的数目。使用6个领域,如数学,在维基百科已下载的方法中进行评估。我们通过计算并根据执行训练和测试组的分类的阈值作为决策规则。利用遍布全球50个运行平均灵敏度和特异性我们的模型的表现相比,支持向量机(SVM)。该SPBM实现了高分类精度和几乎所有的分析领域优于SVM。
|
关 键 词: | 稀疏贝叶斯 参数估计 广义线性模型 机器学习 文本分类 |
本文献已被 万方数据 等数据库收录! |
|