共查询到10条相似文献,搜索用时 15 毫秒
1.
基于模糊向量空间的文本分类方法 总被引:1,自引:0,他引:1
本文针对文本自动分类问题,提出了一种基于模糊向量空间模型和径向基函数网络的分类方法。网络由输入层、隐层和输出层组成。输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。 相似文献
2.
在文本自动分类中,目前有词频和文档频率统计这两种概率估算方法,采用的估算方法恰当与否会直接影响特征抽取的质量与分类的准确度。本文采用K最近邻算法实现中文文本分类器,在中文平衡与非平衡两种训练语料下进行了训练与分类实验,实验数据表明使用非平衡语料语料时,可以采用基于词频的概率估算方法,使用平衡语料语料时,采用基于文档频率的概率估算方法,能够有效地提取高质量的文本特征,从而提高分类的准确度。 相似文献
3.
4.
文章吸收词频原则、逆文档频率原则以及共词分析的思想,提出解决文档主题新颖度量化问题的4个原则,在此基础上定义带时间戳关键词逆文档频率、带时间戳关键词对逆文档频率、文档新颖度等3个概念,给出文档新颖度的计算公式,并对该公式的实用性与合理性进行实证研究.实验结果表明:文中提出的文档主题新颖度量化方法是科学的、合理的、可操作的,但是,不规范的标引词标引、关键词个数过少等现象对主题新颖度计量结果的准确性影响较大. 相似文献
5.
本文将边界序列的多尺度描述和傅里叶描述符结合起来,得到闭合边界的多尺度傅里叶描述符。该方法先将边界序列呈现到不同的尺度空间,然后进行傅里叶变换,得到了不同尺度空间的傅里叶描述符。分类实验表明,该方法提取的特征具有较好的分类特性。 相似文献
6.
7.
基于词片网格的语音文档主题分类,为了从网格(lattice)多候选中得到语音文档主题分类召回率更高,提出了在lattice音节网格上直接提取词片,并且在处理语音词片的同时,将非负矩阵分解方法引入语音文档主题的分类。该方法避免了语音识别率低所导致的语音文档主题分类准确性的降低。实验结果表明:当N-best的召回率为91.66%时,基于混淆网络的关键词检出系统的召回率为96.67%,当SVD的F1值为83.38%,NMF的F1值为96.944%。 相似文献
8.
将随机森林融合支持向量机(RF-SVM)模型引入个人信用评估问题中,利用随机森林的特征选择算法,对实验样本进行属性特征选择,将得到的结果作为输入变量构建模型,以获得更高的预测精度。通过对大量SVM分类模型研究,发现传统SVM模型中无法有效筛选预测指标。通过对实验样本实证研究,并验证该模型的预测结果可信度,将其与单独的全变量SVM模型结果比对,结果证明,该方法能获得较好的预测效果。 相似文献
9.
基于目标宽度特征的脉间跳频雷达距离精确成像 总被引:2,自引:0,他引:2
根据雷达目标的宽度特征 ,提出了目标检测窗口内雷达信号的逆Chirp z变换局部成像处理方法 .利用有限的输入数据长度 ,有效提高目标局部距离像的采样分辨率 ,获得更精确的距离像 .与传统的数据长度补零逆傅里叶变换方法相比 ,在相同的采样分辨率条件下 ,该方法能有效减小计算量 .仿真实验结果与理论分析相符合 ,证明了该方法的有效性 . 相似文献