首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于模糊向量空间的文本分类方法   总被引:1,自引:0,他引:1  
郑凤萍  刘春雨 《情报科学》2007,25(4):588-591
本文针对文本自动分类问题,提出了一种基于模糊向量空间模型和径向基函数网络的分类方法。网络由输入层、隐层和输出层组成。输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。  相似文献   

2.
在文本自动分类中,目前有词频和文档频率统计这两种概率估算方法,采用的估算方法恰当与否会直接影响特征抽取的质量与分类的准确度。本文采用K最近邻算法实现中文文本分类器,在中文平衡与非平衡两种训练语料下进行了训练与分类实验,实验数据表明使用非平衡语料语料时,可以采用基于词频的概率估算方法,使用平衡语料语料时,采用基于文档频率的概率估算方法,能够有效地提取高质量的文本特征,从而提高分类的准确度。  相似文献   

3.
基于改进VSM的Web文本分类方法   总被引:2,自引:0,他引:2  
Web文本自动分类技术是Web文本挖掘的关键技术之一.针对Web文档中不同标签中的文本具有不同的表达文档内容的能力,提出了改进的特征项加权计算方法.根据特征项在文档中的位置和出现频率计算其权值,并给出了具体的Web文本分类算法和评测方法.经实验验证,改进后系统的微平均查准率均大于0.8,分类性能明显好于改进前.  相似文献   

4.
文章吸收词频原则、逆文档频率原则以及共词分析的思想,提出解决文档主题新颖度量化问题的4个原则,在此基础上定义带时间戳关键词逆文档频率、带时间戳关键词对逆文档频率、文档新颖度等3个概念,给出文档新颖度的计算公式,并对该公式的实用性与合理性进行实证研究.实验结果表明:文中提出的文档主题新颖度量化方法是科学的、合理的、可操作的,但是,不规范的标引词标引、关键词个数过少等现象对主题新颖度计量结果的准确性影响较大.  相似文献   

5.
鲁晋  沙莎 《科技广场》2010,(3):80-82
本文将边界序列的多尺度描述和傅里叶描述符结合起来,得到闭合边界的多尺度傅里叶描述符。该方法先将边界序列呈现到不同的尺度空间,然后进行傅里叶变换,得到了不同尺度空间的傅里叶描述符。分类实验表明,该方法提取的特征具有较好的分类特性。  相似文献   

6.
基于词片网格的语音文档主题分类,为了从网格(lattice)多候选中得到语音文档主题分类召回率更高,提出了在lattice音节网格上直接提取词片,并且在处理语音词片的同时,将非负矩阵分解方法引入语音文档主题的分类。该方法避免了语音识别率低所导致的语音文档主题分类准确性的降低。实验结果表明:当N-best的召回率为91.66%时,基于混淆网络的关键词检出系统的召回率为96.67%,当SVD的F1值为83.38%,NMF的F1值为96.944%。  相似文献   

7.
陈晶 《大众科技》2010,(1):55-56
基于词片网格的语音文档主题分类,为了从网格(lattice)多候选中得到语音文档主题分类召回率更高,提出了在lattice音节网格上直接提取词片,并且在处理语音词片的同时,将非负矩阵分解方法引入语音文档主题的分类。该方法避免了语音识别率低所导致的语音文档主题分类准确性的降低。实验结果表明:当N-best的召回率为91.66%时,基于混淆网络的关键词检出系统的召回率为96.67%,当SVD的F1值为83.38%,NMF的F1值为96.944%。  相似文献   

8.
将随机森林融合支持向量机(RF-SVM)模型引入个人信用评估问题中,利用随机森林的特征选择算法,对实验样本进行属性特征选择,将得到的结果作为输入变量构建模型,以获得更高的预测精度。通过对大量SVM分类模型研究,发现传统SVM模型中无法有效筛选预测指标。通过对实验样本实证研究,并验证该模型的预测结果可信度,将其与单独的全变量SVM模型结果比对,结果证明,该方法能获得较好的预测效果。  相似文献   

9.
基于目标宽度特征的脉间跳频雷达距离精确成像   总被引:2,自引:0,他引:2  
根据雷达目标的宽度特征 ,提出了目标检测窗口内雷达信号的逆Chirp z变换局部成像处理方法 .利用有限的输入数据长度 ,有效提高目标局部距离像的采样分辨率 ,获得更精确的距离像 .与传统的数据长度补零逆傅里叶变换方法相比 ,在相同的采样分辨率条件下 ,该方法能有效减小计算量 .仿真实验结果与理论分析相符合 ,证明了该方法的有效性 .  相似文献   

10.
在图像分类和识别技术中,针对图像特征的提取这一重要问题,文章实现了用三种不变矩对图像目标提取特征并进行分类的方法,该方法分别提取目标的区域中心矩、区域中心不变矩和径向矩作为特征矢量,并与区域协特征方差算子进行图像分类比较分析。将特征用支持向量机的方法进行分类器的训练,再对目标进行分类。实验结果表明,区域径向矩算子运用在车辆目标分类中具有较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号