共查询到20条相似文献,搜索用时 140 毫秒
1.
在文本自动分类中,目前有词频和文档频率统计这两种概率估算方法,采用的估算方法恰当与否会直接影响特征抽取的质量与分类的准确度。本文采用K最近邻算法实现中文文本分类器,在中文平衡与非平衡两种训练语料下进行了训练与分类实验,实验数据表明使用非平衡语料语料时,可以采用基于词频的概率估算方法,使用平衡语料语料时,采用基于文档频率的概率估算方法,能够有效地提取高质量的文本特征,从而提高分类的准确度。 相似文献
2.
基于量子自组织网络的Web文本自动分类方法 总被引:3,自引:0,他引:3
针对Web信息挖掘中的文本自动分类问题,提出了一种基于模糊特征向量和量子自组织特征映射网络的分类方法.该方法在特征提取时充分考虑了特征项在文档中的Web位置信息,构造出模糊特征向量,使自动分类原则更接近手工分类方法. 相似文献
3.
针对高校图书馆读者借阅文献类型、流量实时监测问题,提出了一种基于数据挖掘中聚类算法的自动分类和统计分析方法。以该方法开发出流量分类统计和预报应用系统,在大庆石油学院图书馆进行了实际应用,结果证明了该算法是有效和可靠的。 相似文献
4.
基于Auto CAD平台二次开发,高效、准确地在数字化地形图中自动标注图斑号,并根据不同地类把各图斑分色填充图案,形成彩色分类图,同时把各图斑所在图幅号与图斑号相关联,自动生成图斑面积表和分类面积统计表等属性表,快速准确地完成库区淹没调查中图斑面积的统计与分类工作。 相似文献
5.
提出了一种基于机器学习的Web文本自动分类的架构,提出了中文Web文档自动分类的主要技术问题。介绍了中文Web文档自动分类工具的总体设计,它主要包括网络蜘蛛、中文分词、特征选取和贝叶斯分类器等功能模块。最后对中文Web文档自动分类器进行了实验。 相似文献
6.
基于TM遥感影像的玉米地专题信息自动提取 总被引:1,自引:1,他引:1
TM遥感影像中专题信息的自动提取是目前遥感界的研究热点,也已成为遥感信息生产流程中的瓶颈环节。本文分析了耕地专题信息自动提取的研究现状,选取了吉林中部和辽宁省东北部作为研究区,采用监督分类的方法对研究区TM遥感影像进行分类,提取了玉米地专题信息,玉米地信息的提取精度为85.5%。根据遥感影像目视解译的原理,提出了基于多特征空间的遥感影像专题信息自动提取的研究方法,通过对多特征空间的数学描述和计算机处理实现
遥感专题信息的自动提取。采用多特征空间的方法将玉米地信息分为光谱特征空间、形状特征空间、区域地学特征空间和干扰特征空间,应用ERDAS8.5遥感图像处理软件中的knowledge engineer模块的开发功能,设计了基于多特征空间的玉米地专题信息自动提取的专家库,使用专家库对玉米地信息进行了自动提取,提取精度为92.9%。从基于多特征空间的分类结果与监督分类结果的比较发现,基于多特征空间的自动提取方法可以提高专题信息的提取效率,对未来实现遥感影像的智能解译是一种研究方法的探索。 相似文献
7.
《科技通报》2016,(9)
为了提高利用医学影像技术对肝包虫病进行诊断的效率和准确性,有必要对基于影像的病症自动分类方法进行研究。根据不同类型肝包虫病CT影像特征,提出一种结合纹理特征提取和稀疏编码的肝包虫CT图像分类方法。首先,利用图像分割算法从腹部CT图像中提取肝包虫病灶区;其次,结合尺度不变特征转换(SIFT)和多尺度局部二值模式(LBP)对病灶区进行纹理分析,并采用稀疏编码技术对局部纹理特征编码;然后,应用多尺度最大池化法整合局部编码特征得到描述整幅图像的特征向量;最后,根据病灶图像的特征表示,通过线性支持向量机(SVM)完成对肝包虫图像的自动分类。在对比实验中,与基于Gabor滤波分类方法和基于多特征融合分类方法相比,所提方法总的平均分类准确率分别提高了24.97%和20.53%。实验结果表明,该方法提取的特征具有高的类区分度,能有效实现肝包虫CT图像的自动分类。 相似文献
8.
通过对农业网页的HTML结构和特征研究,叙述基于文本内容的农业网页信息抽取和分类实验研究过程。实验中利用DOM结构对农业网页信息进行信息抽取和预处理,并根据文本的内容自动计算文本类别属性,得到特征词,通过总结样本文档的特征,对遇到的新文档进行自动分类。实验结果表明,本文信息提取的时间复杂度比较小、精确度高,提高了分类的正确率。 相似文献
9.
基于模糊向量空间的文本分类方法 总被引:1,自引:0,他引:1
本文针对文本自动分类问题,提出了一种基于模糊向量空间模型和径向基函数网络的分类方法。网络由输入层、隐层和输出层组成。输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。 相似文献
10.
针对信息挖掘中的网页自动分类问题,提出了一种基于向量空间模型和并联BP网络的分类方法。该网络由并行连接的多个子网络组成,每个子网络负责一类模式特征的提取,多个子网并行处理所有模式,将分类结果在总输出层表现出来。以因特网上旅游网页分类为例验证了该方法的有效性。 相似文献
11.
12.
基于词频的中文文本分类研究 总被引:1,自引:0,他引:1
本文对中文文本分类系统的设计和实现进行了阐述,对分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细的介绍。将基于词频统计的方法应用于文本分类。并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方法,在无词表的情况下,通过统计构造单字和二字词表,对文本进行分类,并取得不错的效果。 相似文献
13.
我国中医药产业发展迅速,运用数据库技术分析中医药产业非常重要。本文论述了中医药专业数据库教学的必要性和紧迫性,并以VisualFoxPro为例就如何提高数据库教学效果,使学生全面系统掌握数据库知识进行了论述。 相似文献
14.
论文影响力与变异视角的科学家学术影响研究 《科学学研究》2017,35(5):676-680
以77位中科院生物医学院士和82位诺贝尔生理学或医学奖获得者为研究对象,运用论文影响力平均水平与高水平的二维分区,以及论文影响力水平与变异程度的二维分区对科学家进行不同角度的分型,展示了分区法在科研管理中的应用价值。结果表明,中科院生物医学院士若想整体进阶到诺贝尔奖层级,其论文影响力需要扩大e2倍;已有少数几位院士显示出诺贝尔奖级科学家的影响力。 相似文献
15.
结合我国中药产业现状,分析网络效应对中药产业标准发展的影响作用。然后从网络效应的临界容量角度指出,中药产业标准发展应注重标准的制定与推广。 相似文献
16.
17.
中医药产业化的主要问题与对策 总被引:4,自引:1,他引:4
规模化、标准化和规范化是产业化的三个特点。中医药行业正处在从传统生产方式向产业化生产方式的转变之中,存在诸多影响其发展的因素。本文就其中最主要的问题进行了深入而系统的讨论,并提出相应对策。认为中医药产业化是其现代化的标志和驱动器,是巨大的系统工程,涉及中医药领域的方方面面,可能引发一场具有远大经济和文化前景的新产业革命。 相似文献
18.
当前,我国高度重视中医药文化在海外的传播与推广,已将其上升为国家战略。中日两国的中医药文化交流历史悠久,在新形势下有效培养我国高等中医药院校日语人才,提高其对外传播中医文化的能力,对进一步推动两国中医药交流合作和中医药的传承创新有着重要的意义。本文运用SWOT分析法研究我国高等中医药院校日语人才培养的内部优势、外部机遇、内部劣势、外部威胁,探讨提高高等中医院校日语人才中医对外传播能力的有效策略。 相似文献
19.