首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
文本自动分类研究进展   总被引:1,自引:0,他引:1  
通过介绍文本分类的过程及其关键技术,讨论了文本表示、分类算法、分类器性能评价原理和方法,最后对文本分类今后的发展进行了展望。  相似文献   

2.
对基于中文的Web文本分类技术进行了研究,介绍了web文本分类的基本过程和Web文本预处理及文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法KNN。最后通过实验测试了使用KNN算法的中文Web文本分类技术的效果。  相似文献   

3.
文本分类是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程,本文对、NET文本分类检索中所涉及的关键技术贝叶斯网分类方法,进行了研究和探讨,并且提出了基于向量空间的.NET文本分类检索的结构,并给出了会估计方法和实验结果。  相似文献   

4.
通过介绍文本分类的过程及其关键技术,讨论了文本表示、分类算法、分类器性能评价原理和方法;最后,指出了当前文本分类过程中存在的问题,并对今后的发展进行了展望.  相似文献   

5.
朴素贝叶斯理论是一种典型机器学习技术,能够应用于文本分类中。运用朴素贝叶斯理论阐述了贝叶斯分类器的样本训练和分类计算的过程,构造了一个文本分类器。试验表明,朴素贝叶斯理论在文本分类中有较好的分类效果。  相似文献   

6.
受城市快速发展及气候变化等因素影响,耕地面积和产量逐年波动,准确、快速提取耕地信息,对精确预测作物产量、提高作物管理、优化作物种植结构有重要意义。采用非监督分类、监督分类以及面向对象分类的方法提取Landsat8 OLI影像数据,其中非监督分类运用ISODATA算法,监督分类选择最大似然法,面向对象分类则采用基于样本的面向对象分类方法和基于规则的面向对象分类方法。经实验分析,基于样本的面向对象的提取方法避免了“椒盐现象”且精度最高,总体精度达93.0175%,在进行耕地信息提取时能得到较好的结果。  相似文献   

7.
土地利用的分类精度对土地资源开发有很大影响。选取雄安新区2017年5月12日的高分一号影像作为试验数据,分别运用监督分类方法中的最大似然分类器和面向对象的分类方法对影像进行土地利用分类,得到研究区域的土地利用分类情况。面向对象分类方法的Kappa系数和总体分类精度都高于最大似然分类器的分类结果,分别达到了0.968 8和97.500 0%。实验结果表明:针对高分一号影像,对比最大似然分类器,使用面向对象的分类能提高研究区域的土地利用分类精度。面向对象分类结果可以为雄安新区的土地利用分类提供参考。  相似文献   

8.
提出了一种基于投影寻踪改进KNN中文文本分类方法,与现有的中文文本分类算法相比,该方法具有较高的计算效率。给出了具体实现过程并将其用于文本分类中,实验证明了该算法用于文本分类的有效性及其高效率。  相似文献   

9.
吴波 《鸡西大学学报》2009,9(5):151-152
介绍了网络环境下文本自动分类的过程,针对文本信息自动分类的研究方法,分析了当前我国文本信息自动分类研究中存在的问题,提出了其未来发展的趋势。  相似文献   

10.
以QuickBird高分辨率遥感影像作为信息源,用ENVI对影像进行基于像素的分类和面向对象的分类,对分类结果进行目视和精度比较.结果表明,面向对象的分类方法可以有效提高高分辨率遥感影像分类精度.  相似文献   

11.
周靖 《茂名学院学报》2011,21(4):56-58,66
在文本分类过程中,为解决传统支持向量机(SVM)多类分类的不可分区域问题及提高分类性能,提出了一种改进的偏二叉树多类SVM算法。算法依据根据样本的分布情况计算训练集文本特征参数的信息熵,并将熵值结合欧式距离公式以确定各类文本间的相似性测度;以相似性测度作为偏二叉树结构的分类走向,对训练集进行学习,构建各个二类子SVM分类器。实验结果表明,该算法具有较高的分类性能,能更好地解决实际文本分类过程中的问题。  相似文献   

12.
本文从面向对象的基本思想入手,分析了面向对象程序设计的思路,面向对象在C++Java、C#中的不同应用。同时阐述了面向对象方法中的抽象、分类、封装、多态性等基本原则。  相似文献   

13.
文本分类是文本数据挖掘领域的重要技术之一。从分类算法对文本语义信息的利用程度这一角度出发,将文本分类划分为基于词形的算法和基于语义的算法两类,对每类算法进行了描述,并对当今文本数据的多样性及文本分类算法改进的可选方向进行了研究。  相似文献   

14.
以包头市白云鄂博矿区为试验区,以Landsat-8卫星影像为数据源,分别采用非监督分类、监督分类两种传统的分类方法与面向对象分类方法对遥感影像进行分类提取,并对三种方法的分类结果进行定性和定量比较。结果表明:传统的分类方法得到的分类图像连续性较差,很多点状分布的地物与实际地物不符合;而面向对象分类方法得到的图像各类地物之间边界明显,与实际的地物分布相似度高,更适合于矿区的空间信息提取工作。  相似文献   

15.
中文文本分类是对中文按类别来进行分类。基于交叉覆盖算法的文本分类运用交叉覆盖算法作为分类器,能够实现对中文文本的分类。通过它和SVM(Support Vector Machine)分类器的对比实验,说明了交叉覆盖算法,相比于SVM分类器对中文文本分类效果更好。  相似文献   

16.
选取唐山南湖作为研究对象,分别采用面向对象分类法与面向像元分类法对研究区进行遥感信息提取,得到不同的分类结果。实验证明,在南湖遥感影像的信息提取中,采用面向对象分类法总体精度(91.3%)要远大于面向像元法的总体精度(72.1%),因此,面向对象分类法具有明显优势,对于将面向对象分类方法应用于其它领域的遥感信息提取能够提供一定的借鉴意义。  相似文献   

17.
KNN算法是文本分类技术中比较常用的算法。但是,当训练集容量较大时,KNN算法分类的效率大大降低。在对中文短信文本的分类时,结合中文短信文本的特点,给出了先由LAS算法进行降维,然后利用KNN算法进行分类的算法。实验结果表明,该算法提高了中文短信文本的分类质量和分类速度。  相似文献   

18.
文本分类在自然语言分类中起着重要作用,将决策树ID3算法应用与文本分类,对数字图书馆的部分文本信息分类,提出一个基于ID3决策树的文本分类算法,取得了良好的实验结果。  相似文献   

19.
文献查阅系统能够将检索出来的数据库记录文本以两种方式打印出来,即全文打印和局部文本的屏幕截取打印。在技术上采用面向对象程序设计方法,使用了系统内存变量和置键盘缓冲区命令,使用户操作极为简便。  相似文献   

20.
乔良 《教育技术导刊》2009,8(4):160-161
文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展,指出了文本挖掘在信息检索中的作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号