期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

卢雪燕《广西大学梧州分校学报》2004,(4)

文本分类是情报检索的基础性工作,它的任务是在给定的分类体系下,根据分类的文本所描述的内容,来确定该文本所属的类别,从而提高信息检索的速度和准确度。本文从实用的角度出发,以具有确定分类标准的关键词分类为应用背景,模仿人工分类的思想,采用一种较简单的通过给主、次关键词分别赋予不同的权重进行文献分类的方法,构建了一个文本分类的实验系统,该系统简化了文本自动分类的繁杂技术,克服了人工分类的不足,可用于管理计算机科学专业的毕业生论文。实验表明,此系统得到了较高的分类准确率。相似文献

2.

基于关键词的文献分类

卢雪燕《梧州学院学报》2004,14(4):69-74

文本分类是情报检索的基础性工作,它的任务是在给定的分类体系下,根据分类的文本所描述的内容,来确定该文本所属的类别,从而提高信息检索的速度和准确度.本文从实用的角度出发,以具有确定分类标准的关键词分类为应用背景,模仿人工分类的思想,采用一种较简单的通过给主、次关键词分别赋予不同的权重进行文献分类的方法,构建了一个文本分类的实验系统.该系统简化了文本自动分类的繁杂技术,克服了人工分类的不足,可用于管理计算机科学专业的毕业生论文.实验表明,此系统得到了较高的分类准确率. 相似文献

3.

网络环境下文本自动分类方法研究综述

吴波《鸡西大学学报》2009,9(5):151-152

介绍了网络环境下文本自动分类的过程,针对文本信息自动分类的研究方法,分析了当前我国文本信息自动分类研究中存在的问题,提出了其未来发展的趋势。相似文献

4.

贝叶斯网在.NET超文本分类检索中的应用

马旭《宁夏师范学院学报》2003,24(6):47-51

文本分类是指在给定的分类体系下，根据文本的内容自动判别文本类别的过程，本文对、NET文本分类检索中所涉及的关键技术贝叶斯网分类方法，进行了研究和探讨，并且提出了基于向量空间的．NET文本分类检索的结构，并给出了会估计方法和实验结果。相似文献

5.

一种改进的基于信噪比的文本分类方法

朱志宁万小容黄青松《宁波广播电视大学学报》2005,3(4):84-86

改进了传统的信噪比文本分类方法。提出了一种改进的基于信噪比的文本分类方法。它考虑了禁用词的排除、近义词和同义词的合并以及特征项在文本中不同位置对文章分类的贡献不同。相似文献

6.

自动分类技术调查与研究

丁凝《现代企业教育》2012,(7):157-158

自动分类技术是一种基于知识管理的文本分类技术,它能依据文本的语义将大量的文本自动分门别类,从而更好地帮助人们把握文本信息。本文首先介绍了自动分类技术的背景和历史发展,然后着重介绍了目前应用最广泛的几种自动分类方法;其后,结合实际研究课题介绍了基于仿人思想的自动分类方法,并对自动分类技术未来发展的方向作了展望。相似文献

7.

基于模糊分类规则树的文本分类 总被引：2，自引：0，他引：2

郭玉琴袁方刘海博《东南大学学报》2008,24(3):339-342

针对传统的基于关联规则的文本分类方法在分类文本时需要遍历分类器中的所有规则,分类效率非常低的问题,提出一种基于模糊分类规则树（FCR-tree）的文本分类方法.分类器中的规则以树的形式存储,由于树型结构避免了重复结点的存储,节省了存储空间.模糊分类关联规则与一般分类规则相比,不仅包含了词条信息,还包含了词条出现频度对应的模糊集,所以FCR-tree的构建过程及树的结构不同于一般规则树CR-tree.为降低构建及遍历FCR-tree的难度,采用了构造多棵k-FCR-tree的方法.在搜索规则树时,如果结点中的词条没在待分类文本中出现,则不需要再搜索该结点引导的子树,大大减少了需要匹配的规则的数量.实验表明该方法是可行的,与遍历分类器的分类方法相比,分类效率有了明显提高. 相似文献

8.

决策树ID3分类算法在文本分类中的应用研究

李楠杨彬彬《大连大学学报》2009,30(6):68-71

文本分类在自然语言分类中起着重要作用,将决策树ID3算法应用与文本分类,对数字图书馆的部分文本信息分类,提出一个基于ID3决策树的文本分类算法,取得了良好的实验结果。相似文献

9.

使用KNN算法的中文Web文本分类技术研究

曹勇吴顺祥《教育技术导刊》2007,(1)

对基于中文的Web文本分类技术进行了研究,介绍了web文本分类的基本过程和Web文本预处理及文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法KNN。最后通过实验测试了使用KNN算法的中文Web文本分类技术的效果。相似文献

10.

文本分类算法研究

赵岩周斌陈儒华《教育技术导刊》2013,12(10):54-56

文本分类是文本数据挖掘领域的重要技术之一。从分类算法对文本语义信息的利用程度这一角度出发,将文本分类划分为基于词形的算法和基于语义的算法两类,对每类算法进行了描述,并对当今文本数据的多样性及文本分类算法改进的可选方向进行了研究。相似文献

11.

文本分类技术研究

台德艺谢飞胡学钢《合肥联合大学学报》2007,17(3):61-64

通过介绍文本分类的过程及其关键技术，讨论了文本表示、分类算法、分类器性能评价原理和方法；最后，指出了当前文本分类过程中存在的问题，并对今后的发展进行了展望．相似文献

12.

基于KNN和LAS的短信文本语义分类研究

王海云刘金岭杨金柱《教育技术导刊》2009,8(7):78-79

KNN算法是文本分类技术中比较常用的算法。但是,当训练集容量较大时,KNN算法分类的效率大大降低。在对中文短信文本的分类时,结合中文短信文本的特点,给出了先由LAS算法进行降维,然后利用KNN算法进行分类的算法。实验结果表明,该算法提高了中文短信文本的分类质量和分类速度。相似文献

13.

改进偏二叉树多类SVM的文本分类

周靖《茂名学院学报》2011,21(4):56-58,66

在文本分类过程中,为解决传统支持向量机（SVM）多类分类的不可分区域问题及提高分类性能,提出了一种改进的偏二叉树多类SVM算法。算法依据根据样本的分布情况计算训练集文本特征参数的信息熵,并将熵值结合欧式距离公式以确定各类文本间的相似性测度;以相似性测度作为偏二叉树结构的分类走向,对训练集进行学习,构建各个二类子SVM分类器。实验结果表明,该算法具有较高的分类性能,能更好地解决实际文本分类过程中的问题。相似文献

14.

基于突发事件新闻网页的文本分类方法研究

王昌厚罗永莲《长治学院学报》2006,23(2):34-35

从对突发事件新闻结构特点的分析出发,进行了特定领域文本分类方法的探讨。其中根据文本特点,摒除信息量小的部分,将标题、首部等作为标引源,提高了分类速度。在特征抽取中综合考虑字与词对于文本分类的作用,提高了分类精度。相似文献

15.

基于文本分类的搜索引擎的设计与实现

宋晔张敏《教育技术导刊》2012,11(8):87-88

为了提高搜索引擎的查准率和查全率,将文本分类技术应用于搜索引擎中,设计与实现了一种基于文本分类的搜索引擎系统。在此基础上,提出了一种基于带权值的分类主题词表的关键词匹配的分类算法。相似文献

16.

文本分类技术在网络基础教学资源中的应用

陆红蕾《漯河职业技术学院学报》2012,11(2):50-52

文本分类是实现网络资源快速分类的一项关键技术。通过对文本分类、网络教学资源、基础教学网络环境进行分析,针对网络教学资源的特点,提出了一个Rocchio算法的网页自动分类模型,并在基础教学网络环境下进行了仿真实验。实验结果表明,该模型能获得较好的分类效果,适合于基础教学资源的分类。相似文献

17.

朴素贝叶斯在文本分类中的应用

熊志斌刘冬《教育技术导刊》2013,12(2):49-51

朴素贝叶斯理论是一种典型机器学习技术,能够应用于文本分类中。运用朴素贝叶斯理论阐述了贝叶斯分类器的样本训练和分类计算的过程,构造了一个文本分类器。试验表明,朴素贝叶斯理论在文本分类中有较好的分类效果。相似文献

18.

一种增量式的半监督文本分类算法

曾安平《宜宾学院学报》2011,(6):71-74

传统的文本分类算法存在:忽视训练集的相对固定特征与新文献主题不断交化之间的矛盾,类间没有层次关系从而导致分类不太准确、效率低等问题,对此设计并实现了一种增量式的半监督文本分类算法-IC-Rocchio算法,实验结果表明,该算法能有效地改进这两方面的问题. 相似文献

19.

新课标文体分类不科学

《教学与管理》2014,(34)

高中语文课程标准及据此编订的语文考试大纲认为文体分为记叙文、说明文、议论文等不科学,将文体分为论述类文本、文学类文本、实用类文本。然而,这三类文本的分类,划分标准不统一,内涵混乱,外延不清。因此,新课标文体分类不科学。相似文献

20.

一种改进的KNN中文文本分类算法

杜琳娜闫光辉杨霞霞刘利松《教育技术导刊》2010,9(2):51-53

提出了一种基于投影寻踪改进KNN中文文本分类方法,与现有的中文文本分类算法相比,该方法具有较高的计算效率。给出了具体实现过程并将其用于文本分类中,实验证明了该算法用于文本分类的有效性及其高效率。相似文献