共查询到20条相似文献,搜索用时 15 毫秒
1.
自动文本分类技术研究 总被引:1,自引:0,他引:1
文本分类是数据挖掘的重要内容之一,在很多领域经常需要对文本信息进行处理、抽取、分类。通过分析了文本分类过程中涉及的文本表示、特征抽取、分类等方法,指出文本分类的基本特点。 相似文献
2.
网络文本分类是数据挖掘技术的重要组成部分,是从互联网中获取有效信息资源的重要方式之一.本文论述了网络文本分类及其技术,通过对具有主题的大量网络文本的有效分析和挖掘,使网络文本分类技术在自主网络信息定制和自动信息获取中得到更加广泛地应用研究. 相似文献
3.
4.
为了能在海量的文本中及时准确地获得有效的知识和信息,文章表示技术以及文本自动分类技术受到了广泛的关注。文章介绍了文本分类的过程和相关的技术,利用向量空间模型构建文本表示模型,介绍了常用的文本分类算法,由于传统类中心分类算法训练文档分散,不能准确的表示各类别的中心向量,提出了优化算法,从而提高了分类准确度。 相似文献
5.
通过对农业网页的HTML结构和特征研究,叙述基于文本内容的农业网页信息抽取和分类实验研究过程。实验中利用DOM结构对农业网页信息进行信息抽取和预处理,并根据文本的内容自动计算文本类别属性,得到特征词,通过总结样本文档的特征,对遇到的新文档进行自动分类。实验结果表明,本文信息提取的时间复杂度比较小、精确度高,提高了分类的正确率。 相似文献
6.
文本分类技术在信息过滤和信息检索中有着重要应用。文本表示技术是文本分类中的首要任务,特征选择技术又是文本表示中的杖心技术.对分类效果起着至关重要的作用。本文介绍了文本表示和特征选择技术的发展,并在详细分析目前各种文本表示和特征选择的方法和技术特点基础上,比较了各种方法的适用性和优缺点.最后总结出了文本表示和特征选择技术研究的方向和目标。 相似文献
7.
文本自动分类方法是指在给定的分类体系下,根据文本的内容自动判别类型的过程。它是当今信息搜索领域的重要研究方向。本文介绍了文本自动分类的重要作用及其关键技术。 相似文献
8.
以云制造平台的实际应用为目标,提出了面向文本信息分类的云制造平台。作为云制造平台的重要组成部分,文本信息的分类将对整个云制造平台的实际应用起到重要的作用。本文探讨了文本分类的结构体系,应用PHP语言构建了云制造平台的雏形并实现了初步的文本信息分类、发布、储存的功能;设计构建了与云制造平台连接的MySQL数据库,为云制造平台其他模块的研究和开发提供了基础和思路。 相似文献
9.
自动文本分类方法是文本分类中非常重要的一种分类方法,本文着重从模型与方法的角度进行探讨。首先给出了一个自动文本分类的形式化定义,然后提出了自动文本分类的流程模型。接着,对流程中的四个部分进行具体讨论。自动文本分类的应用非常广泛,为了叙述方便,以商务数据为例进行讨论,并且选择实例作为典型案例对自动文本分类后的可视化进行分析和具体研究。 相似文献
10.
文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程.文章将对基于贝叶斯算法的文本分类技术进行论述. 相似文献
11.
旨在研究文本自动分类在搜索引擎中的应用。它不仅可以提高搜索引擎的查全率和查准率,为用户提供分类信息目录。而且自动分类的好与坏,对后面的相关性排序过程也有一定的作用。 相似文献
12.
文章主要是结合电子政务信息的特点,对中文文本分类技术在电子政务中的应用进行探讨,指出当前中文文本分类研究存在的问题,提出在电子政务中应用时的建议.最后指出了加强电子政务的电子词典建设是促进自动分类技术在电子政务中广泛应用的一个重要工作. 相似文献
13.
在介绍文本分类技术的基础上,结合学科导航特点,探讨了将文本分类技术应用于学科导航的必要条件,分析了应用文本分类技术后给学科导航带来的影响,通过实证显示了文本分类技术应用于学科导航分类所产生的优势. 相似文献
14.
15.
朴素贝叶斯理论是一种典型机器学习技术,能够应用于文本分类中。运用朴素贝叶斯理论阐述了贝叶斯分类器的样本训练和分类计算的过程,构造了一个文本分类器。试验表明,朴素贝叶斯理论在文本分类中有较好的分类效果。 相似文献
16.
主要研究了文本分类精度问题。介绍了文本分类的基本过程,提出了一种改进的支持向量机文本分类技术,设计并实现了一个开放的中文文档自动分类系统。实验结果表明,提出的方法不仅具有较高的训练效率,同时也能得到很高的分类准确率和查全率。 相似文献
17.
结合文本分类的过程和面向对象方法学理论,讨论面向对象思想在文本分类过程中的体现。阐述文本分类过程和面向对象程序设计中抽象类过程的区别与联系。 相似文献
18.
文本自动分类是文本信息处理中的一项基础性工作。将范例推理应用于文本分类中,并利用词语间的词共现信息从文本中抽取主题词和频繁词共现项目集,以及借助聚类算法对范例库进行索引,实现了基于范例推理的文本自动分类系统。实验表明,与基于TFIDF的文本表示方法和最近邻分类算法相比,基于词共现信息的文本表示方法和范例库的聚类索引能有效地改善分类的准确性和效率,从而拓宽了范例推理的应用领域。 相似文献
19.
简要介绍组织机构文本信息资源建设管理有关情况,以及在信息过滤、信息检索、信息分类、信息抽取、数据挖掘等文本信息处理技术方面的应用现状;针对目前存在的问题提出进一步解决方案.对组织机构文本信息资源的开发利用提出新的发展思路;最后论述文本信息处理技术对提高组织机构信息资源的应用服务水平方面将起到至关重要的作用. 相似文献