共查询到18条相似文献,搜索用时 234 毫秒
1.
在对K均值算法和图像聚类的蚁群优化算法(ACO)进行对比分析后,本文提出了K均值ACO算法来解决K均值误分类和ACO慢聚敛的问题。K均值ACO算法将K均值的结果当成ACO的启发式信息,如此提高了ACO在蚁群寻找规则方面的光照概率和光照像素,允许蚁群根据信息素集中度而非概率来筛选节点,以致可以在不对ACO的随机搜索质量进行改变的情况下就可以完全获取到启发式信息。对模拟数据和真实数据进行验证后,K均值ACO算法证实可以改善K均值误分类的聚类精确度并提高ACO的收率速度。 相似文献
2.
3.
文本自动分类是文本信息处理中的一项基础性工作。将范例推理应用于文本分类中,并利用词语间的词共现信息从文本中抽取主题词和频繁词共现项目集,以及借助聚类算法对范例库进行索引,实现了基于范例推理的文本自动分类系统。实验表明,与基于TFIDF的文本表示方法和最近邻分类算法相比,基于词共现信息的文本表示方法和范例库的聚类索引能有效地改善分类的准确性和效率,从而拓宽了范例推理的应用领域。 相似文献
4.
为解决社区问答系统中的问题短文本特征词少、描述信息弱的问题,本文利用维基百科进行特征扩展以辅助中文问题短文本分类。首先通过维基百科概念及链接等信息进行词语相关概念集合抽取,并综合利用链接结构和类别体系信息进行概念间相关度计算。然后以相关概念集合为基础进行特征扩展以补充文本特征语义信息。实验结果表明,本文提出的基于特征扩展的短文本分类算法能有效提高问题短文本分类效果。 相似文献
5.
提出了一种基于机器学习的Web文本自动分类的架构,提出了中文Web文档自动分类的主要技术问题。介绍了中文Web文档自动分类工具的总体设计,它主要包括网络蜘蛛、中文分词、特征选取和贝叶斯分类器等功能模块。最后对中文Web文档自动分类器进行了实验。 相似文献
6.
近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神经网络(TextCNN)的NEWT新型计算框架;实证部分,基于中国地方政府发布的科技政策文本进行算法校验。实验结果显示,在取词长度分别为500、750和1 000词的情况下,应用NEWT算法对中文科技政策文本进行分类的效果优于RCNN、Bi-LSTM和CapsNet等传统深度学习模型,F1值的平均提升比例超过13%;同时,NEWT在较短取词长度下能够实现全文输入的近似效果,可以部分改善传统深度学习模型在中文长文本自动分类任务中的计算效率。 相似文献
7.
基于词频的中文文本分类研究 总被引:1,自引:0,他引:1
本文对中文文本分类系统的设计和实现进行了阐述,对分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细的介绍。将基于词频统计的方法应用于文本分类。并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方法,在无词表的情况下,通过统计构造单字和二字词表,对文本进行分类,并取得不错的效果。 相似文献
8.
一种基于TFIDF方法的中文关键词抽取算法 总被引:4,自引:1,他引:3
本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法.该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词.通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著. 相似文献
9.
基于SUMO本体的图书自动分类模型研究 总被引:1,自引:0,他引:1
提出基于SUMO本体的图书自动分类模型.该模型首先对收集的各类图书信息进行预处理,形成高维的词向量空间,然后利用我们设计的基于SUMO本体的映射算法将其映射成低维的概念向童空间进行图书自动分类模型的训练.当用户输入图书信息时,模型会对这些信息进行相同处理,并利用训练好的分类模型将其归到相应的类别中.实验表明,该模型能够简化图书自动分类的过程,降低向量维度,提高分类效率,有效保证图书分类的准确率和召回率. 相似文献
10.
文章主要是结合电子政务信息的特点,对中文文本分类技术在电子政务中的应用进行探讨,指出当前中文文本分类研究存在的问题,提出在电子政务中应用时的建议.最后指出了加强电子政务的电子词典建设是促进自动分类技术在电子政务中广泛应用的一个重要工作. 相似文献
11.
以简单TSP问题为例描述了传统蚁群算法过程,提出了其存在的问题及解决该问题的方法.提出了复杂TSP问题的定义,结合改进后的蚁群算法提出了解决复杂TSP问题的方法.通过实验表明,改进后的蚁群算法能够用于解决复杂TSP问题. 相似文献
12.
针对蚁群算法容易陷入局部最优解的缺陷,提出了一种基于直接通信策略的双态蚁群算法。通过两种状态的蚁群的分工合作,避免了算法收敛过程中的早熟停滞现象;通过设置信息素交流机制,使蚂蚁能在各自的交流范围内与其他蚂蚁交换解的信息,提高解的质量。针对TSP的实验结果表明,该算法在求解精度和稳定性上取得了良好的效果。 相似文献
13.
14.
15.
针对多配送中心煤炭车辆调度问题的复杂性,建立该问题的数学模型并提出合理假设和约束条件,以缩短配送路径降低配送成本为目标构造该问题的目标函数。文章结合实例应用蚁群算法对煤炭配送路径进行优化降低运输成本,通过实验验证了蚁群算法在煤炭配送路径优化问题的有效性。 相似文献
16.
介绍了一种求解复杂组合优化问题的新型的模拟进化算法——蚁群算法。阐述了该算法的基本原理、模型以及实现过程,并且介绍了蚁群算法在TSP问题、二次分配问题、车间作业调度问题、大规模集成电路综合布线以及车辆路径问题等组合优化问题中的应用思路。 相似文献
17.
18.
简要介绍语义模板的概念,提出基于语义模板向量空间的文档自动分类模型。利用支持向量机(SVM,Support Vector Machine)分类算法对文档测试集进行基于语义模板空间、词向量空间的分类实验,实验结果表明,基于语义模板空间的文本分类性能比基于词向量空间的分类性能要高。 相似文献