共查询到20条相似文献,搜索用时 265 毫秒
1.
列车自动驾驶系统是城市轨道交通列车自动控制系统的重要组成部分。它保证列车的准时性,节能型和旅客舒适度等。在列车自动驾驶系统算法方面,现在已有的算法为经典控制论算海和智能算法等等口基于灰色控制的列车自动驾驶系统算法属于智能算法的一种,根据灰色系统原理,利用已有的相对贫乏的数据,进行建模,通过模型计算出预测值,使之与目标值进行比较再进行决策的算法。 相似文献
2.
KNN最邻近算法是文本自动分类中最基本且常用的算法,该算法中需要计算文本之间的相似度.以Jensen-Shannon散度为例,在推导和说明其基本原理的基础之上,将其用于计算文本之间的相似度;作为对比,也使用常规的余弦值方法计算文本之间的相似度,并进而使用KNN最邻近算法对文本进行分类,以探讨不同的相似度计算方法对使用KNN最邻近算法进行文本自动分类效果的影响.多种试验材料的实证研究说明,较之于余弦值方法,基于Jensen-Shannon散度计算文本相似度的自动分类会使分类正确率更高,但会花费更长的时间. 相似文献
3.
数据库安全性是数据库系统发展中必须解决的首要问题。传统的数据库安全检测系统对常规数据库攻击具有较好的拦截性能,但对于现代饱和攻击,拦截性能很差。提出一种基于多尺度标识调配算法的数据库攻击安全检测系统,首先对所有的数据进行多尺度的标识识别,然后在标识识别的基础上,实现自动调配,分析深层次特征,识别数据库攻击。采用多种不同的攻击进行测试实验,结果显示,采用该算法数据库攻击拦截的正确率提高了约23%,可以在数据库安全系统中广泛使用。 相似文献
4.
5.
基于核聚类算法的高校图书借阅信息分类方法 总被引:3,自引:0,他引:3
针对高校图书馆读者借阅文献类型、流量实时监测问题,提出了一种基于模式识别中核聚类算法的自动分类和统计分析方法。首先按照中图法所列22个大类对馆藏图书类型和借阅记录情况进行量化编码,然后对编码后的数据进行规整处理。以流通系统的读者数据库为底层数据支持,采用本文提出的方法开发出流量分类统计和预报应用系统。对大庆石油学院图书馆流通数据进行实际处理,结果证明了该算法的有效性和可靠性。 相似文献
6.
7.
8.
模糊聚类技术在文献自动分类系统中的应用 总被引:1,自引:0,他引:1
本文采用模糊聚类技术,结合《中国图书馆分类法》,尝试建立一种新型的文献自动分类机制。文章采用模块化技术,提出整套系统的设计流程和关键点的设计,并分析了其优缺点。目的是为文献的自动分类探索一种新的思路和方法。 相似文献
9.
当前,在信息资源管理领域,有关信息自动化处理方面的研究较多涌现,相关的实用系统也在开发实验。自动分类便是其中之一。本文结合基于VSM理论的实用行业自动分类系统的开发实现,对构建分类概念空间的思路、步骤及主要技术,包括权值确定、算法构思、正确性及效率评价等相关问题进行讨论。 相似文献
10.
借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分类中具体参数的设置和不同分类算法之优劣。 相似文献
11.
面向信息检索的汉语同义词自动识别和挖掘 总被引:3,自引:0,他引:3
为了提高同义词自动挖掘的效率,本文提出了从词典释义中自动识别和挖掘同义词的方法,使用超链接分析算法和模式匹配算法,从不同的角度提取同义词:第一部分是把词汇之间注释与被注释的关系看成是一种链接关系。对给定的词汇进行分析,把与给定词汇具有链接关系的所有相关词汇构造一个词汇图,图中的每一个节点代表相关词,每条弧代表了词汇之间注释与被注释的关系。利用超链接分析方法并结合PageRank算法,计算词汇的PageRank值,把PageRank值看成是体现词汇之间语义相似性的衡量指标,最后为每一个词汇生成候选同义词集,并通过一定的筛选原则和方法,推荐出最佳的同义词。第二部分是利用词汇定义模式,对词汇的释义方式进行分析,归纳总结出在词典释义中同义词出现的模式,进而利用模式匹配方法识别和挖掘同义词。此外,利用模式匹配方法对Web网页和期刊论文中的同义词也进行了挖掘测试。测试结果表明,利用模式匹配和超链接分析方法来自动识别和挖掘同义词具有可行性和实用性。 相似文献
12.
13.
14.
基于情报检索的汉语同义词识别初探 总被引:3,自引:0,他引:3
随着计算机的飞速发展,自然语言越来越广泛地应用于情报检索,同义词控制问题也成为情报学的研究热点。本文提出一种识别同义词的方法,这种方法基于检索网络搜索得到的统计数据,使用Dice测度方法测量两个词的相关度,相关度在给定的阈值内就可以认为是同义词。通过分析测试结果,验证这种方法的可行性,并提出了这种方法的优缺点及其应用。 相似文献
15.
16.
全文检索研究 总被引:11,自引:0,他引:11
A new algorithm for automatic segmentation of Chinese word with the stop word list and post-controlled thesaurus, that has absorbed the ideas from the single-Chinese character method and the thesaurus method, is given. Based on this algorithm, a new full text retrieval mode is built. 相似文献
17.
基于机械分词与统计学的新词识别研究 总被引:5,自引:0,他引:5
分词是所有中文信息处理工作的基础,也是汉语信息处理的难点之一,如何识别文中出现的新词更成为当前研究的重点之一。本文综合利用几种传统的机械分词方法,加上统计学的方法,提出了一种从文献中抽取新词的新方法。 相似文献
18.
19.
[目的/意义]构建大数据环境下学术创新力自动测度知识库,为学术创新力测度分析做支持。[方法/过程]以图书情报学相关期刊2008-2018年部分论文为数据源,使用本体建模的方法构建图书情报学知识本体,结合信息科学领域G3(科学、科学研究类)相关论文构建的本体,按照软件工程规范进行相关分析和设计,确定存储方案和存储结构,采用MySQL数据库来存储数据。[结果/结论]最终成功构建学术创新力测度知识库系统,并提供必要的知识库查询相关接口。[局限]由于时间关系和对图书情报学领域缺乏系统深入的了解,文章所构建的本体在属性关系方面进行了简化,导致实际使用效果会受一定影响。 相似文献
20.
Measuring effectiveness of information retrieval (IR) systems is essential for research and development and for monitoring search quality in dynamic environments. In this study, we employ new methods for automatic ranking of retrieval systems. In these methods, we merge the retrieval results of multiple systems using various data fusion algorithms, use the top-ranked documents in the merged result as the “(pseudo) relevant documents,” and employ these documents to evaluate and rank the systems. Experiments using Text REtrieval Conference (TREC) data provide statistically significant strong correlations with human-based assessments of the same systems. We hypothesize that the selection of systems that would return documents different from the majority could eliminate the ordinary systems from data fusion and provide better discrimination among the documents and systems. This could improve the effectiveness of automatic ranking. Based on this intuition, we introduce a new method for the selection of systems to be used for data fusion. For this purpose, we use the bias concept that measures the deviation of a system from the norm or majority and employ the systems with higher bias in the data fusion process. This approach provides even higher correlations with the human-based results. We demonstrate that our approach outperforms the previously proposed automatic ranking methods. 相似文献