首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
列车自动驾驶系统是城市轨道交通列车自动控制系统的重要组成部分。它保证列车的准时性,节能型和旅客舒适度等。在列车自动驾驶系统算法方面,现在已有的算法为经典控制论算海和智能算法等等口基于灰色控制的列车自动驾驶系统算法属于智能算法的一种,根据灰色系统原理,利用已有的相对贫乏的数据,进行建模,通过模型计算出预测值,使之与目标值进行比较再进行决策的算法。  相似文献   

2.
黄莉  李湘东 《情报杂志》2012,31(7):177-181,176
KNN最邻近算法是文本自动分类中最基本且常用的算法,该算法中需要计算文本之间的相似度.以Jensen-Shannon散度为例,在推导和说明其基本原理的基础之上,将其用于计算文本之间的相似度;作为对比,也使用常规的余弦值方法计算文本之间的相似度,并进而使用KNN最邻近算法对文本进行分类,以探讨不同的相似度计算方法对使用KNN最邻近算法进行文本自动分类效果的影响.多种试验材料的实证研究说明,较之于余弦值方法,基于Jensen-Shannon散度计算文本相似度的自动分类会使分类正确率更高,但会花费更长的时间.  相似文献   

3.
数据库安全性是数据库系统发展中必须解决的首要问题。传统的数据库安全检测系统对常规数据库攻击具有较好的拦截性能,但对于现代饱和攻击,拦截性能很差。提出一种基于多尺度标识调配算法的数据库攻击安全检测系统,首先对所有的数据进行多尺度的标识识别,然后在标识识别的基础上,实现自动调配,分析深层次特征,识别数据库攻击。采用多种不同的攻击进行测试实验,结果显示,采用该算法数据库攻击拦截的正确率提高了约23%,可以在数据库安全系统中广泛使用。  相似文献   

4.
基于SVM的多类文本分类研究   总被引:9,自引:0,他引:9  
基于统计学习理论.构建了SVM文本分类模型,并给出了模型参数的100自动选择算法,解决了以往参数靠经验确定的弊端。传统的文本分类系统不能处理一篇文档同属多类别的情形,论文将该情形归结为多类文本分类问题,提出二叉决策树SVM模型,并就农业机械化工程文档进行了实证分析。结果表明,该算法具有较好的分类效果。  相似文献   

5.
基于核聚类算法的高校图书借阅信息分类方法   总被引:3,自引:0,他引:3  
李盼池 《现代情报》2003,23(9):186-188
针对高校图书馆读者借阅文献类型、流量实时监测问题,提出了一种基于模式识别中核聚类算法的自动分类和统计分析方法。首先按照中图法所列22个大类对馆藏图书类型和借阅记录情况进行量化编码,然后对编码后的数据进行规整处理。以流通系统的读者数据库为底层数据支持,采用本文提出的方法开发出流量分类统计和预报应用系统。对大庆石油学院图书馆流通数据进行实际处理,结果证明了该算法的有效性和可靠性。  相似文献   

6.
对混合式自动定量充填这一新方法的可行性进行了论证,分析了影响混合式自动定量速度和精度的因素,以及进一步提高定量速度和精度的措施。最后对该系统进行了总体结构上的设计。  相似文献   

7.
目前,在基于机器视觉的浮法玻璃质量在线监测系统中,首先需要对玻璃图像进行采集,对其进行处理和分析,以进行玻璃缺陷识别,然后用于后续操作中。本文根据对浮法玻璃各类缺陷的特征研究,通过分析反向传播学习神经网络识别算法的优缺点,采用一种改进方式用于浮法玻璃的缺陷分类和字符识别。经过实验数据测试表明,改进后的算法具有收敛速度快、识别误判率低的特点,能够为浮法玻璃质量在线检测系统中的玻璃打标和切割等操作提供准确、有效的信息,对于减少人工误差、保证产品质量等方面具有重要的意义。  相似文献   

8.
模糊聚类技术在文献自动分类系统中的应用   总被引:1,自引:0,他引:1  
楚存坤  李韬 《现代情报》2009,29(9):166-168,172
本文采用模糊聚类技术,结合《中国图书馆分类法》,尝试建立一种新型的文献自动分类机制。文章采用模块化技术,提出整套系统的设计流程和关键点的设计,并分析了其优缺点。目的是为文献的自动分类探索一种新的思路和方法。  相似文献   

9.
白振田  侯汉清 《情报科学》2005,23(6):940-944
当前,在信息资源管理领域,有关信息自动化处理方面的研究较多涌现,相关的实用系统也在开发实验。自动分类便是其中之一。本文结合基于VSM理论的实用行业自动分类系统的开发实现,对构建分类概念空间的思路、步骤及主要技术,包括权值确定、算法构思、正确性及效率评价等相关问题进行讨论。  相似文献   

10.
借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分类中具体参数的设置和不同分类算法之优劣。  相似文献   

11.
面向信息检索的汉语同义词自动识别和挖掘   总被引:3,自引:0,他引:3  
为了提高同义词自动挖掘的效率,本文提出了从词典释义中自动识别和挖掘同义词的方法,使用超链接分析算法和模式匹配算法,从不同的角度提取同义词:第一部分是把词汇之间注释与被注释的关系看成是一种链接关系。对给定的词汇进行分析,把与给定词汇具有链接关系的所有相关词汇构造一个词汇图,图中的每一个节点代表相关词,每条弧代表了词汇之间注释与被注释的关系。利用超链接分析方法并结合PageRank算法,计算词汇的PageRank值,把PageRank值看成是体现词汇之间语义相似性的衡量指标,最后为每一个词汇生成候选同义词集,并通过一定的筛选原则和方法,推荐出最佳的同义词。第二部分是利用词汇定义模式,对词汇的释义方式进行分析,归纳总结出在词典释义中同义词出现的模式,进而利用模式匹配方法识别和挖掘同义词。此外,利用模式匹配方法对Web网页和期刊论文中的同义词也进行了挖掘测试。测试结果表明,利用模式匹配和超链接分析方法来自动识别和挖掘同义词具有可行性和实用性。  相似文献   

12.
中文自动文摘在搜索引擎中的应用   总被引:2,自引:0,他引:2  
董建设  任丽  周燕玲 《情报科学》2006,24(2):267-269,309
将自动文摘应用与搜索引擎系统,可以使用户更方便、直观地了解被命中网页的内容。本系统在实现基于网页的自动文摘时,针对Web文本的特点,采用了以统计为基础,统计和规则相结合的自动文摘生成策略,实现了HTML标记加权处理、中文文本切分和同义词分析,在此基础上完成了基于统计的文摘句初步提取和基于语用规则的进一步处理。  相似文献   

13.
在分析了传统雨刮器缺点的基础上,提出了一种基于BP神经网络的模式识别模型,用专家的经验数据训练它,并测试了它;给出了BP神经网络的学习过程及算法。结果表明这个基于BP神经网络的模型不使用精确的数学模型即可有效处理智能雨刮器系统的不可靠性和非线性。  相似文献   

14.
基于情报检索的汉语同义词识别初探   总被引:3,自引:0,他引:3  
随着计算机的飞速发展,自然语言越来越广泛地应用于情报检索,同义词控制问题也成为情报学的研究热点。本文提出一种识别同义词的方法,这种方法基于检索网络搜索得到的统计数据,使用Dice测度方法测量两个词的相关度,相关度在给定的阈值内就可以认为是同义词。通过分析测试结果,验证这种方法的可行性,并提出了这种方法的优缺点及其应用。  相似文献   

15.
基于支持向量机学习模型,使用万方期刊数据库中医学、卫生的有关标题和摘要数据,对医学、卫生大类下的R7中的9个小类进行了自动分类研究。在中文信息处理知识和技术的基础上选取分类特征,在分类过程中主要采取了基于低密度多特征的训练方法。在互信息、卡方统计、交叉熵和证据权值4个不同的统计特征量的开放测试中,自动分类的查全率和准确率都取得了相对令人满意的结果。  相似文献   

16.
全文检索研究   总被引:11,自引:0,他引:11  
A new algorithm for automatic segmentation of Chinese word with the stop word list and post-controlled thesaurus, that has absorbed the ideas from the single-Chinese character method and the thesaurus method, is given. Based on this algorithm, a new full text retrieval mode is built.  相似文献   

17.
基于机械分词与统计学的新词识别研究   总被引:5,自引:0,他引:5  
分词是所有中文信息处理工作的基础,也是汉语信息处理的难点之一,如何识别文中出现的新词更成为当前研究的重点之一。本文综合利用几种传统的机械分词方法,加上统计学的方法,提出了一种从文献中抽取新词的新方法。  相似文献   

18.
谭荧  唐亦非 《情报科学》2020,38(4):23-27
【目的/意义】将知识抽取的粒度细化到知识构成的最小单元--知识元,能提高知识获取的效率和精准度。【方法/过程】本文利用命名实体识别和事件抽取技术,探索了在科学文献中自动抽取事实知识元的方法。【结果/结论】实验结果表明,该方法能有效识别科学文献中的事实知识元,自动抽取效果出色。  相似文献   

19.
[目的/意义]构建大数据环境下学术创新力自动测度知识库,为学术创新力测度分析做支持。[方法/过程]以图书情报学相关期刊2008-2018年部分论文为数据源,使用本体建模的方法构建图书情报学知识本体,结合信息科学领域G3(科学、科学研究类)相关论文构建的本体,按照软件工程规范进行相关分析和设计,确定存储方案和存储结构,采用MySQL数据库来存储数据。[结果/结论]最终成功构建学术创新力测度知识库系统,并提供必要的知识库查询相关接口。[局限]由于时间关系和对图书情报学领域缺乏系统深入的了解,文章所构建的本体在属性关系方面进行了简化,导致实际使用效果会受一定影响。  相似文献   

20.
Measuring effectiveness of information retrieval (IR) systems is essential for research and development and for monitoring search quality in dynamic environments. In this study, we employ new methods for automatic ranking of retrieval systems. In these methods, we merge the retrieval results of multiple systems using various data fusion algorithms, use the top-ranked documents in the merged result as the “(pseudo) relevant documents,” and employ these documents to evaluate and rank the systems. Experiments using Text REtrieval Conference (TREC) data provide statistically significant strong correlations with human-based assessments of the same systems. We hypothesize that the selection of systems that would return documents different from the majority could eliminate the ordinary systems from data fusion and provide better discrimination among the documents and systems. This could improve the effectiveness of automatic ranking. Based on this intuition, we introduce a new method for the selection of systems to be used for data fusion. For this purpose, we use the bias concept that measures the deviation of a system from the norm or majority and employ the systems with higher bias in the data fusion process. This approach provides even higher correlations with the human-based results. We demonstrate that our approach outperforms the previously proposed automatic ranking methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号