共查询到19条相似文献,搜索用时 140 毫秒
1.
2.
3.
句子级知识抽取在情报学中的应用分析 总被引:3,自引:0,他引:3
通过比较句子级知识抽取与词语级知识抽取的差异性,分析句子级知识抽取在情报学中的意义,表现在四类典型应用系统:学术抄袭检测系统、参考文献自动标注系统、文献自动综述系统、知识库构建系统。分析了知识抽取的难点与关键技术,针对难点与关键技术提出了知识抽取的3个转向:抽取对象转向以学术文献为主;抽取技术转向以内容结构分析为主;抽取目标转向以构建知识元数据库为主。 相似文献
4.
5.
[研究目的]南海问题的深入研究,需要从海量历史文献中快速获得知识描述,实现由文献向语句描述的内容抽取,因此引入最小知识描述单位——知识元,并研究其抽取规则,为南海维权信息内容抽取提供新思路,以方便研究者快速浏览文献知识。[研究方法]基于民国南海文献总结知识元分类,归纳不同属性类型知识元句法规则,提炼形成规则模板,匹配文本与知识元描述规则,人工干预确定知识元内容,实现知识元的内容抽取。[研究结论]匹配结果发现,内容描述规则能较好地实现知识元抽取,满足研究者对知识元内容的阅览需求。 相似文献
6.
基于Unicorn的校内图书文献信息资源整合及自动化管理 总被引:1,自引:0,他引:1
图书文献书目数据库建设是实现文献资源共建共享的基础工作。天津师范大学图书馆实践了文献资源整合和自动化管理模式的研究与建设,将分散在图书馆与各院系资料室的图书文献进行规范加工并将图书文献资源数字化整合在一个系统下运作、管理,在图书馆与资料室中实现统一的自动化管理并对全校师生开放。通过这次校内文献资源整合,为读者提供了便捷的图书文献信息平台,实现真正意义上的图书文献资源的共享。 相似文献
7.
韩丽华 《内蒙古科技与经济》2011,(19):150-151
阐述了开放存取环境对图书馆文献信息资源建设的影响,着重探讨图书馆如何充分利用开放存取所带来的机遇和挑战,从而建设多层次、多功能的文献资源保障体系,实现资源共建共享。 相似文献
8.
《内蒙古科技与经济》2016,(14)
针对高校图书馆对社会开放的意义、存在的问题、解决的方案等方面进行了探讨,从高校图书馆的文献资源、校园安全、规章制度、读者需求、产权保护等方面,提出了实现对社会开放的策略。 相似文献
9.
针对目前军队院校原生文献数字信息资源种类繁多、形式多样、搜集困难、管理标准不统一等问题,从组织、人员、规范等方面提出了军校原生文献资源数字化建设的对策,使分散在教员和研究人员手中的原生数字信息资源最终实现开放存取,提高其学术价值,更好地为军校科研建设服务。 相似文献
10.
数字信息资源开放存取中的法律规范是实现数字信息资源共享的前提。《布达佩斯开放存取计划》中对开放存取的定义使用户在使用该文献时不受经济、法律或技术的限制产生了歧义,导致数字信息资源开放存取行为在实践中经常出现纠纷,引发了一些法律问题。本文对数字信息资源开放存取的法律客体问题、开放存取过程中保持文献的完整性问题、权利人的利益保护问题、复制权问题、合理使用问题以及适当引用问题进行了分析。 相似文献
11.
作为大规模的语义知识资源,Ontology在智能信息检索和其他智能化的信息资源管理中具有重要的作用。但是要使Ontology真正能够发挥作用,必须要使它具有一定的规模,而采用人工方法构建实用的Ontology需要花费漫长的时间和巨大的成本。本文探讨了一种Ontology的自动构建方法,该方法包括自然语言处理、知识获取、Ontology构建和知识库4个部分,并对每个部分的功能和应用的技术进行了具体介绍。该自动构建系统具有开放性和自我学习的特点,可以面向某领域进行领域Ontology的构建。 相似文献
12.
基于Web of Science数据库,以中美英图书情报学领域1990-1994年和2010-2014年期间文献的施引文献为样本,计量分析了:1)美国在1990-1994年和2010-2014年期间的施引文献特征:国别、机构、来源期刊、开源、类型和语言及其之间的差异;2)中美英2010-2014年期间图书情报学领域的施引文献特征及其之间的差异,揭示出中美英3国1990-1994年和2010-2014年期间图书情报学领域的施引特征分布情况及科学交流概况。研究发现:1)1990-2015年美国的年均发文数量是中国年均发文数量的24倍;2)中美英图书情报学领域的主要施引国家基本一致;3)美英图书情报学领域新时期(2010-2014)的主要施引机构中,出现香港城市大学、中国科学院大学和武汉大学等中国大学的身影;4)美国图书情报学领域施引文献的开源程度最高,比例达到10.73%;5)中美英3国图书情报学领域的主要施引文献类型基本一致,全部为论文、会议论文、综述、专著和社论材料,且论文和会议论文的占比均在91%以上。 相似文献
13.
ISTP网络版的检索方法及其使用技巧 总被引:3,自引:0,他引:3
会议文献作为一种重要的科技文献类型,具有很高的学术价值。ISTP作为检索会议文献的重要工具,在国内外享有盛誉。本文在简述会议文献及其类型的基础上,介如了ISTP网络版的检索方法,并举例说明了此检索方法使用中的若干技巧,对专业检索人员和科研人员检索会议文献具有指导意义。 相似文献
14.
【目的/意义】研究学术会议论文新颖性测度方法,为会议论文的新颖性评价提供新的视角。【方法/过程】本
文设计吸收新颖性指标和产出新颖性指标测度方法,选择“人工智能”领域的会议论文进行实证研究。【结果/结论】
具有高吸收新颖性水平和高产出新颖性水平的论文成为A类会议论文的几率最高,结果表明新颖性测度方法的有
效性,对于会议论文的自动评审有一定的参考意义。【创新/局限】设计会议论文新颖性测度方法,促进会议论文评
价的发展;只针对计算机的人工智能领域进行实证,具有一定的领域局限性。 相似文献
15.
16.
《Information processing & management》2023,60(3):103243
The detection and identification of traffic signs is a fundamental function of an intelligent transportation system. The extraction or identification of a road sign poses the same problems as object identification in natural contexts: conditions of illumination are variable and uncontrollable, and various objects frequently surround road signs. These difficulties make the extraction of features difficult. The fusion of time and space features of traffic signs is important for improving the performance of sign recognition. Deep learning-based algorithms are time-consuming to train based on a large amount of data. They are difficult to deploy on resource-constrained portable devices and conduct sign detection in real time. The accuracy of sign detection should be further improved, which is related to the safety of traffic participants. To improve the accuracy of feature extraction and classification of traffic signs, we propose MKL-SING, a hybrid approach based on multi-kernel support vector machine (MKL-SVM) for public transportation SIGN recognition. It contains three main components: a principal component analysis for image dimension reduction, a fused feature extractor, and a multi-kernel SVM-based classifier. The fused feature extractor extracts and fuses the time and space features of traffic signs. The multi-kernel SVM then classifies the traffic signs based on the fused features. Different kernel functions in the multi-kernel SVM are fused based on a feature weighting procedure. Compared with single-core SVM, multi-kernel SVM can better process massive data because it can project each kernel function into high-dimensional feature space to get global solutions. Finally, the performance of SVM-TSR is validated based on three traffic sign datasets. Experiment results show that SVM-TSR performs better than state-of-the-art methods in terms of dynamic traffic sign identification and recognition. 相似文献
17.
本文着眼于高校科研院所对科学评价的需要,为提高计量分析效率,满足科研人员对计量分析结果实时的需要,提出一种基于自建数据库的文献自动计量分析系统的设计开发,并对系统功能实现进行了阐述。 相似文献
18.
《Information processing & management》2022,59(6):103107
It is very important to create the conference programs correctly in terms of timing and content by preventing problems such as being of articles that do not have a common topic with each other in the same sessions, the parallel of the sessions containing articles on the same topic. It greatly affects the efficiency of conference for participants. Currently, conference programs are organized manually. Considering the conference scope and the number of articles in that conference, it is a difficult and time-consuming process. In this study, an automatic solution to this problem is presented. The use of the SBERT method is provided a more accurate calculation of article similarities compared to baseline methods and is increased the success of other stages. Unlike classical clustering methods, an approach that clusters in such a way that there are equal numbers of data points in the clusters is proposed. In order to find the topic of the clusters determined as sessions, a topic determination approach is proposed that takes into account both keyword and article content similarities. Furthermore, with the proposed approach for session scheduling, the conference program has been planned more effectively by considering the parallel sessions. The ICTAI conference has been chosen to test the proposed approach. The proposed program is compared with both the real program and the programs created using Word2vec and Glove methods. With the proposed program, 10% improvement is achieved in terms of session similarity. In addition, parallel sessions are better planned with no conflicts compared to the real program. 相似文献
19.
网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。 相似文献