首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 312 毫秒
1.
数字环境下叙词表的发展及应用展望   总被引:2,自引:0,他引:2  
文章从叙词表的编制和应用两个方面讨论了数字资源知识组织中叙词表应该进行的变革.在编制方面,叙词表的概念术语可以来自高频的专业论文关键词,或者网络资源中用户使用的自由词,同时努力增加等同关系的术语.在获取词间关系时,可以采取统计共现率、使用用户组合检索日志、使用网络文献库日志等获取词间关系,最后展望了叙词表的应用领域.  相似文献   

2.
叙词表中词间关系分为等同关系(Equivalence Relationship)、等级关系(Hierarchical Rehtion-ship)和相关关系(Associative Rehtionship),词间关系的控制是叙词表编制的关键技术.主要针对叙词表词间的等级关系和相关关系,比较国际标准ISO 2788、中国标准GB13190-91以及美国标准NISO Z39.19-2005对其的规定,分析异同,总结联系,从三个标准的实用性、检索效率等方面予以分析,并为中国叙词表编制标准提出改进建议.  相似文献   

3.
提出了一套适用于网络环境中信息资源组织用领域叙词表自动编制方案,系统地阐述了自动编制过程中的步骤,并介绍了其中的关键技术,包括词表收词选词原则与方法,等同关系、等级关系和相关关系的自动识别方法和技术。最后指出,只有不断地维护和更新才能保证词表具有永久的生命力。  相似文献   

4.
周萌  陈果 《情报科学》2019,37(3):81-87
【目的/意义】传统共现分析方法应用于文本挖掘时,因关系粒度过粗导致难以有效利用文本内容中的语义 关系。本文以武器装备简氏文本为例,提出基于文本内容的细粒度关系抽取和可视化分析方法。【方法/过程】首 先,对原始简氏文本进行解析以提取武器装备名称,然后进行共现句子的提取,再扫描这些共现句子中的高频动名 词作为候选特征词;随后结合领域专家给出的武器装备细粒度关系词并根据在线同义词典进行特征词的归类和扩 展,以确立武器装备细粒度共现关系类型(包括替换、升级改造、配备安装、相似四种)和相应的特征词,并构建具有 多种类型边的武器装备细粒度共现网络。【结果/结论】最后,对该网络进行可视化分析,包括:按边类型划分子网 络、以节点为中心的武器多维关联分析和武器装备演化分析。细粒度共现网络的构建和分析有助于更全面、具体 地揭示该领域的整体、微观知识结构和知识演化情况。  相似文献   

5.
本文论述了传统叙词表的语义关系及其所具有的局限性,对FrameNet叙词表的语义关系如词汇聚合关系、继承关系、总分关系、参照关系、因果与状态关系进行了充分揭示,并总结了其明显的语义特征。FrameNet叙词表运用本体论思想,将人工语言与自然语言、词汇与句法有机结合,为今后自动语义标注、问答系统、信息抽取和信息检索的应用奠定了基础。  相似文献   

6.
吕美香 《情报科学》2012,(8):1160-1166
词表是图书馆和信息检索领域最重要的知识组织工具,《中国分类主题词表》是传统词表的一种,它的更新和维护一直依靠手工进行,这制约了它在数字图书馆和网络信息环境下的应用。本文介绍了一项基于统计的、从元数据的标题中抽取关键词并定位在词表中的方法。大致包括三个步骤:从标题中提取关键词;确定抽取出的关键词的专指度;将专指度高的专业词汇定位在词表中。在《中国分类主题词表》和上海图书馆提供的计算机科技领域的元数据上所进行实验,结果证明该方法是可行的。这一方法可以应用到自动标引或编目中,有一定的实用性和广阔的应用前景。  相似文献   

7.
基于聚类的词表等级关系自动识别研究   总被引:3,自引:0,他引:3  
杜慧平  何琳 《情报科学》2008,28(11):1680-1684
词汇等级关系的识别是自动构建叙词表的重点和难点之一.基于相似度的词聚类方法,突破了按字面聚集等级关系词汇的传统做法的局限性,能够深入语义,识别出字面上无此特点的等级关系词汇.介绍了该方法并进行测试,试验结果表明该方法具有一定可行性.  相似文献   

8.
基于航天叙词表的领域本体半自动化构建研究   总被引:2,自引:0,他引:2  
文章在基于叙词表的本体构建方法基础上,从该方法本体构建现状研究入手,针对基于叙词表向领域本体转化的一系列问题,如叙词表词间一些不确定关系表示,构建过程的OWL关系表示的细化以及叙词表转化为本体后的维护扩展等,对本体和叙词表的相关知识进行论述,并利用OWL语言来表示和描述叙词表的叙词及词间的相关关系,提出从叙词表向本体转化的理论实践方法。  相似文献   

9.
[目的/意义]针对军事智能技术领域,采用基于社区发现的技术演化分析方法,实现对军事智能技术整体演化趋势和演化关系的分析,并验证基于社区发现的演化分析方法的有效性,为科技工作者更全面细致地掌握领域技术演化情况、探究技术起源和及早发现新技术萌生趋势提供依据和借鉴。[方法/过程]基于德温特专利数据库采集军事智能技术相关专利数据,利用专利分类代码在专利中的共现关系逐年构建共现网络,采用社区发现方法划分共现网络的社区结构,提出社区综合相似度计算方法计算社区相似度,形成各个技术子领域演化路径,分析军事智能技术的整体演化趋势和演化关系。[结果/结论]利用2012—2021年间16902条专利,结合本文的分析方法,从整体上识别出军事智能技术演化的趋势,并验证了继承、分化和融合关系分析方法的有效性。  相似文献   

10.
叙词表和分类法现代化的基础是计算机能够理解和处理其概念之间的关系,并建立可以理解的模型;同时要使其内容事务化。在构建计算机理解模型中。人工智能的产生式系统和框架方法可以为分类法和叙词表的革新提供有益的借鉴,这就是用产生式系统和框架表示法给分类法和叙词表提供过程性知识推导与结构性知识表示,借以建立分类模型和等级知识系统。  相似文献   

11.
全文检索研究   总被引:11,自引:0,他引:11  
A new algorithm for automatic segmentation of Chinese word with the stop word list and post-controlled thesaurus, that has absorbed the ideas from the single-Chinese character method and the thesaurus method, is given. Based on this algorithm, a new full text retrieval mode is built.  相似文献   

12.
雷晓  常春  刘伟 《情报科学》2021,39(1):135-141
【目的/意义】为保证叙词表术语收录的完整性,需要及时将领域出现但未收录的新术语补充收录到叙词表 中,结合候选词的时间及文档词频特征,从时间序列角度探索新术语的分布情况以指导新术语遴选是值得研究的 问题。【方法/过程】文章主要对词汇文档词频对应的时间序列进行研究,将时间序列进行词频归一化及时间等长预 处理,引入k-means聚类算法,对候选词汇进行基于时间序列趋势变化的聚类,探索术语以及非术语趋势变化的规 律,进而总结新术语应该满足的趋势变化特征。【结果/结论】通过聚类研究,总结得出新术语普遍处于增长趋势。 实证将处于增长状态的候选词汇遴选出来,经过专家判断,该方法可以有效从候选词汇中遴选出其中能补充到叙 词表中的新术语,该方法有比较高的准确率。【创新/局限】创新之处表现为叙词表新术语的遴选中同时考虑了时间 变化和文档词频因素,局限于数据处理规模,实证中只统计了论文关键词的词频数据。  相似文献   

13.
Decisions in thesaurus construction and use   总被引:1,自引:0,他引:1  
A thesaurus and an ontology provide a set of structured terms, phrases, and metadata, often in a hierarchical arrangement, that may be used to index, search, and mine documents. We describe the decisions that should be made when including a term, deciding whether a term should be subdivided into its subclasses, or determining which of more than one set of possible subclasses should be used. Based on retrospective measurements or estimates of future performance when using thesaurus terms in document ordering, decisions are made so as to maximize performance. These decisions may be used in the automatic construction of a thesaurus. The evaluation of an existing thesaurus is described, consistent with the decision criteria developed here. These kinds of user-focused decision-theoretic techniques may be applied to other hierarchical applications, such as faceted classification systems used in information architecture or the use of hierarchical terms in “breadcrumb navigation”.  相似文献   

14.
Direct end-user data entry and retrieval is a major factor in achieving an economical information retrieval system. To be effective, such a system would have to provide a thesaurus structure which leads novice end-users to browse subject areas before retrieval and yet provides control and coverage of terms in a domain. A faceted hierarchical thesaurus organization has been designed to accomplish this goal.  相似文献   

15.
姜鑫 《现代情报》2013,33(11):108-113
本文以CNKI数据库中1 003篇国内"微博"研究文献为研究对象,运用共词分析方法和社会网络分析方法,以SPSS 17.0、Ucinet 6.2和NetDraw软件为分析工具,通过聚类分析、相关分析和K-核分析等分析方法,确定了我国"微博"研究的6个重要主题:微博传播特征、微博传播机制、微博用户特征、微博舆情传播、微博应用领域和微博与传统媒体的比较研究,为探析我国微博研究领域的研究热点和发展趋势提供了参考。  相似文献   

16.
沈同平  杨松涛  储节旺 《现代情报》2013,33(11):100-107
汇总统计CNKI全文数据库中近十年国内图像检索领域所涉及的关键词,利用SATI 3.2软件统计这些关键词的词频,确定我国图像研究领域使用频率最高的关键词。然后构造共词矩阵、相关矩阵、相异矩阵,并在此基础上利用聚类分析和多维尺度分析多元统计方法对不同的矩阵进行共词分析。最后,对分析结果进行讨论,归纳国内近十年图像检索研究热点。  相似文献   

17.
邱宇红 《现代情报》2014,34(2):121-128
高校科技论文的产出是描述和评价高校科研活动的重要指标。本文以科学引文索引(SCIE)收录的中国医科大学2003-2012年发表的科技论文为数据源,利用SCIE的分析功能和Citespace绘制论文的期刊分布、合作者、学科领域、文献共词等可视化图谱,以揭示医学高校学科结构的发展变化,为学科建设制定规划提供一定的参考依据。  相似文献   

18.
We report on the design and construction of features of an automated query system which will assist pharmacologists who are not information specialists to access the Derwent Drug File (DDF) pharmacological database. Our approach was to first elucidate those search skills of the search intermediary which might prove tractable to automation. Modules were then produced which assist in the three important subtasks of search statement generation, namely vocabulary selection, the choice of context indicators and query reformulation. Vocabulary selection is facilitated by approximate string matching, morphological analysis, browsing and menu searching. The context of the study, such as treatment or metabolism, is determined using a system of advisory menus. The task of query reformulation is performed using user feedback on retrieved documents, thesaurus relations between document index terms and term postings data. Use is made of diverse information sources, including electronic forms of printed search aids, a thesaurus and a medical dictionary. The system will be of use both to semicasual users and experienced intermediaries. Many of the ideas developed should prove transportable to domains other than pharmacology: the techniques for thesaurus manipulation are designed for use with any hierarchical thesaurus.  相似文献   

19.
Authors and searchers usually express the same things in many different ways, which causes problems in free text searching of text databases. Thus, a switching tool connecting the different names of one concept is needed. This study tests the effectiveness of a thesaurus as a search-aid in free text searching of a full text database. A set of queries was searched against a large full text database of newspaper articles. The search-aid thesaurus constructed for the test contains the usual relationships of a thesaurus, namely equivalence, hierarchical, and associative relationships. Each query was searched in five distinct modes: basic search, synonym search, narrower term search, related term search, and union of all previous searches. The basic searches contained only terms included in the original query statements. In the synonym searches, the terms of the basic search were extended by disjunction of the synonyms given by the search-aid thesaurus without modifying the overall logic of the basic search. Likewise, the basic search was extended in turn with the narrower terms and with the related terms given by the search-aid thesaurus. The last search mode included the basic terms and all the terms used in the previous searches. The searches were analyzed in terms of relative recall and precision; relative recall was estimated by setting the recall of the union search to 100%. On the average the value of relative recall was 47.2% in the basic search, compared with 100% in the union search; the average value of precision decreased only from 62.5% in the basic search to 51.2% in the union search.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号