首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
为缓解海量文献关键词标引的巨大压力,文章构建了用于海量文献关键词标引的计算机辅助加工系统,对标引数据预处理规范、自动标引核心工作区和人工标引校对平台进行了具体阐述。文章采用数据测试方法确定了自动标引软件,在单一软件不能满足标引要求后探索了多种机标结果后处理方式提升机标质量,最终由人工标引校对平台保证海量文献关键词标引质量的同时,将机标出现的问题和改进意见反馈给软件设计和词表维护,保证了计算机辅助加工系统的持续改进。  相似文献   

2.
本文报道了一个基于微机Windows 环境的微机辅助文献标引系统, 用以解决文献前处理速度慢与文献数据库时间要求强之间的时差矛盾。介绍了系统的界面设计与设计思想, 辅助标引的机读叙词表和词典, 以及相关的文件组织和数据结构等。研究了系统界面与标引员之间的关系, 以求设计出最佳的人机界面促进文献标引的速度和质量。讨论了辅助标引用机读叙词表的各个学科词库合并与词表参照系统的应用等问题。  相似文献   

3.
再探文献的自动标引   总被引:1,自引:0,他引:1  
从文献自动标引检索语言的选择,建立文献自动标引系统的基本路径及关键词的选词措施等三个方面,探讨了文献实施微机自动标引的基本方略。  相似文献   

4.
MP·P软件系统按照全国三种分类法和文献工作的国家标准进行设计,具有通用性、标准化、图书情报兼容和处理各类文献的特点。软件系统分为建档、编目、编制索引、联机检索、自动标引和内部服务等于系统。 系统研究并使用了一些“新的算法”,打破了常规内存排序以及在微机上实现庞大的《汉语主题词表》管理。汉语主题词库和文献自动抽词标引,需要硬盘容量大的微机系统环境。 本软件是在IBM PC /XT机和长城0520机上开发出来的,可容易地运用在IBM PC 系列机及其兼容机上。系统可广泛地适用于各类型图书馆、情报所(室)以及机关、企事业单位管理中、西文文献、档案和非书资料。  相似文献   

5.
由《中图法》编委会和北京丹诚软件有限责任公司共同开发研制的《中图法》(第四版 )电子版 ,将于 2 0 0 1年 4月由北京图书馆出版社正式出版。它的出版标志着《中图法》已步入文献信息分类电子化时代。它既适用于传统文献的分类标引 ,快速查找类目 ,又适用于电子信息的有序组织 ,为实现机助标引和智能自动标引奠定了基础 ;它既适用于传统图书馆的文献资料的处理 ,又适应于虚拟图书馆、网络信息平台等信息分类组织的需要 ;它既适用于文献信息脱机标引 ,又适用于文献信息联机网络标引。《中图法》电子版主要包括两大部分 :类目检索部分和类目…  相似文献   

6.
本文主要介绍利用微机通用管理系统ISIS的PASCAL语言开发的并集成于该系统的“汉语科技文献自动标引系统CADAIS”的系统构成,功能,自动标引原理,词典结构与建立方法,标引算法和实验情况等。  相似文献   

7.
现代索引理论与方法概述   总被引:1,自引:1,他引:0  
本文从现代索引法、计算机在索引编制中的应用入手,概括了国内外自动标引、索引生成理论与方法,并对中、英文各种机助索引系统进行了论述.  相似文献   

8.
我国文献分类计算机化10年发展目标为:出版与推论发类法机读版;制定机读数据分类标引规则;研究制定规范化的分类法机读格式,建立标准化的分类规范文档,开发研制综合性自动分类标引、联机检索与分类法管理系统;编制适用网上信息检索与组织的统五分类体系,为实现上述目标,文中提出了若干对策。  相似文献   

9.
一个具体的全文后控检索系统的设计   总被引:4,自引:0,他引:4  
本文除简述了系统设计的总体思想、系统主要特点以及装库、标引、检索等模块的主要功能外, 重点探讨了适应全文检索系统不同时期标引建库需要的三种标引模式, 首次提出了基于全文检索系统标引和后控制成果自学习实现全文本标引用抽词词典的自动积累和完善并建立自动加权标引模式。另外, 还简要论述了全文摘要的机辅生成和后控检索策略的自动构造等重要问题。  相似文献   

10.
介绍了文献自动标引的几种方法,重点阐述了机辅标引法和电子科技情报研究所开发的电子科技文献机辅标引系统的构成原理与特点。  相似文献   

11.
微机辅助文献标引系统的设计与研究 3. 自动标引研究   总被引:2,自引:0,他引:2  
在微机辅助文献标引系统中引入了自动标引方法, 进一步提高了标引的速度和质量。自动标引的基本思想是: 以机内主题词典为依据, 采用遍历扫描和相似性匹配两种方法, 从标题和文摘中抽词, 本文介绍了这一自动标引技术, 并对自动标引的结果进行了分析和讨论。  相似文献   

12.
基于传统文本检索系统的XML索引实现研究   总被引:3,自引:0,他引:3  
陆伟 《情报学报》2006,25(6):679-685
作为重要的信息交换与存储标准,XML得到学者们越来越多的重视。作为XML检索研究的重要组成部分,XML索引机制与实现的研究已经取得了一定的研究成果。然而,大部分研究都是基于数据库及专门的半结构化管理器之上的。本文提出了如何在传统文本检索系统Okapi的基础上构建XML索引的方法。首先介绍了Okapi的索引结构,在此基础上,深入探讨了XML索引的存储结构及实现,并对索引的性能进行了评价。  相似文献   

13.
对中文科学引文数据库中的被引文献进行作者评价调查 ,证明引文索引词能较好地反映出由其所标引的文献的主题。  相似文献   

14.
汉字全文数据库索引机制的定量研究   总被引:11,自引:1,他引:10  
本文从定量方面就汉字全文数据库的单汉字、词索引两种机制在空间、时间、检索效率等方面进行比较分析。通过试验结果, 可为数据库软件开发人员在改善索引效率和检索效率时提供参考依据, 为用户选择软件提供帮助。并探讨了两种机制的发展趋势。  相似文献   

15.
分类表-叙词表转换系统的设计   总被引:7,自引:2,他引:5  
张雪英  侯汉清 《情报学报》2000,19(4):342-348
本文针对手工建立分类表-叙词表转换系统的缺点,用计算机设计了一个分类表-叙词表转换系统。系统以文献数据库标引数据(《中图法》及《汉语主题词表》)为实验对象,以金融银行学科为例建立了四种标引词(串)与分类号的对应模型,采用LogL统计方法实现分类号与主题词的自动对应和人工辅助筛选,并设置了模糊转换和精确转换两种分类号与主题词转换的模式。  相似文献   

16.
BACKGROUND: EUROETHICS is a database covering European literature on ethics in medicine. It is produced within Eurethnet, a European information network on ethics in medicine and biotechnology. OBJECTIVES: The aim of Euroethics is to disseminate information on European bioethical literature that may otherwise be difficult to find. METHODS: A collaboration model for pooling data from different centres was developed. The policy was to accomplish data uniformity, while still allowing for local differences in terms of software, indexing practices and resources. Records contributed to the database follow common standards in terms of data fields and indexing terms. The indexing terms derive from two thesauri, Thesaurus Ethics in the Life Sciences (TELS) and Medical Subject Headings (MeSH). Combining elements from search tools developed previously, the developers sought to find a technical solution optimized for this data model. An approach relying on a thesaurus database that is loaded along with the bibliographic database is described. RESULTS AND CONCLUSIONS: The present case study offers examples of possible approaches to several tasks often encountered in database development, such as: merging data from diverse sources, getting the most out of indexing terms used in a database, and handling more than one thesaurus in the same system.  相似文献   

17.
CRISP (Computer Retrieval of Information on Scientific Projects) is a large database maintained and operated by the National Institutes of Health (NIH). It contains comprehensive scientific and selected administrative data on research carried out by the U.S. Public Health Service (PHS) or supported by PHS grants and contracts. Developed originally to meet the needs of NIH, it is an excellent, largely untapped resource for health information professionals at large, revealing new trends, methods, and techniques, often before they appear in the published literature. CRISP uses its own controlled vocabulary, developed to permit indexing of new and active research areas. Queries can combine subject headings with a great variety of administrative data elements (e.g., research category or principal investigator's name). Output is available in a variety of formats and media. While information professionals cannot directly access the CRISP system, abridged CRISP records are merged into the FEDRIP (Federal Research in Progress) database, and FEDRIP is publicly accessible through DIALOG. CRISP records in toxicology are also furnished to the National Library of Medicine's TOXLINE database. This paper discusses the indexing, information retrieval, publication products, and search services of the CRISP system, and how users of medical information can benefit from it.  相似文献   

18.
通过采用单汉字索引技术在FOXPRO环境下自行设计的实验系统,以《新华日报》为例,实验比较了在自动标引方式和自由标引方式下新闻信息数据库的检索效率,并分析了两种标引方式对检索效率的影响关系,从而探讨用机器自动标引替代手工自由标引的可能性。文章还提出了改进的建议及实验需要的原则。  相似文献   

19.
电子资源的优化管理与利用   总被引:25,自引:0,他引:25  
提出电子资源优化管理的一种模式:通过将电子资源加入OPCA系统,建立电子资源导航系统,将文摘索引数据库与全文数据库的OPCA相链接,建立分布式跨库检索系统,以期构筑一个多维的、具有网状框架结构的电子资源管理系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号