首页 | 本学科首页   官方微博 | 高级检索  
     检索      

用于计算机辅助文献标引加工系统的自然语言词表构建*
引用本文:杨贺杨奕虹乔晓东李宁朱礼军.用于计算机辅助文献标引加工系统的自然语言词表构建*[J].现代图书情报技术,2010,26(6):17-24.
作者姓名:杨贺杨奕虹乔晓东李宁朱礼军
作者单位:(中国科学技术信息研究所北京100038) (北京万方数据股份有限公司北京100038)
基金项目:*本文系“十一五”国家科技支撑计划重点项目《知识组织系统的集成及服务体系研究与实现》子课题“基于集成词表的数据标引加工系统升级改造”(项目编号:2006BAH03B03-02)的研究成果之一。
摘    要:讨论计算机辅助标引文献加工系统中自然语言词表系统的建立过程。基于海量文献人工标引,运用计量分析法对多年来积累的人工标引词从词频、词长、词类型、词共现等多方面进行分析,重点阐述运用字面相似度计算词间关系来建立适用于机标和后控词表的自然语言词表的过程。

关 键 词:计算机辅助标引  文献加工  机标词表  关键词  字面相似度算法
收稿时间:2010-04-12
修稿时间:2010-05-10

Construction of Natural Language Thesauri for Automatic Assistant Indexing Literature System
Yang HeYang Yihong Qiao Xiaodong Li Ning Zhu Lijun.Construction of Natural Language Thesauri for Automatic Assistant Indexing Literature System[J].New Technology of Library and Information Service,2010,26(6):17-24.
Authors:Yang HeYang Yihong Qiao Xiaodong Li Ning Zhu Lijun
Institution:Yang He1,2 Yang Yihong1,2 Qiao Xiaodong1 Li Ning2 Zhu Lijun1 1(Institute of Scientific & Technical Information of China,Beijing 100038,China) 2(Beijing Wanfang Data Co.Ltd,China)
Abstract:The paper mainly discusses the construction of natural language thesauri for automatic assistant indexing literature system. Based on years of massive manual indexing keywords, it analyzes the rules of word frequency, length, type, co-occurrence, and proposes a method for constructing a thesauri of automatic assistant indexing and post controlled vocabulary.
Keywords:Automatic assistant indexing Scientific literature processing Thesauri of automatic assistant indexing Keyword Literal similarity algorithm  
本文献已被 CNKI 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号