首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验
引用本文:查贵庭,侯汉清.基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验[J].情报学报,2002,21(3):273-277.
作者姓名:查贵庭  侯汉清
作者单位:南京农业大学信息管理系,南京,210095
基金项目:国家社科基金资助,课题编号 :98BTQ0 0 7
摘    要:避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。

关 键 词:新闻标引  自动标引  自动分类  词表技术  自然语言标引
修稿时间:2001年3月4日

Automatic Indexing Based on Multi-vocabularies
Zha Guiting and Hou Hanqing.Automatic Indexing Based on Multi-vocabularies[J].Journal of the China Society for Scientific andTechnical Information,2002,21(3):273-277.
Authors:Zha Guiting and Hou Hanqing
Abstract:The paper proposed a technique of automatic word-extracting based on multiple vocabularties so as to avoid the technical difficulties of word-segmenting in Chinese.These vocabularies are as follows:stop-list,synonymous list,keyword list,thesaurus,concordance of keyword string VS class number,etc.,their function,construction and application are detailed.The paper introduces and evaluates the automatic indexing system of economic news of Xinhua News Agency.
Keywords:news database  automatic indexing  automatic classifying  word-extracting  vocabulary construction  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号