首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于跨语言文本分类的多语资源组织方法研究
引用本文:高影繁,徐红姣,于薇,王惠临.基于跨语言文本分类的多语资源组织方法研究[J].情报理论与实践,2011,34(10).
作者姓名:高影繁  徐红姣  于薇  王惠临
作者单位:中国科学技术信息研究所,北京,100038
基金项目:中国博士后科学基金项目“基于查询分类的跨语言检索查询翻译消歧技术研究”(项目编号:20090450465); 中国科学技术信息研究所2010学科建设项目“自然语言处理”(项目编号:XK2010-6);中国科学技术信息研究所2010重点工作项目“多语言信息检索与翻译研究和应用工程”(项目编号:ZD2010-3-3)的研究成果
摘    要:文章以国家图书文献中心(NSTL)的多语种科技语料为研究对象,以一部科技类的英汉双语科技词典为资源工具,提出一种英汉跨语言文本分类系统的构建方法,实验结果验证了采用本方法进行跨语言分类的可行性,也为下一阶段建立跨语言分类实用系统奠定了基础。

关 键 词:文本分类  翻译词典  信息资源  算法

Research on Multilingual Information Resources Organization Method Based on Cross-language Text Classification
Gao Yingfan et al..Research on Multilingual Information Resources Organization Method Based on Cross-language Text Classification[J].Information Studies:Theory & Application,2011,34(10).
Authors:Gao Yingfan
Institution:Gao Yingfan et al.
Abstract:Taking the multilingual corpus of the National Science and Technology Library(NSTL) as an object of study,this paper proposes a method of constructing an English-Chinese cross-language text classification system with the help of a English-Chinese bilingual scientific and technological dictionary.The experimental results prove the feasibility of using this method to perform cross-language classification.The paper lays a foundation for constructing a future practical cross-language classification system.
Keywords:text cltegorization  translation dictionary  information resources  algorithm  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号