首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于混合策略的中文生物医学领域未登录词识别研究
引用本文:孙海霞,李军莲,吴英杰,吴夙慧.基于混合策略的中文生物医学领域未登录词识别研究[J].现代图书情报技术,2013(1):15-21.
作者姓名:孙海霞  李军莲  吴英杰  吴夙慧
作者单位:中国医学科学院医学信息研究所;南京大学信息管理系
基金项目:国家“十二五”科技支撑计划项目“科技知识组织体系的协同工作系统和辅助工具开发”(项目编号:2011BAH10B02);中国医学科学院医学信息研究所基本科研业务专项“基于CMeSH的中文生物医学文献文本概念映射研究”(项目编号:10R0115)的研究成果之一
摘    要:简述中文未登录词识别研究现状,结合中文生物医学领域词长分布和构词特点,提出以N-gram为基础,综合利用领域词典、语料和规则的中文生物医学领域未登录词识别方案,并以中国生物医学文献数据库中药学期刊数据作为样本集进行实验,效果表现良好。

关 键 词:未登录词  N-gram  混合策略  生物医学

The Study on Out-of-vocabulary Identification of Chinese Biomedical Field Based on Hybrid Method
Sun Haixia,Li Junlian,Wu Yingjie,Wu Suhui.The Study on Out-of-vocabulary Identification of Chinese Biomedical Field Based on Hybrid Method[J].New Technology of Library and Information Service,2013(1):15-21.
Authors:Sun Haixia  Li Junlian  Wu Yingjie  Wu Suhui
Institution:1(Institute of Medical Information,Chinese Academy of Medical Sciences,Beijing 100020,China) 2(Department of Information Management,Nanjing University,Nanjing 210093,China)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号