首页 | 本学科首页   官方微博 | 高级检索  
     检索      

融合多策略的短语识别方法
引用本文:胡小荣,姚长青,高影繁.融合多策略的短语识别方法[J].情报科学,2019,37(6):49-54.
作者姓名:胡小荣  姚长青  高影繁
作者单位:中国科学技术信息研究所
摘    要:【目的/意义】针对基于统计特征的短语识别方法存在的噪声问题,提出了融合多策略的短语识别方法。【方法/过程】该方法融合多统计量提取候选短语,并基于停用词表进行初步过滤,利用词向量较强的语义表达能力对候选短语进行过滤,以提高短语识别的准确率。在环保领域专利语料上进行实验,利用搜狗新闻语料与中文专利数据训练词向量库进行短语识别优化。【结果/结论】该方法对于语料规模较小以及阈值较低的结果过滤还有待进一步研究。实验结果表明,融合深度学习的方法提高了短语识别的准确率。

关 键 词:短语识别  词向量  Word2Vec  互信息  邻接熵

A Multi-Strategy-Based Phrase Recognition Method
HU Xiao-Rong,YAO Chang-Qing,GAO Ying-Fan-.A Multi-Strategy-Based Phrase Recognition Method[J].Information Science,2019,37(6):49-54.
Authors:HU Xiao-Rong  YAO Chang-Qing  GAO Ying-Fan-
Institution:(Institute of Scientific and Technical Information of China. Beijing 100038. China)
Abstract:HU Xiao-rong;YAO Chang-qing;GAO Ying-fan(Institute of Scientific and Technical Information of China. Beijing 100038. China)
Keywords:phrase recognition  word vector  Word2Vec  mutual information  information entropy
本文献已被 维普 等数据库收录!
点击此处可从《情报科学》浏览原始摘要信息
点击此处可从《情报科学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号