首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于术语抽取技术的新闻新词发现方法研究
引用本文:张苏,梁颖红,牛丽.基于术语抽取技术的新闻新词发现方法研究[J].苏州市职业大学学报,2014(3):14-16.
作者姓名:张苏  梁颖红  牛丽
作者单位:苏州市职业大学计算机工程学院,江苏苏州215104
基金项目:国家自然科学基金资助项目(61100138); 苏州市云计算及智能信息处理重点实验室开放基金项目(SXZ201303); 苏州市科技计划项目(SZS201201); 江苏省教育科学“十二五”规划课题资助项目(C-b/2013/03/005)
摘    要:新闻新词的识别在中英文翻译、手机应用推送等方面有着重要作用.通过对网络新闻新词的使用情况、新闻新词的来源和特点的分析,提出一种基于混合策略的高精度长术语抽取技术新闻新词发现的方案.在通过预处理的网络新闻语料中,计算基于词汇NC-value值的互信息以确定词汇内部结构的结合性,通过新闻新词规则处理进行新闻新词发现。

关 键 词:中文信息处理  新词发现  互信息  NC-value

Research on News Neologisms Identifi cation with Long Term Extraction Technology
ZHANG Su,LIANG Ying-hong,NIU Li.Research on News Neologisms Identifi cation with Long Term Extraction Technology[J].Journal of Suzhou Vocational University,2014(3):14-16.
Authors:ZHANG Su  LIANG Ying-hong  NIU Li
Institution:(School of Computer Engineering, Suzhou Vocational University, Suzhou 215104, China)
Abstract:The news neologisms identification technology can be used in such areas as English-Chinese translation,mobile software information push and so on.This paper first analyzes the usage of news neologisms,then the origins and features of news neologisms.A News Neologisms Identification method is proposed,which is based on a hybrid strategy with high precision long terms' extraction for high precision.Based on the preprocessed network news corpus,the mutual information value is calculated by the NC-value parameter so as to ascertain the associativity of inner structure of words and expressions in an effort to discover news neologisms by means of filter rules.
Keywords:Chinese information processing  news neologism identification  mutual information  NC-value
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号