首页 | 本学科首页   官方微博 | 高级检索  
     检索      

网络舆情信息提取与预处理研究
引用本文:陈桂鸿,曹树金,陈忆金.网络舆情信息提取与预处理研究[J].图书情报知识,2011(6):50-54.
作者姓名:陈桂鸿  曹树金  陈忆金
作者单位:1. 深圳腾讯计算机科技有限公司,深圳,518057
2. 中山大学资讯管理学院,广州,510006
3. 仲恺农业工程学院,广州,510225
基金项目:广东省教育厅产学研合作专项资金项目“网络舆情智能监测与分析系统”(2007A090302027)成果之一
摘    要:本研究针对舆情信息源特征就舆情信息增量采集、提取和存储、文本信息预处理提出了基于Web—Harvest的定点信息采集以及基于输入法平台的新词收集策略,构建了一个互联网用语扩展词库,实现了信息预处理关键模块。

关 键 词:网络舆情  信息提取  文本预处理  中文分词  句法分析

A Study on Infor mation Extraction and Preprocessing of Online Public Opinion
Abstract:According to the characteristics of the online public opinion information resources,in order to realize the information incremental acquisition,information extraction and storage,and text preprocessing,a strategy of information collection basing on the Web-Harvest,and a strategy of new word collection basing on the input platform were proposed in this study.A expansion thesaurus of internet terms was build,and the information pre-processing module was achieved.
Keywords:Online public opinion Information extraction Text preprocessing Parsing  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号