首页 | 本学科首页   官方微博 | 高级检索  
     检索      

BBS中文新词语自动挖掘*
引用本文:吕学强,黄河,李渝勤,施水才.BBS中文新词语自动挖掘*[J].现代图书情报技术,2007,2(1):37-39.
作者姓名:吕学强  黄河  李渝勤  施水才
作者单位:北京信息科技大学中文信息处理研究中心,北京,100101
基金项目:国家自然科学基金;北京市教委科技发展计划项目
摘    要:针对从BBS文本中自动挖掘新词语的问题,提出一种结合统计和规则的简单易行的方法,采用中文分词、频数统计、词性过滤、词语碎片组合等关键技术。据此方法开发的系统可以自动挖掘不限长度、不限领域、不限类别的与上下文无关的任意新词语。

关 键 词:新词语  统计  规则
收稿时间:2006-10-13
修稿时间:2006-10-13

Mining Chinese New Word in BBS
Lv Xueqiang,Huang He,Li Yuqin,Shi Shuicai.Mining Chinese New Word in BBS[J].New Technology of Library and Information Service,2007,2(1):37-39.
Authors:Lv Xueqiang  Huang He  Li Yuqin  Shi Shuicai
Institution:Chinese Information Processing Research Center, Beijing Information Science and Technology University, Beijing 100101, China
Abstract:A simple method using statistics and rule is presented for mining Chinese new words in BBS texts automatically, in which we use such key technologies as Chinese segmentation, frequency statistics, speech pattern filter and a series of operations on word fragments. A system developed in this method can mine random context-insensitive new words in any length and in any field, of any kind.
Keywords:Auto-mining New word Statistics Rule
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号