基于中文分词和词频统计的图书在线评论文本分析 |
| |
引用本文: | 张丽,张蕾,张阳,戢妍.基于中文分词和词频统计的图书在线评论文本分析[J].信息系统工程,2011(7):71-73,43. |
| |
作者姓名: | 张丽 张蕾 张阳 戢妍 |
| |
作者单位: | 南开大学商学院 |
| |
摘 要: | 网上书店除了提供品类繁多的图书外,还为读者呈现出丰富的在线评论。如何从海量书评中提取对网上书店、出版社或消费者有用的信息成为一个亟待研究的问题。通过自然语言处理的工具之一中文分词技术对图书在线评论的文本内容进行处理,基于词频统计结果提取文本关键词,从而发现读者阅读特征、评论关键要素等有价值的信息。进而以当当网的14197条图书在线评论为例,运用该文本分析方法,以评论标题和评论正文内容、图书种类、所有评论和有用评论三个维度对文本进行了比较分析。
|
关 键 词: | 在线评论 网上书店 中文分词 词频 文本分析 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|