基于LDA的新闻稿件话题树构建方法 |
| |
引用本文: | 乔爱军.基于LDA的新闻稿件话题树构建方法[J].中国传媒科技,2016(4):52-54. |
| |
作者姓名: | 乔爱军 |
| |
作者单位: | 新华社技术局多媒体与数据库系统部 |
| |
摘 要: | 随着互联网的发展,信息呈现指数级增长,随着微博等新闻自媒体的出现,新闻的数据量出现爆炸性增长。面对海量的文本信息,发现其中的话题特征并依据特征进行文本分类,可以有效提升用户性信息获取效率。本文通过采用LDA算法构建基础话题树,并在此基础进行话题的实时扩充和话题树的结构优化,可以有效地提升海量稿件话题聚类效率和效果。
|
关 键 词: | LDA TFIDF 话题树 新闻稿件聚类 |
本文献已被 CNKI 维普 等数据库收录! |
|