首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于LDA的新闻稿件话题树构建方法
引用本文:乔爱军.基于LDA的新闻稿件话题树构建方法[J].中国传媒科技,2016(4):52-54.
作者姓名:乔爱军
作者单位:新华社技术局多媒体与数据库系统部
摘    要:随着互联网的发展,信息呈现指数级增长,随着微博等新闻自媒体的出现,新闻的数据量出现爆炸性增长。面对海量的文本信息,发现其中的话题特征并依据特征进行文本分类,可以有效提升用户性信息获取效率。本文通过采用LDA算法构建基础话题树,并在此基础进行话题的实时扩充和话题树的结构优化,可以有效地提升海量稿件话题聚类效率和效果。

关 键 词:LDA  TFIDF  话题树  新闻稿件聚类
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号