基于词向量的话题焦点识别方法 |
| |
引用本文: | 张佩瑶,刘东苏.基于词向量的话题焦点识别方法[J].情报科学,2019,37(7):61-64. |
| |
作者姓名: | 张佩瑶 刘东苏 |
| |
摘 要: | 【目的/意义】移动互联网时代,微博以其快速、便捷的优点迅速成为信息传播与共享的平台之一。在互联 网信息传播过程中,话题内容焦点会随着时间推动发生动态迁移,及时准确的发现话题内容焦点的迁移有助于了 解网络舆情的演化趋势。【方法/过程】首先,定义基于焦点特征词分布的焦点词提取公式,构造焦点特征词集合;然 后,使用Skip-gram模型在大规模语料上训练得到词向量,再通过BTM对文本建模,直接在BTM主题维上结合焦 点特征词集合构造主题词向量;最后,计算主题特征词间的相似度,将其应用到聚类算法中实现话题焦点识别。 【结果/结论】通过对新浪微博数据集上的实验结果表明,本方法能够充分利用词向量引入的语义信息,提高文本聚 类效果,有效的获取各阶段的话题焦点。
|
|
| 点击此处可从《情报科学》浏览原始摘要信息 |
|
点击此处可从《情报科学》下载全文 |
|