首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于潜在语义空间的文本检索问题研究
引用本文:刘海峰,王元元,张学仁.基于潜在语义空间的文本检索问题研究[J].情报科学,2007,25(5):748-753.
作者姓名:刘海峰  王元元  张学仁
作者单位:1. 解放军理工大学,理学院,江苏,南京,210027
2. 解放军理工大学,指挥自动化学院,江苏,南京,210007
摘    要:本文针对潜在语义空间模型下文本检索存在的问题进行了研究;对LSI/SVD方法的理论及问题进行探讨,对文本一特征项矩阵加权方式进行了改进,对文本的聚类提出了k—means截尾算法,对原始向量空间降秩后的语义空间维数的确定提出了解决方法。

关 键 词:潜在语义索引/奇异值分解  聚类  位置加权  k-means截尾算法
文章编号:1007-7634(2007)05-0748-06
收稿时间:2006-05-10
修稿时间:2006-05-10

Research on Text- Retrieval Problems Based on Latent Semantic Space
LIU Hai-feng,WANG Yuan-yuan,ZHANG Xue-ren.Research on Text- Retrieval Problems Based on Latent Semantic Space[J].Information Science,2007,25(5):748-753.
Authors:LIU Hai-feng  WANG Yuan-yuan  ZHANG Xue-ren
Institution:1. Science School, PIA Science and Engineering , Nanjing 210027, China; Command Automatisn School, PIA Science and Engineering, Nanjing 210007, China
Abstract:In this paper, we discuss several text retrieval problems under LSI/SVD Model. We sum up the theory and method and then put forward an improved model in the weighting of paper- term matrix. We put up a new arithmetic in the paper clustering, and sum up a new method in fixxing on the semantic space dimension.
Keywords:LSI/SVD  clustering  position weighting  k - means truncation arithmetic
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号