杜慧平,何 琳,侯汉清.基于聚类分析的自然语言叙词表的自动构建[J].国家图书馆学刊,2007,16(3): |
基于聚类分析的自然语言叙词表的自动构建 |
|
|
中文关键词: 叙词表 自然语言 信息检索 自动构建 概念空间 |
英文关键词: |
基金项目: |
|
摘要点击次数: 20 |
全文下载次数: 1 |
中文摘要: |
叙词表为信息标引和检索提供恰当的词汇选择及概念语义关系。手工编制词表费事费时,智力要求高,难以克服认知瓶颈。词表自动构建另辟蹊径,通过统计挖掘语料库中潜在的词汇语义关联。构建方法主要有合并现有词表、用户生成词表、通过语法分析自动构建词表、通过同现分析自动构建词表等。其中通过同现分析构建自然语言词表方法分为词汇收集、关联度计算、聚类分析三个阶段,该方法具有良好的应用前景,对中文信息检索系统具有重要的借鉴意义。参考文献19。 |
英文摘要: |
|
查看全文
下载PDF阅读器 |
关闭 |
|
|
|
|
|