首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文本体的自动获取与评估算法分析
引用本文:董慧,余传明.中文本体的自动获取与评估算法分析[J].情报理论与实践,2005,28(4):415-418.
作者姓名:董慧  余传明
作者单位:1. 武汉大学信息资源研究中心,湖北,430072
2. 武汉大学信息管理学院,湖北,430072
基金项目:国家自然科学基金项目“基于本体的数字图书馆信息检索模型研究”的研究成果之一,项目编号:70373047
摘    要:在下一代互联网,即语义网中,信息模式建立在本体描述之上。由于手工构建本体是一项工作量巨大并且繁杂的任务,因而,能否自动构建本体正逐渐成为语义网使用的关键性要素。在这样的背景下,本文对比和借鉴了国内外本体自动获取的方法和思路,将中文领域本体的提取划分为文本预处理、本体抽取和本体关系获取三个阶段。接着,本文讨论了这三个步骤所涉及的算法,包括基于统计模式对文本抽词、基于奇异值分解从词—文档矩阵中提取本体、基于语义相似度对本体进行聚类等。对于本体自动获取的效果评估,本文提出了利用计算手工和自动两种方式得到的本体相似度来进行衡量的思路。

关 键 词:信息检索  评估  算法/本体  语义网
修稿时间:2005年1月7日

Analysis of Automatic Chinese Ontology Learning and Its Evaluation Algorithm
Dong Hui et al..Analysis of Automatic Chinese Ontology Learning and Its Evaluation Algorithm[J].Information Studies:Theory & Application,2005,28(4):415-418.
Authors:Dong Hui
Institution:Dong Hui et al.
Abstract:Automatic ontology learning has become a focus and also a bottleneck in the field of Semantic Web, as manual construction of ontology will require tremendous efforts.In this background, this paper divides Chinese ontology learning into three steps: text pre-processing, ontology extraction and ontology taxonomy building.The paper also analyzes the algorithm of statistics-based term extraction, normalization, term-document matrix construction, singular value decomposition, and hierarchical agglomerative clustering. In order to evaluate the result of automatic-learned ontology, this paper provides some ways to measure the exactness of auto-learned ontology by counting the lexical similarity and semantic similarity between the auto-learning and manual-built ontology.
Keywords:information retrieval  evaluation  algorithm/ontology  Semantic Web
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号