首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于SUMO和WordNet本体集成的文本分类模型研究
引用本文:胡泽文,王效岳,白如江.基于SUMO和WordNet本体集成的文本分类模型研究[J].现代图书情报技术,2011,27(1):31-38.
作者姓名:胡泽文  王效岳  白如江
作者单位:山东理工大学科技信息研究所 淄博 255049
基金项目:本文系国家社会科学基金一般项目“海量网络学术文献自动分类研究”(项目编号:10BTQ047)和教育部人文社会科学研究规划一般项目“基于本体集成的文本分类关键技术研究”(项目编号:09YJA870019)的研究成果之一。
摘    要:针对传统文本分类方法和目前语义分类方法中存在的问题,提出基于SUMO和WordNet本体集成的文本分类模型,该模型利用WordNet同义词集与SUMO本体概念之间的映射关系,将文档-词向量空间中的词条映射成本体中相应的概念,形成文档-概念向量空间进行文本自动分类。实验表明,该方法能够极大降低向量空间维度,提高文本分类性能。

关 键 词:SUMO本体  WordNet  本体集成  文本分类模型  词向量空间  概念向量空间
收稿时间:2010-11-02
修稿时间:2010-12-08

Study on Text Classification Model Based on SUMO and WordNet Ontology Integration
Hu Zewen Wang Xiaoyue Bai Rujiang.Study on Text Classification Model Based on SUMO and WordNet Ontology Integration[J].New Technology of Library and Information Service,2011,27(1):31-38.
Authors:Hu Zewen Wang Xiaoyue Bai Rujiang
Institution:Institute of Scientific & Technical Information, Shandong University of Technology, Zibo 255049, China
Abstract:Aiming at the existing problems in the traditional text classification methods and the current semantic classification methods, a new text classification model based on SUMO and WordNet Ontology integration is proposed. This model utilizes the mapping relations between WordNet synsets and SUMO Ontology concepts to map terms in document-words vector space into the corresponding concepts in Ontology, and forms document-concepts vector space to classify texts automatically. The experiment results show that the proposed method can greatly decrease the dimensionality of vector space and improve the text classification performance.
Keywords:SUMO Ontology  WordNet  Ontology integration  Text classification model  Word vector space  Concept vector space
本文献已被 CNKI 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号