首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于图结构的中文文本表示方法研究
引用本文:吴江宁,刘巧凤.基于图结构的中文文本表示方法研究[J].情报学报,2010,29(4).
作者姓名:吴江宁  刘巧凤
作者单位:大连理工大学系统工程研究所,大连,116024
基金项目:国家自然科学基金资助项目,国家高技术研究发展计划(863计划)资助项目 
摘    要:为解决基于统计的文本表示模型的信息缺失问题,本文提出了一种考虑词间语义和语序信息的基于图结构的中文文本表示方法,其思想是将文本的特征项表示成图结构中的节点,特征项间的关系表示成节点间的有向边,据此可将文本表示成由节点和有向边组成的图结构,并且将边赋予权重信息,该模型较大程度地保留了原文本的结构信息及语义信息.中文语料测试结果表明,基于图结构的文本表示方法对复杂文本语料的分类问题十分有效.对于简短文本语料,本文提出扩展特征项共现单元的修正方法,提高了图结构中文文本表示方法的普遍适用性.

关 键 词:图结构模型  文本表示  文本相似度  最大公共子图

Research on Graph Structure Based Method for Chinese Text Representation
Wu Jiangning,Liu Qiaofeng.Research on Graph Structure Based Method for Chinese Text Representation[J].Journal of the China Society for Scientific andTechnical Information,2010,29(4).
Authors:Wu Jiangning  Liu Qiaofeng
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号