首页 | 本学科首页   官方微博 | 高级检索  
     检索      

XML文档相似度计算方法研究
引用本文:谌志群.XML文档相似度计算方法研究[J].情报学报,2009,28(1).
作者姓名:谌志群
作者单位:杭州电子科技大学计算机应用技术研究所,杭州,310018
摘    要:XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评.

关 键 词:XML文档  相似度计算  Web数据管理  文本挖掘

Study of XML Document Similarity Computation Methods
Chen Zhiqun.Study of XML Document Similarity Computation Methods[J].Journal of the China Society for Scientific andTechnical Information,2009,28(1).
Authors:Chen Zhiqun
Institution:Institute of Computer Application Technology;Hangzhou Dianzi University;Hangzhou 310018
Abstract:XML(eXtensible Markup Language) is emerging as a standard for information exchange among various applications on the World-Wide Web.With the widespread diffusion of semistructured data in XML format,processing and management of XML documents have already become a popular research issue.XML document similarity computation is an important subject in XML data processing research,and is the key technology of clustering and retrieval for XML documents.Since XML document is composed of structure and content,it ca...
Keywords:XML document  similarity computation  Web data management  text mining  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号