首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   9篇
  免费   0篇
  国内免费   1篇
教育   1篇
科学研究   5篇
信息传播   4篇
  2020年   1篇
  2013年   1篇
  2011年   1篇
  2010年   3篇
  2009年   3篇
  2007年   1篇
排序方式: 共有10条查询结果,搜索用时 15 毫秒
1
1.
2.
文本挖掘与中文文本挖掘模型研究   总被引:5,自引:0,他引:5  
谌志群  张国煊 《情报科学》2007,25(7):1046-1051
文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向。最后提出了一个统一的中文文本挖掘模型——UCTMF。该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架。  相似文献   
3.
XML(可扩展标记语言)正在成为Web数据交换的标准格式.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档聚类作为XML数据处理的重要课题,是指将具有类似特征的XML文档聚集成簇.现有的大部分XML文档聚类是基于文档结构特征的.本文提出了一个新的结构与内容相结合的XML文档聚类方法.首先从文档中抽取构件向量,并把文档转换为向量化的表示.然后,在文档相似度计算的基础上,引入一个层次聚类方法对XML文档进行聚类.在DBLP XML记录集上进行的实验表明该方法具有可行性并且性能明显优于已有方法.  相似文献   
4.
文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法对主题词串进行聚类分析,从而发现主题。实验结果表明,该方法对热点主题提取有一定的效果。  相似文献   
5.
XML文档相似度计算方法研究   总被引:1,自引:0,他引:1  
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评.  相似文献   
6.
网络热点话题检测与跟踪已成为舆情分析领域的前沿研究课题,具有广阔应用前景。本文研究基于主题演化图的网络论坛(BBS)热点跟踪问题。在采用共词分析和bisecting K-means聚类算法检测BBS热点话题基础上,提出了一个综合考虑话题帖子篇数与帖子热度的热点话题关注度计算方法。然后给出了一个基于相对熵的热点话题语义距离计算方法。最后通过构造主题演化图实现BBS热点话题的自动跟踪。在由实际BBS论坛数据构成的测试集上的实验表明,本文提出的方法是有效的。  相似文献   
7.
互联网舆情挖掘研究述略   总被引:3,自引:0,他引:3  
文章首先提出互联网舆情挖掘研究的框架层次结构,详细介绍各个层次所涉及的相关研究和关键技术,为网络舆情监控和预警综合系统的构建提供参考;然后通过对现有舆情监测系统进行比较分析,从整体上了解我国的互联网舆情研究和实践应用;最后探讨互联网舆情挖掘研究中存在的问题,并对互联网舆情关键技术的研究提出解决思路.  相似文献   
8.
针对热点主题发现是在聚类算法的基础上实现的特点,将改进后的蚁群聚类算法引入到该研究中,同时提出类别关注度(CAD)的概念,以此来判定类别的热门程度并区分出热门类别和冷门类别,在此基础上抽取热点主题集。实验结果表明改进后的蚁群聚类算法对热点主题的发现有一定的效果,对其他仿生优化聚类算法的引入有借鉴意义。  相似文献   
9.
文本趋势挖掘综述   总被引:1,自引:0,他引:1  
文本趋势挖掘是文本挖掘新的研究热点,具有广阔应用前景。本文首先对文本趋势挖掘进行了概述,讨论了文本趋势挖掘的应用领域。然后综述了文本趋势挖掘的国内外研究现状,详细介绍了文本趋势挖掘的主流方法与技术,并分析了现有方法存在的主要问题。最后指出了文本趋势挖掘未来的发展方向。  相似文献   
10.
"编译原理"是计算机专业的重要专业课之一,理论性和实践性要求均很高,在计算机本科教学体系中占有十分重要的地位。设计实现了一个面向"编译原理"实验教学的可拆卸小型编译器——SMini。详细介绍了SMini的系统结构、设计方法与实现技术。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号