首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 27 毫秒
1.
通过对区域化教育资源建设不均衡进行阐述,分析了区域化教育资源不均衡存在的问题;提出了实行政府主导、企业投资、用户租用服务的区域教育云计算服务平台模式.通过政府引导与监管,利用信息化教育手段为桥梁,建立基于云计算服务理念构建的资源共建、共享解决方案,实现区域教育资源均衡发展模式.  相似文献   

2.
基于样本加权的文本聚类算法研究   总被引:3,自引:0,他引:3  
样本加权聚类算法是一种最近才引起人们注意的算法,还存在一些需要解决的问题,例如,聚类对象之间的结构信息对样本加权聚类是否有帮助,如何将结构信息自动转换为样本或对象的权重?针对该问题,本文以学术论文为聚类对象,以K-Means算法为聚类算法基础,利用论文之间的引用关系计算每篇论文的PageRank值,并将其作为权重,提出一种基于样本加权的新的文本聚类算法.实验结果表明,基于论文PageRank值加权的聚类算法能改善文本聚类效果.该算法可推广到网页的聚类中,利用网页的PageRank进行加权聚类,来改善网页的聚类效果.  相似文献   

3.
传统的聚类算法直接用于文本聚类这一应用上,存在的突出问题就是传统的聚类算法只负责将对象进行聚类,不负责对聚类后生成的类簇进行概念描述和解释.标注文本集合聚类后生成的类簇被称为聚类描述问题.聚类描述可以帮助用户迅速确认生成的文档类别与其需求是否相关,它是文本聚类应用中一项重要并富有挑战性的任务.针对文本聚类结果可读性较弱问题,本文提出了一种增强聚类结果的可理解性与可读性的算法,即基于支持向量机的文本聚类结果描述算法.实验结果表明基于支持向量机的聚类描述算法所取得的效果要优于常规的聚类结果描述方法.  相似文献   

4.
聚类搜索引擎探究   总被引:1,自引:0,他引:1  
一批代表性的聚类搜索引擎的出现,使得聚类搜索引擎的优劣逐步为公众所知.采用聚类算法、重视结果的显示方式、关注用户提问信息、提供个性化服务均是聚类搜索引擎最显著的优点,应该引起足够的重视.针对过分依托原生搜索引擎、没有形成专用聚类算法、搜索速度相对较慢、聚类层次有限等现状,作者最后还对聚类搜索引擎的发展提出了一些建议,比如实现人工聚类与自动聚类结合、增加学术趋势分析功能、加强相关度研究等.  相似文献   

5.
科技期刊元数据异构共享是数字图书馆建设的重要内容。本文针对科技期刊的元数据异构问题,从本体建模、元数据处理、语义出版、语义Web集成服务平台等方面提出利用语义Web解决科技期刊元数据异构共享问题的具体方案,为数字图书馆建设中期刊资源异构共享问题的解决提供借鉴。  相似文献   

6.
针对现有元数据解决方案的不足,设计了一种基于Web服务的元数据体系。该体系采用XML/RDF技术和Web服务技术,用Web元数据资源来准确描述各类信息资源,并封装成Web服务,用户通过调用Web服务实现对元数据的使用。该体系旨在解决在信息资源系统中多种元数据并存的情况下所存在的互操作问题,实现多个信息资源系统之间的无缝连接,为用户提供一个统一、透明、高效的信息检索平台。  相似文献   

7.
刁羽 《河北科技图苑》2014,(2):26-28,48
介绍了四川省高校文献保障体系SCALIS,探讨了基于共建共享方案下四川省高校文献保障体系建设的核心内容:基于元数据的图书馆资源整合、馆与馆之间的资源共知共享,并提出四川省高校文献保障体系建设中需要注意的问题,旨在完善SCALIS的服务功能与提高资源共享程度。  相似文献   

8.
本文从信息论的角度考虑了聚类问题,将聚类看成是有损信息压缩的过程.首先运用率失真理论建立了模糊聚类的优化模型,与经典的模糊聚类模型相比,模型的目标函数中多了一个描述聚类过程复杂度的指标.同时为了估计聚类数目,还提出了一个新的聚类有效性指标.其次通过求解优化模型得到基于率失真理论的模糊聚类算法.最后将基于率失真理论的模糊聚类算法与经典模糊C均值算法进行了数值实验比较.数值实验结果表明基于率失真理论的模糊聚类算法能够自动确定聚类数目,在运行时间上比模糊C均值算法有一定减少,且最终的模糊划分矩阵与模糊C均值算法相比有较少的模糊性,因而聚类结果更加明确可靠.  相似文献   

9.
机构知识库元数据的自动生成与评估研究   总被引:1,自引:0,他引:1  
由于当今的信息中心和图书馆需要按照终端用户的需求来提供信息和知识的共享服务,机构知识库正受到越来越多的学术机构的重视.机构知识库的服务质量主要取决于数字资源的元数据质量.相比于人工生成元数据,自动生成元数据的成本低、效率高、更加公正可靠.文章基于元数据抽取和收集两种方法,提出元数据自动生成系统的框架结构,并分析讨论了元数据完整性和精确性这两个主要的评价指标,以期对自动生成的元数据质量进行科学的评估.  相似文献   

10.
潘小凤 《图书馆学刊》2013,(11):109-111,138
介绍了数据挖掘中聚类算法的定义、功能及常用算法,并根据南京化工职业技术学院的实际情况,构建数据源,设计基于聚类算法的图书馆书目推荐服务.  相似文献   

11.
基于WEB日志挖掘的网站个性化服务研究   总被引:1,自引:0,他引:1  
论述了基于Web日志挖掘的网站个性化服务,提出了利用Web日志挖掘的个性化服务中频繁访问路径的挖掘及用户聚类和页面聚类。利用这些算法推动Web站点从“站点为中心”向“用户为中心”的发展,即站点不但要针对用户共同感兴趣的信息服务,更要有针对每个用户的个性化服务。  相似文献   

12.
K-means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题.本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K-means改进算法.该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类.算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K-means算法的初始聚类中心.第二步聚类则依据文献内容实现K-means算法.实验通过与经典K-means算法和基于凝聚层次聚类算法的改进K-means算法的对比,证明了本文提出的改进的K-means算法具备更优的聚类效果.  相似文献   

13.
针对某政府网站某一时间段的服务器日志中抽取出的搜索引擎查询信息,提出了一系列规则来遴选出有代表性的核心查询词,并分别针对每个核心查询词进行共现与可视化聚类分析,创建基于共现频率的相似矩阵,采用非计量MDS算法导出三维可视化聚类图,并且采用基于瓦兹算法(Wards method)的层次聚类法验证了MDS算法三维可视化聚类结果的正确性、有效性与优越性.同时,我们针对日志的特点开发了适合本研究的一系列分析工具,从而能够帮助我们对同类网站、不同结构的日志信息进行挖掘、提取、选择和加工,并利用统计分析工具对加工结果进行可视化聚类分析和比较研究.实验结果表明,本分析方法充分发挥了MDS分析方法与各种向量空间聚类计算优点,能更好地观察对象间的聚类样式、形状以及距离,能够为构建基于主题图的政府电子政务平台优化研究提供理论方法和实证依据.  相似文献   

14.
基于关键词和摘要相关度的文献聚类研究   总被引:1,自引:0,他引:1  
现有的文献聚类方法都是通过文献关键词来进行的.本文在研究大量文献聚类方法的基础上,提出了一种通过文献关键词和摘要进行加权的新的文献聚类算法.首先,改进了传统相似度计算的方法,设计出基于关键词和摘要词加权的相似度公式,使文献相似度计算更加精确.其次,基于"文献距离越大,聚为一类的概率越小"的思想,提出了一种"最大距离聚类法",并给出了算法的详细步骤.最后,实现算法并进行了大量的实验仿真.通过改进相似度计算公式,调整关键词和摘要词的权重,提高了聚类的质量.结果表明,本文提出的文献聚类算法是一种行之有效的方法.  相似文献   

15.
本文主要研究了在有限资源约束下的数据流聚类方法.针对海量,高速的数据流,现有聚类方法在有界内存和有界时间的限制下,难以快速有效地进行聚类,设计了一种基于主成分和密度的动态数据流聚类算法,PDStream算法.它采用滑动窗口管理数据流;首先使用主成分模型作为前置系统,它负责对基本窗口内的源数据进行属性转换,起到了降维的作用;然后使用密度聚类模型作为后置系统进行聚类操作;最后对系统中生成的概要数据进行简化的二次聚类并更新聚类簇.通过实验表明,PDStream算法有效克服了STREAM算法使得聚类受控于历史数据的缺点,显现出处理海量数据的优越性以及聚类质量高的特点.  相似文献   

16.
面向知识导航的机构要素元数据规范及互操作   总被引:1,自引:0,他引:1  
本文针对当前知识导航领域内由于信息资源的元数据规范标准存在的差异而导致的元数据映射困难等问题,阐述了知识导航要素的概念,以及知识导航要素对不同标准间元数据互操作功能的支持.以知识导航要素中的机构要素为代表,针对机构要素的特征,以复用DC元数据集为基础,根据信息资源的特征自定义扩展元素,做出相应的元数据规范.采用一种新的元数据映射方法来描述机构元素的元数据互操作,利用RDF/XML构建知识导航中的元数据互操作模型,针对当前知识导航领域内因元数据标准不同而造成知识关联和知识共享困难等问题提供了一个有价值的解决方法,弥补了知识导航要求下元数据规范中Dublin Core所存在的不足.  相似文献   

17.
协同推荐中基于用户-文档矩阵的用户聚类研究*   总被引:1,自引:0,他引:1  
针对个性化推荐服务的需要以及用户聚类处理时用户-文档访问数据的高维稀疏性问题,采用“比对降维”的思想和K层次聚类算法,分析基于用户资源评价数据的用户聚类处理流程。在此基础上,采用Java开源技术设计并实现一个用户聚类的试验系统。  相似文献   

18.
针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数 据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领域知识的共享和语义表达,提高元数据的检索效率和查准率,为用户和应用提供语义查询和信息汇集能力。  相似文献   

19.
面向网络问答社区海量问题内容组织的现实需求,针对用户提问的文本特点对其进行多层次主题聚类与图谱构建。通过充分融合Glove和Word2vec算法的优势,对用户提问进行文本特征表示。在此基础上利用不同聚类算法对用户提问进行多层次聚类,并利用TextRank生成聚类标签,然后基于主题间层次结构,利用图模型将不同提问文本的关联关系呈现出来,从而构建网络问答社区用户提问主题聚类图谱,以此提升网络问答社区平台知识资源的组织与利用效率,为知识查询和推荐提供索引。  相似文献   

20.
学习共享空间通过融合实体和虚拟两种空间环境,为学习者营造了学习交流互动的资源和服务一体化环境.学习共享空间环境下,开展互动服务的要素主要包括人员、技术、设施、资源四个要素.通过四个要素的整合与协作,构建基于学习共享空间的图书馆与用户多维互动的模型,突显图书馆服务的泛在化,以此作为提升学习共享空间服务质量的有效手段.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号