首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
面向网络问答社区海量问题内容组织的现实需求,针对用户提问的文本特点对其进行多层次主题聚类与图谱构建。通过充分融合Glove和Word2vec算法的优势,对用户提问进行文本特征表示。在此基础上利用不同聚类算法对用户提问进行多层次聚类,并利用TextRank生成聚类标签,然后基于主题间层次结构,利用图模型将不同提问文本的关联关系呈现出来,从而构建网络问答社区用户提问主题聚类图谱,以此提升网络问答社区平台知识资源的组织与利用效率,为知识查询和推荐提供索引。  相似文献   

2.
社会化标签系统中基于密度聚类的Web 用户兴趣建模方法   总被引:1,自引:0,他引:1  
Web用户兴趣模型在个性化信息服务中有着非常重要的作用。本文利用社会化标签的独特优势,针对传统社会化标签聚类方法的局限性,提出了一种基于密度聚类的Web用户兴趣建模方法。首先建立基于社会化标签的向量空间模型,并将社会化标签表示为Web资源及其权重的形式,以此为基础利用DBSCAN算法对其进行聚类,进而依据所有Web用户的标注行为以每个聚类为中介计算特定Web用户对Web资源的兴趣度来构建Web用户兴趣模型。实验结果表明了该方法的优越性。  相似文献   

3.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

4.
用户兴趣模型的建立和维护是个性化推荐服务系统研究和开发中的一个关键问题.细粒度兴趣通过在用户兴趣特征集中区分用户的不同兴趣主题类别来发现,是对粗粒度用户兴趣的进一步挖掘和划分.本文针对以往粗粒度用户兴趣建模存在的不足,对细粒度用户兴趣建模的概念和主要方法进行简介和评述.在此基础上,提出一种基于领域本体和近邻概念聚集的细粒度用户兴趣建模方法(FUPMo).该方法通过滑动窗口控制用户兴趣概念的计算规模,通过时间窗口和兴趣衰减函数反映用户兴趣的变化.基于军用飞机领域本体OntoAvion和小规模文档库进行的实验研究表明,该细粒度用户兴趣建模方法在应用上具备有效性.  相似文献   

5.
个性化知识服务中基于Ontology的用户兴趣挖掘研究   总被引:2,自引:1,他引:1  
个性化知识服务是知识经济时代信息服务发展的必然趋势,是满足信息用户多样化、专门化知识需求的高层次服务模式.用户兴趣知识的挖掘和用户兴趣模型的建立是个性化知识服务的重要研究内容.本文将Ontology技术与个性化知识服务结合起来,研究用户兴趣知识的Ontology表示,并以此为基础提出了一种动态的用户兴趣学习和挖掘方法,分析了该方法中参考Ontology的建立、用户兴趣知识的初步学习和用户兴趣模型的完善等关键步骤.研究结果表明,基于Ontology的用户兴趣挖掘可以较为准确地表示、跟踪和学习用户的个性化知识,实现隐性用户兴趣的发现和利用,满足用户特殊的信息需求,是一种提高个性化知识服务质量的有效方法.  相似文献   

6.
RBF神经网络构造的关键问题是中心的选取,动态K-均值聚类算法采用调整聚类中心的方法,使网络中心的选择更精确。本文先简介了RBF神经网络的结构原理,然后将动态K-均值算法应用于BRF神经网络的中心选取,最后进行了仿真实验。实验结果表明采用动态K-均值算法确定中心的RBF神经网络逼近性能更好,具有较强的实用性。  相似文献   

7.
基于C/S的新一代智能化、个性化搜索引擎   总被引:3,自引:0,他引:3  
本文探讨一个基于C/S的新一代智能化、个性化搜索引擎。整个搜索引擎分为客户端和服务器端两大部分。在客户端,智能代理Agent在个性化模型数据库的支持下产生个性化的检索要求,送往服务器。服务器端为了实现个性化服务,利用领域知识库和兴趣库对原始网页数据库进行数据挖掘,聚类形成各个类型的网页索引数据库。本文并给出了用户兴趣模型算法、挖掘用户兴趣关联规则的Apriori算法和K-modes聚类算法。  相似文献   

8.
基于WEB日志挖掘的网站个性化服务研究   总被引:1,自引:0,他引:1  
论述了基于Web日志挖掘的网站个性化服务,提出了利用Web日志挖掘的个性化服务中频繁访问路径的挖掘及用户聚类和页面聚类。利用这些算法推动Web站点从“站点为中心”向“用户为中心”的发展,即站点不但要针对用户共同感兴趣的信息服务,更要有针对每个用户的个性化服务。  相似文献   

9.
企业知识发现中的个性化Web推荐服务研究   总被引:6,自引:1,他引:5  
李勇  苏新宁  邓三鸿  任皓  周军  孔敏 《情报学报》2003,22(3):347-353
本文主要论述企业知识发现中基于个性化服务的Web推荐构成 ,提出了基于个性化技术构建用户兴趣模型的算法。文章根据用户有无介入兴趣模型构建的学习过程区分n元预测模型、用户兴趣关联规则库及利用用户兴趣词典进行Web页面请求预测的算法。最后介绍了Agent技术在企业个性化Web推荐系统中的应用  相似文献   

10.
论文探讨利用R语言工具对图书馆新浪微博数据进行子主题聚类和挖掘,指出:在文本分词、构建词频——文档矩阵的基础上,使用Pamk算法和Kmeans算法进行微博聚类,获取图书馆服务质量评价与建议信息,挖掘图书馆核心微博用户,便于图书馆利用微博数据评估服务效果,改进服务质量。  相似文献   

11.
基于XML的MARC研究   总被引:4,自引:1,他引:3  
本文分析了机读目录MARC在未来数字化图书馆应用的局限性,并提出了改进方案,以哈尔滨工业大学为例,对其采用的中文机读目录CNMARC格式进行了XML转换的尝试,从而使得MARC书目数据库和Internet上的非书目数据库的集成成为可能.本文的研究对于现有MARC数据在未来数字图书馆中的利用具有重要意义.  相似文献   

12.
选取新浪微博为研究对象,探究我国“微博问政”的现状。分别从微博基本信息、使用状况、问政互动状况三个方面对新浪微博的624个政务微博进行跟踪考察,旨在对“微博问政”进行基于数据的、全局性的描述分析,探讨“微博问政”的广度、深度和效度,指出我国当前“微博问政”存在的问题与发展方向。  相似文献   

13.
Web 信息检索(Information Retrieval)技术研究是应用文本检索研究的成果,它结合Web图论的思想,研究Web上的信息检索,是行之有效的Web知识发现的途径。传统HITS方法所获得的信息精确度相当低,而PageRank作为一通用的搜索方法,不能够应用于特定主题的信息获取。在充分分析了PageRank、HITS等现有算法和Web文档的相似度计算方法的基础上,提出了Web上查询特定主题相关信息发现的RG-HITS算法。它结合了Web超链接、网页知识表示的信息相关度以及HITS方法来搜索Web上特定主题的相关知识。  相似文献   

14.
彭远方  陈冲 《新闻界》2008,(1):19-21
本文从传播学和社会学的视角,以定性与定量研究相结合的方法,分别从网名、聊天形式、聊天对象、聊天内容、聊天语言等方面对青少年使用QQ的情况进行了分析。  相似文献   

15.
今年"五一",七天长假,神州大地涌动着阵阵旅游热浪. 我凭借着一台电脑、一只调制解调器和一根电话线,"坐地日行八万里",来了一番不寻常的神州兰台网上游,北至东北的吉林,南至海南的琼兰阁,西至甘肃的酒泉,东至东海之滨的上海,造访了全国己开通的10多家档案信息网站,领略了各地兰台网站的不同风采.可谓收获不小,感触颇多.  相似文献   

16.
毛健吾提出《大刚报》所持立场的评价是大骂小帮忙,有借《大公报》的声誉来抬高《大刚报》的社会影响力之嫌。检视《大刚报》1946年初和1949年初两个历史节点的实际表现,《大刚报》虽对国共两党都有骂,主观目的还是通过舆论引导帮国民党的忙。大骂小帮忙本质上与小骂大帮忙没有区别。考量其办报思想,《大刚报》秉持以站在人民立场作为评断骂和帮忙的标准,而赶超《大公报》的实际步骤则客观上帮助共产党进步势力逐步进入《大刚报》。  相似文献   

17.
陈成  邵波 《图书情报工作》2011,55(3):116-22
概述大众标注与信息构建的概念与内涵,细化基于用户体验的信息构建模型,并将大众标注的多维度分类、自由灵活的标注、标签云与3D墙等特性和内容融入到信息构建的组织系统、标识系统、导航系统和搜索系统中,增强网站的易用性、功能性、交互性与社会性程度,有效提高用户体验度。  相似文献   

18.
基于SOA的数字图书馆研究   总被引:2,自引:0,他引:2  
SOA基于组件模型结构,采用中立接口进行程序单元之间的交互,可以构建通用的应用系统,基于SOA的数字图书馆本质上是将数字图书馆当做一个提供一系列图书馆信息服务的系统,通过各种服务组合能够实现图书馆业务流程的自动化,以灵活应对图书馆业务需求的变化,通过将孤立不兼容的图书馆信息系统和异构的信息资源以组件的方式封装成标准的服务,并经SOA总线进行服务集成,就可以以服务的方式加以利用,从而最大程度地实现信息资源的整合.  相似文献   

19.
基于Ontology的文档过滤研究   总被引:2,自引:0,他引:2  
区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用,重点阐述公共本体、用户本体和文档本体的构建方法以及实施过程中涉及的技术体系;最后指出今后的努力方向。  相似文献   

20.
宋曙光 《北京档案》1999,(11):18-19
一、方法和步骤 档案工作为农业农村建设服务,离不开规范的基础管理.为了全面了解和掌握我区农业农村档案工作状况,1996年我们对全区农业农村档案现状进行了调查了解,全区28个乡镇、463个村、500多个重点乡村企业、40多个农业科技事业单位,其档案工作几乎等于零.针对这种现状,我们把基础建设放在首位.主要采取以下方法:  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号