共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
社会化标签系统中基于密度聚类的Web 用户兴趣建模方法 总被引:1,自引:0,他引:1
Web用户兴趣模型在个性化信息服务中有着非常重要的作用。本文利用社会化标签的独特优势,针对传统社会化标签聚类方法的局限性,提出了一种基于密度聚类的Web用户兴趣建模方法。首先建立基于社会化标签的向量空间模型,并将社会化标签表示为Web资源及其权重的形式,以此为基础利用DBSCAN算法对其进行聚类,进而依据所有Web用户的标注行为以每个聚类为中介计算特定Web用户对Web资源的兴趣度来构建Web用户兴趣模型。实验结果表明了该方法的优越性。 相似文献
3.
基于主题模型的科技报告文档聚类方法研究 总被引:1,自引:0,他引:1
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。 相似文献
4.
用户兴趣模型的建立和维护是个性化推荐服务系统研究和开发中的一个关键问题.细粒度兴趣通过在用户兴趣特征集中区分用户的不同兴趣主题类别来发现,是对粗粒度用户兴趣的进一步挖掘和划分.本文针对以往粗粒度用户兴趣建模存在的不足,对细粒度用户兴趣建模的概念和主要方法进行简介和评述.在此基础上,提出一种基于领域本体和近邻概念聚集的细粒度用户兴趣建模方法(FUPMo).该方法通过滑动窗口控制用户兴趣概念的计算规模,通过时间窗口和兴趣衰减函数反映用户兴趣的变化.基于军用飞机领域本体OntoAvion和小规模文档库进行的实验研究表明,该细粒度用户兴趣建模方法在应用上具备有效性. 相似文献
5.
个性化知识服务中基于Ontology的用户兴趣挖掘研究 总被引:2,自引:1,他引:1
个性化知识服务是知识经济时代信息服务发展的必然趋势,是满足信息用户多样化、专门化知识需求的高层次服务模式.用户兴趣知识的挖掘和用户兴趣模型的建立是个性化知识服务的重要研究内容.本文将Ontology技术与个性化知识服务结合起来,研究用户兴趣知识的Ontology表示,并以此为基础提出了一种动态的用户兴趣学习和挖掘方法,分析了该方法中参考Ontology的建立、用户兴趣知识的初步学习和用户兴趣模型的完善等关键步骤.研究结果表明,基于Ontology的用户兴趣挖掘可以较为准确地表示、跟踪和学习用户的个性化知识,实现隐性用户兴趣的发现和利用,满足用户特殊的信息需求,是一种提高个性化知识服务质量的有效方法. 相似文献
6.
7.
基于C/S的新一代智能化、个性化搜索引擎 总被引:3,自引:0,他引:3
本文探讨一个基于C/S的新一代智能化、个性化搜索引擎。整个搜索引擎分为客户端和服务器端两大部分。在客户端,智能代理Agent在个性化模型数据库的支持下产生个性化的检索要求,送往服务器。服务器端为了实现个性化服务,利用领域知识库和兴趣库对原始网页数据库进行数据挖掘,聚类形成各个类型的网页索引数据库。本文并给出了用户兴趣模型算法、挖掘用户兴趣关联规则的Apriori算法和K-modes聚类算法。 相似文献
8.
9.
10.
论文探讨利用R语言工具对图书馆新浪微博数据进行子主题聚类和挖掘,指出:在文本分词、构建词频——文档矩阵的基础上,使用Pamk算法和Kmeans算法进行微博聚类,获取图书馆服务质量评价与建议信息,挖掘图书馆核心微博用户,便于图书馆利用微博数据评估服务效果,改进服务质量。 相似文献
11.
基于XML的MARC研究 总被引:4,自引:1,他引:3
本文分析了机读目录MARC在未来数字化图书馆应用的局限性,并提出了改进方案,以哈尔滨工业大学为例,对其采用的中文机读目录CNMARC格式进行了XML转换的尝试,从而使得MARC书目数据库和Internet上的非书目数据库的集成成为可能.本文的研究对于现有MARC数据在未来数字图书馆中的利用具有重要意义. 相似文献
12.
13.
丁一 《现代图书情报技术》2005,21(6):26-29
Web 信息检索(Information Retrieval)技术研究是应用文本检索研究的成果,它结合Web图论的思想,研究Web上的信息检索,是行之有效的Web知识发现的途径。传统HITS方法所获得的信息精确度相当低,而PageRank作为一通用的搜索方法,不能够应用于特定主题的信息获取。在充分分析了PageRank、HITS等现有算法和Web文档的相似度计算方法的基础上,提出了Web上查询特定主题相关信息发现的RG-HITS算法。它结合了Web超链接、网页知识表示的信息相关度以及HITS方法来搜索Web上特定主题的相关知识。 相似文献
14.
本文从传播学和社会学的视角,以定性与定量研究相结合的方法,分别从网名、聊天形式、聊天对象、聊天内容、聊天语言等方面对青少年使用QQ的情况进行了分析。 相似文献
15.
16.
毛健吾提出《大刚报》所持立场的评价是大骂小帮忙,有借《大公报》的声誉来抬高《大刚报》的社会影响力之嫌。检视《大刚报》1946年初和1949年初两个历史节点的实际表现,《大刚报》虽对国共两党都有骂,主观目的还是通过舆论引导帮国民党的忙。大骂小帮忙本质上与小骂大帮忙没有区别。考量其办报思想,《大刚报》秉持以站在人民立场作为评断骂和帮忙的标准,而赶超《大公报》的实际步骤则客观上帮助共产党进步势力逐步进入《大刚报》。 相似文献
17.
18.
基于SOA的数字图书馆研究 总被引:2,自引:0,他引:2
SOA基于组件模型结构,采用中立接口进行程序单元之间的交互,可以构建通用的应用系统,基于SOA的数字图书馆本质上是将数字图书馆当做一个提供一系列图书馆信息服务的系统,通过各种服务组合能够实现图书馆业务流程的自动化,以灵活应对图书馆业务需求的变化,通过将孤立不兼容的图书馆信息系统和异构的信息资源以组件的方式封装成标准的服务,并经SOA总线进行服务集成,就可以以服务的方式加以利用,从而最大程度地实现信息资源的整合. 相似文献
19.
基于Ontology的文档过滤研究 总被引:2,自引:0,他引:2
区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用,重点阐述公共本体、用户本体和文档本体的构建方法以及实施过程中涉及的技术体系;最后指出今后的努力方向。 相似文献
20.
一、方法和步骤 档案工作为农业农村建设服务,离不开规范的基础管理.为了全面了解和掌握我区农业农村档案工作状况,1996年我们对全区农业农村档案现状进行了调查了解,全区28个乡镇、463个村、500多个重点乡村企业、40多个农业科技事业单位,其档案工作几乎等于零.针对这种现状,我们把基础建设放在首位.主要采取以下方法: 相似文献