共查询到18条相似文献,搜索用时 828 毫秒
1.
2.
文章提出的适用于关联数据资源集相似度计算的综合描述信息模型,分为基本描述、内容描述和外部链接3个模块描述资源集,并根据各信息项的特点挑选字符串相似度、集合相似度、向量空间模型和基于统计和语义的相似度等算法计算资源集相似度,在一定程度上解决了当前关联创建中相关资源集手工配置的问题。 相似文献
3.
4.
【目的/意义】大数据情报分析和知识服务时代,如何快速高效地从海量文献中获取情报并实现精准的文献 个性化推荐,是文献推荐个性化服务亟待解决的问题。【方法/过程】对文献个性化推荐模型进行研究,通过专家权 重维、用户维以及情境感知维三个维度的协同,识别用户的兴趣点。推荐模型使用层次分析法和熵权法量化专家 意见;使用潜在狄利克雷分布和KL散度计算量化用户相似度;通过用户社会标注行为、搜索行为、浏览行为得到用 户情感倾向,并引入时间因子量化用户情感;最后引入“最大频度值”确定各个维度的推荐指数,加权计算得到文献 综合推荐指数。【结果/结论】以高校图书馆为实验平台,对本文提出文献个性化推荐方法进行验证。实验结果表 明,与传统的基于内容的推荐方法、协同过滤推荐方法以及混合的推荐方法相比,基于三层维度的文献个性化推荐 方法在准确率与召回率上都取得了更好的性能。 相似文献
5.
本文提出了利用后缀树模抽的最大相似度优先聚类方法,通过构造文档集的广义后缀树模型抽取短语作为特征项并映射到M维向量空间模型;计算文档间的相似度矩阵,对任意两个文档之间的相似度进行降序排列,优先合并具备最大相似度的文档对形成初始聚类;合并初始聚类得到最终聚类结果。 相似文献
6.
基于协同过滤(CF)的个性化推荐技术,提出一种移动设备个性化软件推荐系统.该系统根据协同过滤的理论,首先通过软件类别兴趣相似度的计算,筛选出软件类别相似的用户候选集,过滤所有移动用户,减小产生的用户候选推荐集;然后对用户候选推荐集进行最近邻居的相似性计算以找出目标用户的邻居集合,并且对邻居集合中的邻居评分进行实时更新;最后根据兴趣相似度最大的K个邻居形成目标用户的Top-N推荐集.在第三方手机软件管理平台上通过监测推荐软件的下载或浏览量,验证系统的有效性和准确性. 相似文献
7.
【目的/意义】研究从用户节点和网络全局两个视角出发,基于用户相似度与信任度对虚拟学术社区中学者
进行推荐,提高学者推荐的质量。【方法/过程】首先,利用 LDA 主题模型挖掘学者发表的博文主题,计算博文相似
度;通过学者共同好友比例计算好友相似度;然后将博文相似度和好友相似度融合计算用户相似度;最后,融合用
户相似度和信任度进行学者推荐。【结果/结论】提出虚拟学术社区中基于用户相似度与信任度的学者推荐方法,综
合利用用户节点和网络全局信息,为虚拟学术社区用户进行学者推荐。【创新/局限】从用户节点和网络全局两个角
度进行学者信息融合,有效提高了虚拟学术社区中学者推荐的质量。局限在于本文主要考虑的是学者在网络全局
中的信任度,用户节点间的交互信任关系还有待进一步研究。 相似文献
8.
9.
[目的/意义]21世纪互联网技术的发展为学术研究提供了开放的交流平台,科研信息资源由此呈指数增长,学者难以从繁杂的信息中快捷获取所需信息,从而导致学术资源利用率低下。学术资源精准化、个性化推荐,成为了提高学术信息流转效率和实现价值增值的有效途径。[方法/过程]本文利用文献发表时间因子与文献语义相似度对异质信息网络进行加权,并基于此加权网络采用Node2vec进行有偏随机游走生成图节点序列,然后利用Skip-gram语言模型进行序列学习,最终计算节点向量的相似度以实现学术信息推荐。[结果/结论]以CNKI中的数据集为例对本文所提出的模型进行验证,实证结果表明,使用该模型推荐的论文与学者,一方面与目标学者的研究方向相符合;另一方面在时间维度上也较为精准,能够有效满足学者信息需求。 相似文献
10.
本文从信息资源建设视阈下进行了高校课程资源的整合和建设,以期实现高校课程的定制和推荐。本文从信息资源建设的实用性、系统性和共享共建原则角度出发,建立了高校课程定制与推荐的模型,以期当学生输入一套课程序列时,自动为每个学生提供一套满意度最高的课程方案。该模型由数学模型和问卷补充两部分组成。本文以北京大学本科生课程为例,手工筛选出理工类、社会科学类和人文科学类共84对可能具有较高相似性的课程,利用其在北京大学教务部网站上提供的中文名称和中文课程简介,基于统计学原理进行分词,利用向量空间计算出课程相似度,并利用人工问卷的方式对课程相似度的评判调优。 相似文献
11.
《Information processing & management》2016,52(4):682-697
Object matching is an important task for finding the correspondence between objects in different domains, such as documents in different languages and users in different databases. In this paper, we propose probabilistic latent variable models that offer many-to-many matching without correspondence information or similarity measures between different domains. The proposed model assumes that there is an infinite number of latent vectors that are shared by all domains, and that each object is generated from one of the latent vectors and a domain-specific projection. By inferring the latent vector used for generating each object, objects in different domains are clustered according to the vectors that they share. Thus, we can realize matching between groups of objects in different domains in an unsupervised manner. We give learning procedures of the proposed model based on a stochastic EM algorithm. We also derive learning procedures in a semi-supervised setting, where correspondence information for some objects are given. The effectiveness of the proposed models is demonstrated by experiments on synthetic and real data sets. 相似文献
12.
大学生就业难问题日益显现,高校就业指导工作面临着严峻的压力,积极探索与创新大学生就业指导的理念与模式就显得尤为重要.本文主要从树立“以人为本”的理念,开展大学生职业生涯教育、构建全程化的就业指导,实行就业导师制,形成“全员指导”促就业的良好格局等方面进行分析探索,力求有利于促进大学生成长和就业工作的可持续发展. 相似文献
13.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分,
为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇
章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者
用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度
矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层
次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】
本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标
签确定的方法比较简单,可以进一步探究。 相似文献
14.
阐述了基于CDIO的"卓越工程师"培养目标,通过对当前技术工作实践教学存在问题的分析,结合用人单位对学生的现状反馈,提出了基于卓越工程师培养的技术工作实践教学基本思路,结合实例说明新的教学模式取得的良好效果。 相似文献
15.
在就业竞争激烈的大环境下,信息不对称现象进一步加剧了高校毕业生的就业难度,高校图书馆可以通过专门的就业信息服务来缓解这种现象。本文在剖析"就业信息不对称"现象产生的原因和影响的基础上,提出了高校图书馆的针对新措施,以减轻其不良影响,提高毕业生就业率。 相似文献
16.
17.
本文从“热带园林工程”课程出发,结合目前在教学中出现的问题进行分析和探讨,对课程的教学内容与教学方法提出了一些改革措施,并取得了良好的效果. 相似文献
18.
Daniel Carlos Guimarães Pedronette Longin Jan Latecki 《Information processing & management》2021,58(2):102443
Graph Convolutional Networks (GCNs) have been established as a fundamental approach for representation learning on graphs, based on convolution operations on non-Euclidean domain, defined by graph-structured data. GCNs and variants have achieved state-of-the-art results on classification tasks, especially in semi-supervised learning scenarios. A central challenge in semi-supervised classification consists in how to exploit the maximum of useful information encoded in the unlabeled data. In this paper, we address this issue through a novel self-training approach for improving the accuracy of GCNs on semi-supervised classification tasks. A margin score is used through a rank-based model to identify the most confident sample predictions. Such predictions are exploited as an expanded labeled set in a second-stage training step. Our model is suitable for different GCN models. Moreover, we also propose a rank aggregation of labeled sets obtained by different GCN models. The experimental evaluation considers four GCN variations and traditional benchmarks extensively used in the literature. Significant accuracy gains were achieved for all evaluated models, reaching results comparable or superior to the state-of-the-art. The best results were achieved for rank aggregation self-training on combinations of the four GCN models. 相似文献