首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 359 毫秒
1.
[目的/意义]机构名称的数目多且较为繁杂,机构名称归一化可将同一机构的规范名称以及不同时段、不同表达形式的非规范名称汇集在一起,提高查询检索的查全率和查准率;有利于建立与其他系统之间的互操作,实现资源的共享。[方法/过程]在分析机构名称字符串的特点和基于K-means算法的基础上,利用编辑距离算法实现一级机构名称的初步聚类,然后利用初步聚类结果并基于TF-IDF算法计算机构名称各词项的权值,从而基于K-means算法将机构名称围绕聚类中心抱团聚簇,并对每一个簇的机构名称赋予唯一标识符。[结果/结论]该方法可实现同一机构实体不同形式的规范名称的归一,提高机构名称聚类的准确率,但对K取值、距离测度方法的选取仍有待优化。  相似文献   

2.
俞琰  陈磊  赵乃瑄 《图书情报工作》2019,63(10):134-142
[目的/意义] 为帮助高校师生充分利用网络招聘信息,提出基于大数据量网络招聘文本挖掘的课程知识模型及其自动构建方法。[方法/过程] 本文提出包含"岗位-课程-知识点"的三级课程知识模型,利用自然语言文本挖掘技术实现课程知识点模型的自动构建,并通过实验对其构建过程进行验证和分析。[结果/结论] 实验结果表明本文提出的模型及方法具有高度的可行性与有效性,可为高校和学生提供教学和学习参考。  相似文献   

3.
基于用户行为建模和大数据挖掘的图书馆个性化服务研究   总被引:5,自引:0,他引:5  
[目的/意义] 大数据背景下,如何构建合适的用户行为模型并基于海量的行为日志数据提供个性化服务,是当前图书馆大数据应用落地迫切需要解决的问题。[方法/过程] 首先分析用户行为模型构建的研究现状及存在的困境,接着密切结合大数据背景下个性化服务的特征,针对性提出基于本体的高校图书馆用户行为模型的构建策略和构建方法,并设计一种利用用户日志库提取用户显性兴趣和隐性需求本体的个性化服务方案,最后给出基于流行的Hadoop大数据分析平台和MapReduce计算框架的图书馆个性化服务的应用案例。[结果/结论] 基于本体构建的用户行为模型,技术上可与大数据分析平台实现无缝对接,从而提供实时而精准的服务,能有效应对当前大数据环境下图书馆个性化服务面临的“知识迷航”“信息过载”和“情感缺失”的挑战。  相似文献   

4.
[目的/意义] 针对现有弱信号全自动识别研究尚不完善的问题,提出基于LDA-BERT融合模型的弱信号全自动识别方法。[方法/过程] 基于无监督的LDA主题模型对文本数据集进行主题分类,构建主题和术语双层过滤函数从主题分类的结果中提取早期预警信号,通过紧密中心度、主题权重以及主题自相关性三大度量函数评价主题的弱性,并基于主题内术语的归一化频率和概率提取出弱信号。最后,运用BERT深度学习模型从语义层面对弱信号上下文及其类似词进行扩展。[结果/结论] 以2021年1月初疫情重爆发事件为例,使用爆发前三月的社交媒体新闻数据集对构建的系统模型进行验证。实验结果表明,该方法可有效检测出相关弱信号,并挖掘出弱信号随时间推移逐渐增强的演化特性。此外,该融合模型在实现弱信号全自动识别的同时,也表现出较单一模型更强的结果可解释能力。  相似文献   

5.
基于共词分析法的学科主题演化研究方法的构建   总被引:1,自引:0,他引:1  
唐果媛 《图书情报工作》2017,61(23):100-107
[目的/意义]相比于以单纯的关键词统计排序为主的词频分析法,和以文献作为分析对象、需要庞大的引文索引作为基础的共引分析法,共词分析法具有一定的优势。因此,基于共词分析法来研究学科主题演化规律。[方法/过程]构建基于共词分析法的学科主题演化研究方法,包括4个模块,分别是:数据准备、演化阶段划分、主题识别和主题演化分析。[结果/结论]在主题识别阶段改进了词频g指数来选取共词分析的对象;在主题演化分析模块,提出从静态和动态两个角度来分析学科主题的演化情况,构建三维战略坐标来进行静态分析,并构建学科主题演化现象识别模型来进行动态分析。  相似文献   

6.
[目的/意义]为解决大数据时代中政务数据质量问题以及应对数据质量治理困境提供理论参考和解决思路。[研究设计/方法]基于适应性结构化理论构建政务数据质量影响因素模型,从结构源出发探究政务数据质量的影响因素,利用政务12345热线数据进行影响因素的验证并通过随机森林算法进行重要性评估。[结论/发现]基于分析结果提出应加强治理监管,用制度规范数据管理过程及培育大数据专业队伍,从而提升政务数据质量治理的能力和效果。[创新/价值]从结构层面探究了政务数据质量的影响因素并构建理论模型,解决当前数据治理及应用问题,提升社会治理成效。  相似文献   

7.
[目的/意义]针对基于内容的个性化推荐策略,提出资源特征选择与权值计算优化策略,从而改善个性化推荐的效果。[方法/过程]构建基于用户决策机理的个性化推荐模型,模型以用户决策机理为背景知识进行资源特征的选择、用户兴趣模型的构建与语义表示、用户决策函数构建。为验证模型效果,以4 748位用户的观影数据为例进行实验,实验以向量空间模型为参照模型,P@N为评价指标。[结果/结论]实验结果显示,在N取值为5、10、20、50、100、200的情况下,基于用户决策机理的个性化推荐模型效果都显著优于向量空间模型,从而验证模型的有效性。  相似文献   

8.
[目的/意义]基于网络招聘文本和学科数据,提出"行业-岗位-知识-学科"的人才需求及供给分析框架,以人工智能领域为例进行挖掘与分析,同时对其他领域的人才供需分析也具有借鉴意义。[方法/过程]采集招聘网站中与人工智能相关的职位招聘公告,综合对比CRF、BiLSTM-CRF、BERT-BiLSTM-CRF、BERT模型对招聘文本的实体抽取效果,并运用社会网络分析方法与学科数据进行关联分析。[结果/结论]BERT-BiLSTM-CRF实体抽取实验效果最佳,分别构建"行业-岗位""岗位-知识"以及"知识-学科"3种关系网络,得到与人工智能领域联系最紧密的行业、岗位、知识及学科。该框架能充分地挖掘人才需求现状,并能较精准地将需求定位到人才培养的学科,对于国家发展战略以及高等院校人才培养计划的制订具有现实意义。  相似文献   

9.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

10.
[目的/意义]基于用户画像创建社交媒体资源聚合模型,为资源的聚合提供参考,丰富和拓展其理论研究体系。[方法/过程]在深度剖析用户画像的内涵、算法的基础上,基于社交媒体分别构建用户画像和资源画像的模型,运用社会化标签系统方法,研究基于社交媒体的用户画像和资源画像之间的映射关系。借鉴领域本体的方法,通过对数据的深层次挖掘,利用资源聚合的原理,构建基于资源画像的社交媒体内部资源聚合模型和外部资源聚合模型。[结果/结论]在大数据时代,基于用户画像和资源画像的相关理论与方法,能够为社交媒体的资源聚合提供新的思路。  相似文献   

11.
��[Purpose/significance] In the era of big data, institution name data presents new features such as mass, dynamic and diversity. Normalization of institution name can improve the reliability of data in scientific research management, subject evaluation and subject service under big data environment, and improve the quality and application effect of data retrieval based on institution name.[Method/process] From the perspective of linguistics and model construction, this paper studied name normalization. This paper constructs a Framework Model for Normalization of Institutional Names Based on Co-occurrence Relations and Similarity. Firstly, it proposed a method of identifying the entity boundary of names. Secondly, it compiled a multi-level vocabulary and proposes a normalized method of names. Finally, the Chinese bibliographic data from 2008 to 2018 were selected for experiment.[Result/conclusion] Experiments verify the validity of the model, which has some enlightening significance for the normalization of the names of other types of institutions.  相似文献   

12.
贾君枝  冯婕 《图书情报工作》2017,61(12):122-128
[目的/意义] 挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程] 提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析。[结果/结论] 分析右部为地点名称、机构名称、时间名称和主题名称等4种不同类型规则的关联特征,实现不同名称数据类型的关系挖掘问题。本研究可为知识的揭示、聚合和关联提供新的视角,探索了数据挖掘技术在名称数据中的应用。  相似文献   

13.
[目的/意义] 为提高高校图书馆大数据应用服务水平,在综述图书馆大数据服务国内外研究进展并分析现实困境的基础上,提出一种高校图书馆大数据应用模式体系。[方法/过程] 从大数据收集与整合、大数据分析方法、知识服务以及破解资源紧缺难题等角度分析图书馆大数据应用之困境,构建基于大规模网络分析方法的图书馆大数据应用模式体系。[结果/结论] 结合知识管理理论和开源云计算平台的基于大规模网络分析方法的图书馆大数据应用模式,能够应对当前高校图书馆大数据服务面临的挑战,并有效促进高校图书馆大数据服务的进一步发展。  相似文献   

14.
[目的/意义] 在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程] 对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187, 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论] 在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。  相似文献   

15.
[目的/意义]研究大数据环境下多媒体网络舆情信息传播要素和运行机理,为相关部门加强网络舆情信息监管提供参考。[方法/过程]以大数据技术、舆情理论、信息传播理论为基础,对大数据环境下多媒体网络舆情的特征进行分析,深入探讨大数据环境下多媒体网络舆情传播的主体、客体、媒体、本体、空间5个要素,在此基础上重点归纳总结大数据多媒体网络舆情传播机理,并构建传播机理的总体关系架构。[结果/结论]揭示多媒体技术环境下网络舆情信息传播的内在运行规律,为大数据环境下多媒体网络舆情信息传播的研究提供新视角。  相似文献   

16.
[目的/意义]当前图书馆联盟研究中既缺乏对内在管理机制、运行机理的研究,也缺乏基于大数据和数学建模的研究的现状,建立适用于联盟资源引进决策的Multi-Agent仿真模型,有助于科学、理性决策。[方法/过程]引入Multi-Agent建模方法,利用Matlab软件仿真图书馆联盟内成员馆、资源厂商等Agent的动态多次交互演化过程,研究各种指标环境下不同Agent的决策策略。[结果/结论]在充分的信息和资源条件下,图书馆联盟可以根据发展环境和阶段的不同,通过时间序列分析选择合适的资源引进策略,采取必要的综合手段,推进联盟内外的合作,实现成员馆和商家的长期共赢。该模型和方法对进一步完善和深化图书馆联盟的基础理论,提高图书馆建设效率,推进面向实际问题的图书馆联盟协同发展将有一定的理论意义和实用价值。  相似文献   

17.
[目的/意义]在大数据浪潮和“新文科”背景下,中国图情档学科的人才培养范式亟需改革。与此同时,大数据相关专业的建设方兴未艾,对于图情档学科的人才培养新范式建设具有借鉴意义。[方法/过程]采用一种时序主题网络模型及计算方法;通过搜集、处理、统计、分析259所高等院校的大数据专业培养方案文本,在时间维度上进行主题挖掘,总结归纳数据科学课程的层次;分析图情档学科主干知识与大数据专业的联系,并给出适合图情档学科的数据科学课程建议。[结果/结论]结果表明,所采用的时序主题网络模型方法能够较好地契合大数据专业的人才培养范式发展分析,可以成为研究学科主题的一种方法。此外,还给出面向图情档学科的数据科学类课程建议,可供图情档学科的人才培养参考。  相似文献   

18.
朱祥  张云秋 《图书情报工作》2019,63(16):143-150
[目的/意义]对近年来知识融合相关研究进行梳理与评价,以期为今后相关研究提供参考。[方法/过程]首先解析知识融合的概念,然后对知识融合的框架、过程和方法进行梳理,继而总结知识融合的研究趋势,最后进行研究展望。[结果/结论]知识融合研究在大数据环境下呈现出新的研究特点,但还不能满足大数据环境的要求,未来应从构建分层多维立体的大数据知识融合框架、提高知识融合的效率、构建实时动态融合机制、开展大数据实证应用研究4个方面开展知识融合研究。  相似文献   

19.
大数据环境下图书馆文献资源建设模式的变革   总被引:1,自引:0,他引:1  
袁芳 《图书情报工作》2015,59(18):91-94
[目的/意义]将大数据理念、大数据技术引入图书馆资源评价、选择和管理体系,改进图书馆文献资源建设的馆员决定模式,建立读者决策采购的模式。[方法/过程]通过分析大数据时代的基本理念和图书馆大数据的构成体系,论述大数据再造文献资源建设的模式及必要手段,并介绍一些应用大数据增强资源采访效益的方法。[结果/结论]建议图书馆应采取树立大数据思维、培养大数据馆员等手段,创新图书馆文献资源建设的措施。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号