首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
学术文献特征表示,是学术文献搜索、分类组织、个性化推荐等学术大数据服务的关键步骤。研究表明,图神经网络能够有效学习文献的特征表示,然而当前研究主要集中在有监督学习方法上,不仅对数据集的大小和质量的要求较高,且学习到的文献特征表示与具体任务高度耦合。基于此,本文将四种无监督图神经网络方法引入学术文献表示学习,从Cora、CiteSeer和DBLP (database systems and logic programming)数据集的引文网络、共被引网络和文献耦合网络中学习文献的表示向量,并应用于文献分类和论文推荐两大下游任务。研究结果表明,(1)深度互信息图神经网络适合于文献分类任务,对抗正则化变分图自编码器则在论文推荐任务上性能更佳;(2)Cora数据集上的结果表明,相较于共被引和文献耦合网络,引文网络更适合于学习通用的文献表示向量。  相似文献   

2.
图无处不在,数据无时不有,科学无所不至,图数据科学的学科构建迫在眉睫。文章追溯图数据科学的产生与发展,从理论、方法和应用视角探究图数据科学的内容体系,在此基础上阐明图数据科学的发展趋势。研究发现:从图论到图建模、从关系数据库到图数据库、从大数据到图数据、从图到知识图谱、从行业应用到技术融合的历程,见证了图数据科学的学科兴起与发展;图数据科学是探索图数据及其现实世界的现象和规律的新兴学科,是主要由数学、计算机科学、人工智能融合而成的一门交叉学科;图数据科学荟萃了图数据库、知识图谱、大图分析为核心的学科内容,在理论、方法和应用上形成了崭新的学科体系;图数据科学具有融合化、数智化、工程化的发展趋势,成为一门独立性与系统性、创新性与驱动性、工程性与管理性相统一的综合学科。  相似文献   

3.
从数据选取、数据处理、数据展示与写作体例四个方面的数据来源、数据时间跨度、文献数据规模等11个角度对近十年(2004-2013)国内核心期刊图书情报领域关于科学计量可视化的159篇研究文献进行统计分析,发现国内图情领域研究学者对于科学计量可视化的研究和应用存在研究角度重复性高、基本原理的研究少、研究工具及计量指标使用单一的问题。  相似文献   

4.
赵亚娟 《大观周刊》2012,(5):136-136,127
作者在本文中简单介绍了图的书表示的相关定义及一些性质,同时给出了详细的证明。本文在偶数个顶点完全图书表示关于最小页的研究的基础上,主要研究了完全二部图Knn的书表示最小页的数目。  相似文献   

5.
[目的/意义] 高校图书馆信息化水平高,但数据挖掘与智慧化水平有待提升。复杂网络以图数据库为存储和图查询的载体,对图结构数据进行统一组织和挖掘。图嵌入、图算法技术相较于传统机器学习方法能够充分挖掘图结构数据中的隐含联系。本研究运用复杂网络技术融合多源数据,探索图嵌入技术、图算法等图结构数据挖掘方法在提升图书馆智慧化水平中的作用。[方法/过程] 首先基于可获取的数据进行数据特征分析与清洗;其次结合数据特征构建复杂网络概念模型,采用Neo4j批量导入技术实现网络构建和存储;最后探索图算法、图嵌入技术在图结构数据挖掘中的应用。[结果/结论] 以图结构融合多源数据构建图书馆复杂网络,并以图数据库作为存储介质。图算法与图嵌入技术在在用户画像分析、精准推荐、智能问答等图书馆智能化应用等方面具有独特优势。  相似文献   

6.
仿真模拟方法能够对复杂社会问题进行系统建模并开展计算实验以揭示其背后的机制与原理。在大数据时代,图情学科面临着研究对象、应用场景、研究范式等多方面的转变,仿真模拟方法将助力图情学科变革。本文阐述了将仿真模拟方法引入图情学科研究中的基本思路,以满足大数据时代图情学科复杂场景的系统建模需求。首先,本文厘清了仿真模拟方法应用的基本逻辑,包括仿真模拟方法可解决的关键问题与实施步骤。其次,总结了多智能体仿真、系统动力学、复杂网络等在信息传播与网络舆情、知识管理、科学合作与评价、竞争情报等图情学科相关领域的应用现状及关键难点。再其次,指出了仿真模拟方法与图情学科研究的匹配关键在于复杂场景的现象复现、逻辑推断、策略演练与情景预测,并提出了数据驱动的系统建模方案来解决上述关键难点。最后,本文探讨了仿真模拟方法在推动图情学科向数据密集型研究范式转型与支撑图情学科服务国家治理现代化需求上的重要作用。  相似文献   

7.
基于图结构的中文文本表示方法研究   总被引:2,自引:0,他引:2  
为解决基于统计的文本表示模型的信息缺失问题,本文提出了一种考虑词间语义和语序信息的基于图结构的中文文本表示方法,其思想是将文本的特征项表示成图结构中的节点,特征项间的关系表示成节点间的有向边,据此可将文本表示成由节点和有向边组成的图结构,并且将边赋予权重信息,该模型较大程度地保留了原文本的结构信息及语义信息.中文语料测试结果表明,基于图结构的文本表示方法对复杂文本语料的分类问题十分有效.对于简短文本语料,本文提出扩展特征项共现单元的修正方法,提高了图结构中文文本表示方法的普遍适用性.  相似文献   

8.
卜心怡  刘潇潇  陈峰 《情报学报》2007,26(6):839-844
隐性知识转换为显性知识是知识管理的重要研究内容之一.本文在研究了国内外隐性知识显性化研究现状后,试图从模糊认知图这一方法论着手,在Kun Chang Lee等提出的用模糊认知图表示隐性知识的基础上对模糊认知图模型加以改进,提出一个动态模糊认知图模型,从而实现对因果类型的隐性知识进行定量化表示.最后通过实验验证了该定量化模型在隐性知识显性化上的优越性.  相似文献   

9.
为使诗词研究顺应大数据环境下的发展,有效分析诗词领域内知识间的关系,本研究将本体与图数据库技术相结合,提出诗词领域内知识图谱的构建方案.文章以宋代镇江诗词为例,在对诗词相关数据进行采集与分析的基础上,借助Protégé 工具对诗词本体进行构建并生成RDF数据.使用语义插件完成RDF数据到图数据结构的映射后,通过Neo4j图数据库对诗词本体数据进行存储,完成宋代镇江诗词知识图谱的构建.结果表明,构建宋代镇江诗词的知识图谱,将诗词、作者、地点、时间、典故等数据以图数据的形式存储,实现了检索、分析与利用的功能,为今后诗词领域知识图谱的深度开发与数据存储奠定了基础.  相似文献   

10.
数字人文是图情档学科教育热门领域之一.2018年“大数据视域下数字人文研究”被评为年度中国十大学术热点之一,2019年“图书情报与档案管理视野下的数字人文”被评为年度中国图情档学界十大学术热点之一,其影响可见一斑。数据素养是信息素养在大数据时代的延伸,可分解为数据意识、数据能力和数据伦理,是数字公民的“基本生活技能”。  相似文献   

11.
基于引用的科学数据评价研究   总被引:1,自引:0,他引:1  
科学研究离不开数据的支持,科学数据评价是对科学数据实施有效管理、促进数据共享与重用的基础。文章借鉴引文分析方法,选取数据发布量、数据被引量、数据平均被引频次及h指数等指标,构建了基于引用的数据评价体系,并以DCI中的人口调查数据为例进行了实证研究。研究发现通过数据引用可以有效地对科学数据的发布及存储机构的影响力进行评估,而DCI虽然由于建立时间较短而不够成熟,但仍可为科学数据的定量评价提供强有力支持。  相似文献   

12.
[目的/意义] 数据集市是一种新兴的数据服务形态,通过分析其产生发展的环境、理论基础和探索实践,为大数据环境下的数据服务创新提供一些思考和启示。[方法/过程] 从大数据环境对数据管理和服务的影响出发,分析数据集市产生环境;基于对大数据管理流程和大数据价值链的分析,论述数据集市的理论基础;选取数据集市在实践应用中的典型案例,总结其较为成熟的服务模式;通过梳理从传统信息环境到大数据环境对数据价值认知的演变,分析数据集市的价值发现。[结果/结论] 大数据环境从多方面影响着数据集市的产生和发展;数据生命周期和大数据价值链是数据集市的重要理论基础;数据银行和众包是数据集市的重要服务模式;科研、商业和政务是数据集市价值发现的典型领域。  相似文献   

13.
数据质量对数据共享是个“双刃剑”:对数据质量要求太低,谬误散布可能误导用户;对数据质量要求 太高,数据生产者会因不堪重负对数据共享敬而远之。因此,探索一个数据生产者和数据用户都能接受的数据质量管 理机制对可持续的数据共享极为重要。文章用两个案例讨论了科研数据和政府业务数据质量管理方式对数据共享的影 响,并用第三个案例讨论了把科研数据转化为业务数据需要注意的原则:生产者和用户应该在关键问题上事先达成一 致意见,特别是,对数据质量验证需要遵循客观标准而非主观感觉。  相似文献   

14.
笔者阐述了MARC数据与财产数据之间的层次关系,并分析其对编目工作的重要影响。  相似文献   

15.
[目的/意义]推进国内科研数据管理体系的发展,明确三大研究内容和数据知识库的基础理论研究。[方法/过程]采用实证研究方法,分析对比国内外科研数据管理的研究现状,详细探讨科研数据管理领域的基础研究和技术论证。[结果/结论]明确指出构建科研数据管理体系的基础研究三大内容,即为科研活动周期和数据生命周期、数据知识库的理论框架和流程研究、数据知识库的技术论证。同时提出管理体系的系统建设方案和机制建设方案。  相似文献   

16.
数据出版是近几年由出版界和数据共享界共同提出的新概念,在国际上发展迅速,对知识管理和数据共享 具有革命性的作用。文章从数据共享的角度提出科学数据出版是一种全新的数据共享模式,对数据共享具有重要作 用,是一种科学数据资源争夺的重要工具及大数据研究的基础,能够解决数据共享面临的知识产权问题,完善数据共 享中的责权利纠纷,从而促进数据共享从被动走向自发。在此基础上,提出我国数据出版发展战略,提出数据出版与 我国现有的数据共享体系互为补充,国家数据共享体系应加强基础设施建设,为数据出版提供长期永久的数据存储环 境  相似文献   

17.
高校图书馆的数据安全和数据备份   总被引:2,自引:0,他引:2  
许志萍 《晋图学刊》2010,(2):21-22,26
数据安全是现代高校图书馆数据库稳定运行和发展的基础,而自然灾害、软硬件损坏、人为错误、计算机病毒等都有可能造成数据的损坏和丢失,以致影响图书馆的正常运行。本文论述了保障高校图书馆数据安全的有效措施及数据备份的工作原则。  相似文献   

18.
基于关联数据的政府数据发布   总被引:1,自引:1,他引:0  
采用关联数据标准来发布政府数据,可以提高政府数据的透明度,提升政府数据的利用率。对政府数据利用关联数据标准进行发布的优势、途径和应用进行梳理,强调利用本体技术,将各类术语体系,包括与政府运作有关的各类数据模型,开发规范成一个政府数据本体,可以使得数据更规范、更有关联,容易查找和利用。  相似文献   

19.
首先详细描绘了科研数据共享的现状,然后通过论述数据监管与图书馆的关系以厘清图书馆应用数据监管开展科研数据共享服务活动的必要性,最后系统梳理出图书馆开展数据监管所扮演的角色与采取的应对策略。  相似文献   

20.
网络环境中的数据完整性和数据安全问题研究   总被引:7,自引:0,他引:7  
详细阐述网络环境中的数据完整性和数据安全问题的定义和主要种类,在此基础上提出这两个问题的解决办法,并分析它们在未来对某些领域的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号