首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
基于碎片化UGC的知识元抽取研究   总被引:1,自引:0,他引:1  
[目的/意义]在大数据环境下,从海量的碎片化用户生成内容中抽取具有完整语义的知识单元。[方法/过程]文章提出一种基于碎片化UGC的知识元抽取方法,该方法首先借助BTM主题分割方法从UGC中抽取知识要素,而后基于融合TextRank和Glove词向量的K-means方法实现知识要素聚类,最后根据知识要素相关属性和知识要素聚类结果生成对应UGC知识元。[结果/结论]实验结果显示基于碎片化UGC的知识元抽取方法具有一定科学性和有效性。  相似文献   

2.
[目的/意义]基于知识元理论对水书习俗非遗资源知识元进行知识抽取与组织,助力水书习俗非遗资源的开发与利用。[方法/过程]构建水书习俗非遗资源知识元语义描述模型,基于知识元语义模型与深度学习技术对水书习俗非遗资源进行知识元抽取,并对水书习俗非遗资源进行细粒度知识组织与可视化研究。[结果/结论]实现水书习俗非遗资源多维知识关联关系的揭示,促进了水书习俗非遗资源的传承、开发与利用。  相似文献   

3.
基于知识元语义链接的知识网络构建   总被引:2,自引:0,他引:2  
本文基于Brookes文献中的知识节点及Swanson文献间的隐性关联概念,提出了一种基于知识元本体语义链接的知识网络实现流程。文中给出了文献单元和Web信息的知识元认知抽取方法,知识元本体的结构建立和语义互联,以及利用Protégé技术实现基于知识元语义链接的知识网络构建步骤。  相似文献   

4.
【目的/意义】为准确抽取科技文献中的方法知识元,实现科技文献更细粒度知识组织和检索。【方法/过程】 本研究提出一种基于规则的方法知识元抽取方法,该方法主要分为两个阶段:方法知识元初始描述规则半自动化 识别阶段和方法知识元及其描述规则自动化抽取和更新阶段。第一阶段根据方法知识元的特征,以人工—机器相 结合的方法识别方法知识元的组成维度及初始描述规则。第二阶段依据第一阶段识别的方法知识元初始描述规 则,自动从科技文献中提取方法知识元,并基于PreFixSpan算法从新识别的方法知识元中挖掘出新的方法知识元描 述规则,以实现方法知识元及其描述规则的动态更新。【结果/结论】在对16篇科技文献的初步评估中,实验结果P、 R以及F值分别为0.71、0.80和0.73(均>0.5)表明该方法的可行性和有效性,该抽取方法对更细粒度的知识组织和 检索也有一定借鉴作用。【创新/局限】方法的局限性在于需要一定的人工参与方法知识元描述规则的提取。  相似文献   

5.
鲍玉来  耿雪来  飞龙 《现代情报》2019,39(8):132-136
[目的/意义]在非结构化语料集中抽取知识要素,是实现知识图谱的重要环节,本文探索了应用深度学习中的卷积神经网络(CNN)模型进行旅游领域知识关系抽取方法。[方法/过程]抓取专业旅游网站的相关数据建立语料库,对部分语料进行人工标注作为训练集和测试集,通过Python语言编程实现分词、向量化及CNN模型,进行关系抽取实验。[结果/结论]实验结果表明,应用卷积神经网络对非结构化的旅游文本进行关系抽取时能够取得满意的效果(Precision 0.77,Recall 0.76,F1-measure 0.76)。抽取结果通过人工校对进行优化后,可以为旅游知识图谱构建、领域本体构建等工作奠定基础。  相似文献   

6.
【目的/意义】基于知识元挖掘科技文献中的科学知识,建立科学知识之间的联系,构建细粒度知识图谱,旨 在打通知识之间的壁垒,满足用户细粒度的知识需求。【方法/过程】首先,本文构建基于图的知识元表示框架,并以 知识元为核心构建细粒度知识组织模型;其次,设计面向科技文献知识元的知识图谱,并探究知识图谱构建流程, 以实现知识图谱的自动化构建;最后以科技文献中的摘要和引言为实验数据,进行实证研究,构建面向科技文献知 识元的知识图谱。【结果/结论】本文所构建的知识图谱不仅能直观地展现学术论文所需要探究的问题、所提出的方 法和模型等,还能够揭示科学知识之间的内在关联。【创新/局限】本文探究了细粒度知识组织模型,构建了面向科 技文献知识元的知识图谱。在未来的研究中,将不断完善知识图谱构建流程,并探索知识图谱的应用领域。  相似文献   

7.
[研究目的]为细粒度发现相近学科间的知识关联,推动学科间知识交流,通过抽取方法知识元,探析不同学科领域研究方法的交流态势。[研究方法]以情报学和计算机科学学为例,首先,编写方法知识元抽取规则,基于规则抽取两学科领域大样本文献的方法知识元,构建学科领域方法知识元库;再利用LDA模型抽取两学科领域代表性期刊的方法知识元;以此为基础,对比分析两学科领域的高频研究方法、已交流的研究方法、存在交流潜力的研究方法。[研究结论]研究发现,两学科已交流的研究方法有:聚类分析、LDA模型、BP神经网络、支持向量机、主成分分析、协同过滤、文献计量等;具有交流潜力的研究方法有:提高准确率的分类算法(AdaBoost算法、XGBoost算法、SMOTE算法)、图卷积神经网络、自然语言处理模型GloVe模型等。该研究不仅能为情报学研究者选择计算机科学学领域的研究方法提供参考,而且也为学科交叉研究提供了一种新思路。  相似文献   

8.
[目的/意义]从研究成果中抽取数据线索,进而构建针对特定主题的数据索引,有助于提升研究者查找数据的全面性。[方法/过程]以社会科学领域所有学科中文核心期刊中关于“COVID-19”论文的题录信息为例,分三步进行了探索。(1)随机抽取1000篇摘要进行人工标注,然后以此为基础使用自适应增强等模型训练分类器,进而使用分类器识别出使用了数据的论文。(2)从使用数据的论文摘要中标注出数据线索实体,进而使用隐马尔可夫、长短期记忆网络等模型进行实体识别。(3)使用Neo4j数据库,基于抽取出的数据线索与题录中的其他信息构建知识图谱。[结果/结论]在判断论文是否使用了数据的任务中,自适应增强模型的F1值最高,达到0.869。在数据线索实体识别任务中,隐马尔可夫模型的F1值最高,达到0.805。由抽取出的数据线索与论文关键词、作者、期刊等信息融合构建的知识图谱能够实现基于主题词查找数据线索、基于数据线索查找其他信息等应用。  相似文献   

9.
[目的/意义]旨在为提升政策文本的自动化处理程度提供参考。[方法/过程]在梳理已有政策本体及其构建方式基础上,提出由词汇语义主导的自下而上的本体构建方法,运用本体构建工具Protégé5.5.0构建科技创新政策文本本体,对部分政策内容进行标注并可视化。[结果/结论]该本体适用于科技创新政策文本的结构化语义抽取,能够在一定程度上揭示科技创新政策的结构化语义特征。  相似文献   

10.
[目的/意义]当前各学科领域文献增长迅速,迫切需要以面向“问题解决”的思路,从大量科技文献中抽取出研究问题、解决方案及其解决关系,并以此为基础开展领域知识演化研究。[方法/过程]文章提出了可应用于实践的低成本领域实体关系抽取方案:依托词嵌入类比的思想,仅从领域知识资源中提取的少量实体关系对作为基准即可实现关系分类。[结果/结论]在人工智能领域数据集上使用基于词嵌入类比方案的集成模型,抽取解决关系、问题层级关系、方法层级关系的F1值分别为82.33,81.49,74.81。最后,将集成模型应用于全量数据抽取实体关系,从宏观、中观、微观三个层面展示了面向问题解决的人工智能领域知识演化情况。  相似文献   

11.
付苓 《现代情报》2017,37(12):74-78
构建单元信息知识库,可以实现对单元信息的有效揭示、组织与利用,为实现精粹服务的需求提供知识保障。本文引入本体提出了单元信息知识库的构建方法,设计了知识库的总体结构,构建了单元信息本体,阐述了数据建设的过程,并以"养生领域"为例实现了知识库的构建。本文所构建的基于本体的单元信息知识库能够较好地组织、存储和利用单元信息,提供知识检索和知识发现服务,实现从海量数据中有效获取有价值信息的需求。  相似文献   

12.
刘爱琴  安婷 《现代情报》2019,39(8):52-58
[目的/意义]面向非相关文献的知识关联能够促进新知识的产生,为科学研究提供了一种有效的辅助手段。[方法/过程]本文以《中国分类主题词表》为主题词受控词表,首先对文献摘要进行中文分词处理并提取主题词,利用计量分析技术和聚类技术分析文献间特征的相似、相异水平,然后基于该系统为用户检索并利用用TOP-K算法反馈用户精确结果。[结果/结论]设计了面向非相关文献的知识关联检索系统,从更细的粒度层面揭示文献之间的知识关联,为用户提供高质量的服务。  相似文献   

13.
[目的/意义]为满足用户多层次、多粒度的知识获取需求,图书馆文献资源组织的对象由文献单元逐步向知识单元转变。[方法/过程]文章在研究单元信息概念和表示模型的基础上,提出基于本体和关联数据的单元信息知识组织框架,并深入探讨了实现单元信息语义组织的核心步骤。以中医养生领域为例,阐述单元信息知识组织语义模型的应用过程。[结果/结论]本文构建的单元信息知识组织模式,是实现单元信息细粒度组织、语义化揭示以及多维度关联的有效途径。该研究可为特定领域单元信息的语义应用提供参考。  相似文献   

14.
[目的/意义]知识经济时代,知识的生产、扩散和消费是社会经济发展的重要推动力。其中,知识扩散是充分发挥知识价值的重要过程,从微观层面理解知识扩散的规律对促进知识利用与创新具有重要意义。[方法/过程]以医学信息学领域的科学文献为例,文章基于知识模因的微观层面,采用知识模因识别方法从文献中提取出知识模因来表征知识单元,并基于文献引证网络构建各知识模因的扩散级联网络,计算分析扩散级联网络的基础特征及其特征分布情况,以考察不同知识模因在学科领域内的扩散模式。[结果/结论]医学信息学领域内发现了四种典型的知识模因扩散模式:单起源型、多起源-独立型、多起源-迭代型、多起源-融合型。此外,通过对级联网络的各项属性分布特征进行分析发现,网络呈现无标度性,医学信息学领域极少数的知识模因获得了大量的传播资源,领域内的研究集中于被少数知识模因所代表的研究方向上,而领域内各研究方向的生命周期长度则相对差异较小。  相似文献   

15.
张娟  王向辉  付然  孙晓琳 《现代情报》2017,37(10):49-52
[目的]为了实现海量数据中信息的知识组织,促进单元信息和文献信息内容的知识关联和知识发现,构建单元信息知识组织体系;[方法]以养生领域内的领域本体、文献信息等知识资源为基础,构建养生单元信息知识服务系统;[结果/结论]"养生单元信息知识服务系统"(以下简称"养生知识服务平台")是单元信息知识组织体系建设的重要应用示范,提供语义检索、知识浏览、知识推理和知识发现等服务,实现大数据环境下"单元信息知识组织体系"的有效利用;[局限]文献资源的单元信息抽取及分析涉及人工智能、计算机处理等相关技术,技术实现有较大难度。  相似文献   

16.
[目的/意义]构建大数据环境下学术创新力自动测度知识库,为学术创新力测度分析做支持。[方法/过程]以图书情报学相关期刊2008-2018年部分论文为数据源,使用本体建模的方法构建图书情报学知识本体,结合信息科学领域G3(科学、科学研究类)相关论文构建的本体,按照软件工程规范进行相关分析和设计,确定存储方案和存储结构,采用MySQL数据库来存储数据。[结果/结论]最终成功构建学术创新力测度知识库系统,并提供必要的知识库查询相关接口。[局限]由于时间关系和对图书情报学领域缺乏系统深入的了解,文章所构建的本体在属性关系方面进行了简化,导致实际使用效果会受一定影响。  相似文献   

17.
[目的/意义]旨在改善在线商品信息描述,降低用户认知负担,提升在线购物效率。采用框架描述法构建用户认知框架,在此基础上实现商品知识融合,以期解决在线商品信息的冲突矛盾和冗余问题。[方法/过程]采集数码相机在线评论信息,以框架法进行用户认知框架表示,利用规则融合方法构建商品知识融合模型,进行了用户认知框架的融合模型验证和效果分析。[结果/结论]知识融合能解决商品信息冗余问题,能填补空值型商品知识信息,减少电商平台商品信息描述流量成本,帮助用户理解商品知识矛盾问题,提升电商平台商品知识描述和呈现质量。  相似文献   

18.
【目的/意义】大数据互联网时代,知识以碎片化形式分散在大数据环境中,加剧了大知识融合的难度,深刻 地影响了知识的组织和创新过程。如何针对大数据环境下碎片化知识的特征,构建出适于系统性的把握知识和解 决复杂问题的知识融合框架就成为大数据知识工程研究的热点问题。【方法/过程】系统性分析了碎片化知识的特 征,在此基础上构建了基于知识超网络的融合框架,探讨了知识融合的标准、知识融合的维度以及知识融合的机 制。【结果/结论】知识超网络模型是碎片化知识非线性融合的一种可行的研究框架,其面向问题的多维、多级、多层 的综合的知识融合模型为大数据环境下碎片化知识的融合提供了新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号