首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 562 毫秒
1.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

2.
[目的/意义] 科技文献中的概念是对文献中知识高度凝练的表达,通常以定义句的形式出现在科技文献中。自动从概念定义句中抽取概念,能够进一步挖掘科技文献中蕴含的重要知识。[方法/过程] 通过分析概念定义句的结构、句式等模式特征,提出以WCL数据集为基础的语料构建方案,并采用BERT+BiLSTM+CRF模型学习概念定义句的模式,从而实现概念短语抽取。[结果/结论] 结合以往对概念定义句模式特征的研究,创新性地提出一种基于序列标注学习概念定义句的组成模式,从而实现概念短语抽取。通过BERT+BiLSTM+CRF模型,有效学习了概念定义句中的上下文语义、句式结构、组成项分布等模式特征,实现了句子中概念短语的抽取。  相似文献   

3.
[目的/意义] 中医药是中华文化的传承,对现代医学发展具有重要作用,应受到高度重视。利用数字技术组织中医古籍,对其进行保护与重用具有重要意义。[方法/过程] 以简帛医药文献为研究对象,分别构建简帛医药书目本体和内容本体,并通过书目本体和内容本体的连接形成简帛医药文献本体模型;利用命名实体识别模型抽取实体概念,利用依存句法分析和规则的方法抽取实体关系,最终将简帛医药文献数据存入图数据库,实现简帛医药文献知识图谱可视化与检索查询结果呈现。[结果/结论] 利用本体和知识图谱,提出简帛医药知识组织方法,建立具有逻辑关系的简帛医药知识链,形成中医药领域知识的语义网络,在中医古籍的智能化方面做出有益的探索,有助于中药知识的普及与传承。  相似文献   

4.
孙海生 《图书情报工作》2016,60(10):123-129
[目的/意义] 传统共词分析的聚类算法存在以下不足:①关键词只能被划归一个聚类;②聚类过程对分类数目的确定缺乏严格判断标准。针对以上问题,采用复杂网络理论进行改进研究。[方法/过程] 采用连边社团检测算法对关键词进行聚类,以科学计量学为例进行实证研究。[结果/结论] 分析结果表明:算法对关键词的聚类结果有较好的改进效果,能够把核心度高的关键词同时划分到不同的研究主题之中,克服传统聚类算法的不足,而且划分密度可为聚类数目的确定提供客观判断依据。  相似文献   

5.
赵一鸣  尹嘉颖 《情报学报》2023,(10):1187-1198
共词网络是研究语言现象的重要方法,语义特征是词汇共现现象中重要的隐性知识,研究共现词之间的语义关系及特征,可以从语义视角改进共词网络的研究,并利用语义学知识为现有的共词分析方法赋能。本文提出了一种语义增强型的共词网络构建和分析方法,从共现特征、网络特征与语义特征3个维度丰富了共词网络节点和边的属性。通过实验构建了基于14万余篇新闻文本数据的语义增强型全文本共词网络,并重点对共现词对的语义特征进行分析,结合案例呈现了该方法在计算语言学研究和行业应用上的价值。本文从词间语义关系的视角,拓展了共词网络的构建和分析方法,描述了共现词汇的语义特征,证实了语义关系的非对称性和传递性,为语义关系的分类与推导提供了理论依据,在语义消歧、词义理解等方面具有应用价值。  相似文献   

6.
[目的/意义] 从数字人文视角出发,实现敦煌吐鲁番医药文献的数字化及知识组织与可视化,为敦煌吐鲁番医药文献的传承、普及与智能化服务做出贡献。[方法/过程] 采用自顶向下方法,参考BIBFRAME书目模型及中医药学语言系统(TCMLS)构建敦煌吐鲁番医药文献本体模型,利用哈工大语言技术云平台LTP实现词性标注与三元组自动抽取,构建敦煌吐鲁番医药文献知识图谱。[结果/结论] 利用所构建的本体及知识图谱可实现敦煌吐鲁番医药文献知识组织工作,知识图谱能够实现语义查询,为敦煌吐鲁番医药文献的智能化理解奠定基础。  相似文献   

7.
[目的/意义] 采用hLDA从专利语料库中抽取层次主题,以描述隐藏在专利文本中的技术结构,并基于层次主题随时间变化情况进行技术演化分析。[方法/过程] 从专利术语中获取闭频繁项集,并基于此建立关联规则网络来度量术语的重要性和术语间语义关系强弱,进而对语料库进行重构,并对不同时间片段的专利集合进行层次主题结构抽取。[结果/结论] 将本方法应用于硬盘驱动器磁头领域的专利数据分析,实证结果表明该方法是一种可行和有效的技术演化分析方法。  相似文献   

8.
[目的/意义] 面向文化遗产领域的知识分析研究,对领域知识建模、知识组织、智慧数据资源建设等具有重要意义。[方法/过程] 为明确文化遗产领域知识结构与特征,基于对领域本体的计算与分析,系统剖析文化遗产领域核心共享概念以及领域知识关联关系,提出并构建文化遗产领域知识纲要。[结果/结论] 文化遗产领域核心共享概念包括领域对象与实体、类型与概念、时间与空间、事件与活动、文献与作品、代理者等内容,领域知识关联关系丰富多样且较为复杂。研究结论有助于更全面地理解与认识文化遗产领域知识体系,指导领域本体开发与知识建模,促进领域知识的有效组织与管理。  相似文献   

9.
[目的/意义] 通过对国内中医古籍数字化领域生命周期进行划分,系统性述评该领域的发展阶段及其特征,为面向数字人文的中医古籍数字化研究提供决策参考。[方法/过程] 从4个期刊数据库采集该领域期刊文献题录,通过最小二乘法和年度文献增长量确定中医古籍数字化研究的生命周期,对各阶段的相关文献进行主题聚类分析和主题演化分析以识别出各领域的研究热点和演化趋势。[结果/结论] 将国内中医古籍数字化研究划分为3个阶段,识别出各阶段的研究主题及主题在不同阶段中的演化路径,在总结前人研究基础上,从数字化资源、技术体系构建和应用服务方向3方面提出未来中医古籍数字化的发展趋势。  相似文献   

10.
[目的/意义] 梳理网络舆情的研究进展,有助于厘清网络舆情研究的知识基础、传导规律、预警机制和治理策略等之间的内在联系和主题演化路径。[方法/过程] 首先分析网络舆情的理论知识基础,然后结合现有研究,按照内容递进的规律将网络舆情研究分为影响因素、传导路径、预警机制以及引导治理策略四个主题,采用内容分析法和社会网络分析法对网络舆情进行主题关联关系分析和演化路径探索。[结果/结论] 结果表明,生命周期理论、认知定势理论、沉默的螺旋、群体极化理论、蝴蝶效应理论和治理理论常作为网络舆情研究的理论知识基础,网络媒介环境、社会结构压力、网民心理、触发性事件、有效动员和社会控制力量六个因素被视为网络舆情演化的重要影响要素,且网络舆情、舆情事件、社交媒体、利益相关者、大数据和信息传播等六个主题与其他研究内容关系较为密切,在主题演化路径中发挥着重要桥接作用。  相似文献   

11.
[目的/意义] 面向语义信息以层次渐进的方式识别技术演化轨迹,有助于加强对技术细节的理解并提升轨迹识别的准确性。[方法/过程] 首先,提取专利和科技论文的SAO结构,依据语义信息确定研究主题,并利用S曲线分析技术生命周期。其次,借助机器学习算法与社会网络分析指标,分不同周期,通过多层次提取,筛选技术演化轨迹。最后,以造血干细胞领域为实证对象,发现该领域中与遗传病因技术主题相关的专利和科技论文的研究重点存在显著差异,该主题尚未形成统一的演化路径,且有关免疫系统疾病与糖尿病方面的研究是未来潜在的演化趋势。[结果/结论] 所提方法通过客观的数值计算结果,逐步实现复杂技术演化路径的提取与凝练,在揭示技术主要发展历程的同时,能够客观预测技术演化趋势。  相似文献   

12.
[目的/意义] 为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程] 通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果/结论] 实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。  相似文献   

13.
[目的/意义] 快速、准确地从突发网络舆情文本中识别事件。[方法/过程] 提出一种融合句法特征和句法相似度的网络舆情突发事件识别方法。结合句法特征提出面向事件的句法特征提取方法,利用事件语义标注和句法特征提取方法构造事件句法特征库,通过计算待测文本与句法库的句法相似度来识别网络舆情突发事件。[结果/结论] 以新型冠状病毒肺炎疫情为例,所提出网络舆情突发事件识别方法在该舆情下的最优相似度为0.93,在此相似度下从一段新的文本中识别出160个事件和30个非事件,F1值达到了0.848。通过方法测评证明网络舆情突发事件识别方法在利用句法相似度识别事件和进行相同相邻词性合并等方面创新的有效性。  相似文献   

14.
[目的/意义]旨在使企业充分认识移动环境下知识共享特点并有效利用移动环境下网络资源,推动企业知识共享网络的建设。[方法/过程]在理论层面,以知识共享、社会网络理论为基础,从移动环境角度出发,构建移动环境下企业知识共享网络模型;在应用研究层面,以新浪微博认证账号"一汽大众"为研究对象,采用编程方式获取数据,使用Gephi和数理统计工具绘制相关图表并进行实证分析。[结果/结论]揭示移动环境下企业知识共享网络本质,为企业知识共享提供新的研究视角。丰富和拓展社会网络分析法在企业知识共享研究领域的应用,为移动环境下企业知识共享提供分析工具。  相似文献   

15.
[目的/意义] 探索从科技论文中挖掘出作者研究思路的可能性和技术手段,从而高效地获得新的研究创意。[方法/过程] 提出一种从单篇科技论文中抽取概念地图的方法,通过构建其微观概念地图(MCM)来形象地描述作者在研究中重视并运用的知识结构,通过对概念及其关系的定量分析来推测作者的研究重点和创新思路。[结果/结论] 选取一篇发表在2014年Science期刊上的关于聚类方法的论文,展示其MCM的抽取及论文研究思路的挖掘过程,验证所提方法的有效性。  相似文献   

16.
[目的/意义] 针对SAO结构短文本分类时面临的语义特征短缺和领域知识不足问题,提出一种融合语义联想和BERT的SAO分类方法,以期提高短文本分类效果。[方法/过程] 以图情领域SAO短文本为数据源,首先设计了一种包含"扩展-重构-降噪"三环节的语义联想方案,即通过语义扩展和SAO重构延展SAO语义信息,通过语义降噪解决扩展后的噪声干扰问题;然后利用BERT模型对语义联想后的SAO短文本进行训练;最后在分类部分实现自动分类。[结果/结论] 在分别对比了不同联想值、学习率和分类器后,实验结果表明当联想值为10、学习率为4e-5时SAO短文本分类效果达到最优,平均F1值为0.852 2,与SVM、LSTM和单纯的BERT相比,F1值分别提高了0.103 1、0.153 8和0.140 5。  相似文献   

17.
[目的/意义] 对现有识别技术转移潜力的专利分析方法及制约技术转移相关因素进行分析的同时,为今后有效识别具有转移潜力的专利技术提供理论支撑。[方法/过程] 针对专利分析方法在技术转移中的应用现状,重点从国内外识别技术转移潜力的分析方法的相关成果以及制约技术转移影响因素的分析方面进行综述。[结果/结论] 现有识别技术转移潜力的分析方法主要有专利引文分析法、社会网络分析法、统计分析法、二元语义分析法和TRIZ分析方法等。这些方法均处于探索阶段。而制约专利技术转移的最主要影响因素为专利价值或专利质量。未来识别技术转移潜力分析方法的研究将集中在以下几个方面:系统分析专利转移的直接影响因素及其实际影响效果;研究企业与大学专利转移行为的差异性;建立有效识别技术转移潜力的综合评估模型。  相似文献   

18.
赵康 《图书情报工作》2017,61(14):99-108
[目的/意义]学术组织是研究人员获取信息资源的重要渠道,考察学术组织社群网络信息交流的特征,有利于更好地发挥组织虚拟社区信息传播的作用,为促进信息共享和知识创造服务。[方法/过程]选择互联网研究者协会为研究对象,以该协会2001-2016年的邮件组存档为数据源,采用社会网络分析方法,分析社群交流网络的主要指标并可视化展示整体网络结构。[结果/结论]研究发现,学术组织社群的网络信息活动具有长尾分布特征,形成多层次的核心-边缘等级结构,随时间推移网络中的凝聚子群结构由密集趋于松散化,反映出从快速发展时期、稳定期到衰退期的历程。指出学术组织需要加强信息建设职责,确保核心成员对虚拟社区的持续关注和治理,营造良性互动的信息生态系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号