首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
[目的/意义] 自动识别项目申请书摘要中的科学要素,对于揭示科技项目中的科学知识具有重要的研究意义。这些科学要素的识别依赖于结构化项目摘要文本,然而目前结构化项目摘要语料资源匮乏,严重制约着相关研究的进一步发展。拟构建项目申请书摘要文本的语步语料集,为相关研究提供数据支撑。[方法/过程] 首先将项目摘要内容归纳为背景及问题、目标及任务、方法内容、价值意义4种语步类型,总结每个语步结构中出现的标志性特征并制定语步标注规范;其次相继利用基于规则和基于深度学习的方法辅助人工进行项目摘要的语步结构标注,并对每轮标注后的语料进行质量评估。[结果/结论] 两种方法共计标注近25 000条语句,语料标注的一致性系数达到0.983 9,表明该语料集基本能够区分项目摘要内的不同语步结构,初步达到了语料库建设的基本要求。  相似文献   

2.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

3.
[目的/意义] 科技文献中的概念是对文献中知识高度凝练的表达,通常以定义句的形式出现在科技文献中。自动从概念定义句中抽取概念,能够进一步挖掘科技文献中蕴含的重要知识。[方法/过程] 通过分析概念定义句的结构、句式等模式特征,提出以WCL数据集为基础的语料构建方案,并采用BERT+BiLSTM+CRF模型学习概念定义句的模式,从而实现概念短语抽取。[结果/结论] 结合以往对概念定义句模式特征的研究,创新性地提出一种基于序列标注学习概念定义句的组成模式,从而实现概念短语抽取。通过BERT+BiLSTM+CRF模型,有效学习了概念定义句中的上下文语义、句式结构、组成项分布等模式特征,实现了句子中概念短语的抽取。  相似文献   

4.
梁爽  刘小平 《图书情报工作》2022,66(13):138-149
[目的/意义]梳理国内外基于文本挖掘的科技文献主题演化相关研究,对主题演化分析中使用的各种方法进行分类、归纳与总结,并提出现有研究存在的不足,为主题演化研究提供新的思路与借鉴意义。[方法/过程]依照国内外学者进行主题演化研究的一般流程,对数据集选取与对象分析、主题识别研究、主题演化研究(主题演化时序分析、主题强度演化分析、主题内容演化分析)3个分析层面中所使用的各类模型、指标与方法进行梳理比较与优缺点总结,提出现有研究的局限性并对未来发展做出展望。[结果/结论]当前研究已具有一定规模和较为成熟的分析体系,但仍存在以下不足:数据来源较为单一;LDA及相关扩展模型存在的弊端需进一步克服;缺乏对其他机器学习及深度学习算法的探索应用;演化分析方法需相互结合、互补互融。未来应针对以上问题做出相应改进与深入探究。  相似文献   

5.
[目的/意义] 学术论文始于问题,探讨学术论文的研究问题,为揭示学术论文的核心内容,实现基于问题的学术论文知识发现提供参考。[方法/过程] 以2015-2020年间图书情报领域CSSCI期刊发表论文为数据源,随机抽取1 000篇论文为样本,利用内容分析法对题录信息进行统计,分析学术论文的研究问题类型、结构,归纳学术论文类型与其包含研究问题类型和数量关系,以及一篇学术论文多个研究问题的关系与结构形态。[结果/结论] 研究发现,不同类型的学术论文包含的研究问题在类型和数量上具有一定的规律性;一篇学术论文通常包含一个以上的研究问题,研究问题个数与问题导向个数具有相关性;一篇学术论文内部研究问题间具有因果、递进等关系,呈现线性、树状、网状的结构形态。  相似文献   

6.
[目的/意义] 为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程] 通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果/结论] 实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。  相似文献   

7.
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和自定义标注方案,提高人工标注效率。最后,执行训练得到的最优模型,结合链路预测方法,对合成生物技术进行细粒度的技术预测。[结果/结论]实证结果表明RoBERTa-BiLSTM-CRF模型更适用于语义复杂的专利技术实体识别,F1值可达到86.8%,技术识别结果比传统IPC分析方法更精细。同时,细粒度的技术预测结果表明,合成生物学的合成方法在不断改进创新,合成物研究向合成燃料发展。  相似文献   

8.
[目的/意义]对科学数据用户相关性线索与标准间关系进行研究,探索数据选择过程中线索与标准发挥的作用,从而为开发智能搜索引擎,提高检索效率提供依据。[方法/过程]选取36名农业领域的研究生,通过出声思考、全程录像和事后访谈的方法研究他们的科学数据检索行为,并使用扎根理论的方法对行为记录报告进行分析。[结果/结论]识别了用户相关性判断使用的科学数据特征集合,建立了科学数据相关性线索集和标准集。在此基础上,构建了科学数据线索与标准间映射关系,初步探索了科学数据用户相关性线索与标准的使用模式。  相似文献   

9.
[目的/意义] 针对当前个人数据安全问题频发现状,通过研究个人数据的概念范畴和基本类型,进一步推动个人数据的理论研究与立法保护。[方法/过程] 综合运用文献调研和网络调研法,对学术文献和政策法律中的个人数据定义进行梳理,并使用比较分析法,归纳出个人数据的14种基本类型。[结果/结论] 定义了个人数据的概念,指出可以从完成程度、技术时代、基本属性、产生平台、社会职业、功能价值、重要程度、年龄特点、存储地点、存在形式、产生条件、自愿与否、保护状态和使用场景14个角度,梳理个人数据的基本类型。  相似文献   

10.
[目的/意义] 探索从科技论文中挖掘出作者研究思路的可能性和技术手段,从而高效地获得新的研究创意。[方法/过程] 提出一种从单篇科技论文中抽取概念地图的方法,通过构建其微观概念地图(MCM)来形象地描述作者在研究中重视并运用的知识结构,通过对概念及其关系的定量分析来推测作者的研究重点和创新思路。[结果/结论] 选取一篇发表在2014年Science期刊上的关于聚类方法的论文,展示其MCM的抽取及论文研究思路的挖掘过程,验证所提方法的有效性。  相似文献   

11.
作者学术关系研究进展   总被引:1,自引:0,他引:1  
[目的/意义] 作者学术关系是指从知识交流的角度出发,作者与作者之间表现出来的某种学术联系。对作者学术关系的研究有利于发现作者之间研究的相关度、学术共同体和科学知识结构,促进知识交流和知识传播,对知识创新和国家知识体系的健全和发展具有重要意义。[方法/过程] 采用综合归纳的方法,从作者合作关系、作者引用关系和作者链接关系3个方面对国内外作者学术关系的研究现状进行梳理。[结果/结论] 国内外学者对作者合作关系、作者共被引关系及作者链接关系的研究趋于丰富,对作者互引关系、作者耦合关系的研究还有待提升;研究领域主要集中在图书情报学领域。未来对作者学术关系的研究方向为作者重名问题分析、大数据引文挖掘及作者学术关系的拓展研究等。  相似文献   

12.
[目的/意义]社交媒体提高了学术信息传播与推送效率,丰富了学术信息和服务的供给能力。学术信息在学术生态中呈跨平台传播态势,微信公众号、知识服务平台和期刊官方网站是重要的学术信息推广媒介。[方法/过程]以CSSCI来源期刊为研究对象,全面调查统计C刊微信公众号开设情况,分析C刊微信公众号运营数据和同期CNKI论文下载量之间的关系。[结果/结论]C刊微信公众号运营能力有待提升,运营数据显著影响CNKI平台论文下载量。提出C刊公众号运营应进行持续性改进的建议。  相似文献   

13.
[目的/意义]从定量分析和定性分析两个方面对英文网络书评进行内容挖掘,形成一套基于信息分类的英文网络书评的内容挖掘方法体系,实现多文本书评的信息整合。[方法/过程]对书评文本中句子的分类方法、关键信息的提取方法、情感分类的方法以及内容的呈现方式等几方面进行实验和改进。[结果/结论]用户评价结果表明,本文所设计的内容挖掘方法所生成的书评信息摘要在生成质量和有用性两方面都有较好的表现。  相似文献   

14.
[目的/意义] 基于引文分析视角对中国古诗词用典问题进行理论分析和实证研究,致力于促进传统人文研究范式向当前大数据时代基于数据驱动的量化研究范式的转变与拓展,推动中国古诗词用典研究与文献计量学方法的交叉融合与创新性发展。[方法/过程] 首先通过对中国古诗词用典行为(现象)与学术论文引用行为(现象)之间异同点的比较对照,对古诗词用典现象的产生与发展、用典动机与用典行为、用典关系与用典网络等进行理论分析;其次,选用《全宋词》和《全宋词典故辞典》等语料,从施典维度和典源维度对宋词用典开展量化实证研究。[结果/结论] 中国古诗词用典现象历史悠久,研究议题丰富,现阶段亟需研究范式的创新和转变。通过理论分析和实证结果可以看出,引文分析法有助于在较大规模古诗词语料上开展更深入的探索。目前研究存在的最大困难在于典故自动识别和提取。未来需加强与NLP技术的密切结合,致力在典故识别提取、用典动机与用典行为分类、用典网络与典故知识图谱构建等问题上提出更有效的自动化解决方案和量化分析策略,以有力促进传统人文研究范式由理论阐释到实证解读、由主观判断到客观揭示、由定性分析到定量分析的转变,并在更多数字人文研究议题上产生出具有创新性的成果。  相似文献   

15.
[目的/意义]针对当前我国高校机构知识库研究与应用离真正的开放互连、知识集成、知识检索还有较大差距的问题,提出一种面向关联数据的机构知识库构建方法,该方法覆盖机构知识库构建的整个过程,并支持机构知识的资源整合、语义检索、知识推理和关联数据发布,为各高校机构知识库建设提供参考。[方法/过程]调研和剖析国内外典型的机构知识库,将机构知识库构建方法分为5个步骤,包括:①评价和选择有价值的信息资源;②建立机构知识库概念模型;③进行语义描述和关联设置;④发现并创建关联化数据环境下的语义推理规则;⑤设计系统架构,并通过西南科技大学机构知识库构建实例来验证该方法的有效性。[结果/结论]实例验证表明,面向关联数据的机构知识库构建方法具有合理性和有效性,起到了降低机构知识库开发难度和缩短开发周期的作用,对于其他机构知识库的建设具有参考价值。  相似文献   

16.
[目的/意义] 梳理和总结现代图书馆学研究方法的演变历程和发展特征,对于图书馆学研究者理解、选择和使用研究方法具有重要意义。[方法/过程] 采用内容分析法对Library quarterly创刊至今所载研究性论文使用的研究方法进行归类、统计和分析。[结果/结论] 结果显示,现代图书馆学研究方法的演变过程实则是对实证方法的扬弃过程,当前图书馆学研究呈现出研究方法多元化的特点。  相似文献   

17.
[目的/意义]代表作评价制度是我国推动学术评价改革的重要措施之一,高校图书馆应助力学科建设发展,创新服务,辅助高校促进和完善论文代表作评价工作。[方法/过程]运用文献调研法、实例调研法、问卷调查法、层次分析法,提出论文代表作"定性+定量"的复合式评价方法,构建论文代表作定性与定量评价指标体系及权重,并通过实践论证复合式评价方法的优劣。[结果/结论]高校图书馆应发挥文献计量和情报服务的优势基础,协助高校推进完善论文代表作复合式评价方法,促进代表作评价中定性评价与定量评价的科学有效融合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号