共查询到19条相似文献,搜索用时 156 毫秒
1.
分类评价是当前科学评价的热点和难点.本文从评价实践出发,分析了评价数据的特征,论证了利用题录信息进行分类的可行性.结合评价要求和已有分类体系,提出<学科分类与代码>是中国科学评价领域的最佳分类体系.在梳理常规分类方法的基础上,归纳出这些方法适合于分类评价的方面,而且对这些方面进行进一步的改造和融合,提出和构建了科学评价论文分类系统,其特点是"二次分类"和"自动生成训练集".一次分类由期刊分类器和类号转换器完成,在将全部论文分到大类的同时可以将部分论文分到小类,分到小类的作为该大类的训练集.二次分类由SVM和投票机制组成,有效提高了系统的召回率.实验证明本系统能胜任科学评价中的论文分类任务. 相似文献
2.
[目的/意义] 探讨不同学科分类体系在机构科研影响力评价中的差异及对评价结果的影响。[方法/过程] 以Incites数据库为数据来源,选择5种分类体系、8种分类方案。首先对14 955个机构不同分类方案下的学科标准化引文影响力(Category Normalized Citation Impact,CNCI)进行相关性分析,考察不同分类体系下评价结果的整体相似性。然后以国内双一流建设中的36所高校为例,比较和分析不同分类方案下机构CNCI值的变化情况及差异产生的具体原因,研究分类体系对个体机构评价的影响。[结果/结论] 不同学科分类方案下得到的CNCI值相关性显著(最低相关性达到0.85),即不同分类体系得到的整体评价结果具有较高的相似度。但是不同分类体系下的评价结果也存在聚类特征,OECD、ESI、SCADC、CT1相互之间相关系数高、结果更相近,WoS、CT2和CT3评价结果更接近,分类体系的粒度是决定评价结果的重要因素。36所高校在不同的分类体系下评价结果的整体相关性较高,但个别高校CNCI值变化较大,特别是在热点主题上有突出发文的机构。评价结果的巨大差异其根本原因是论文划分到不同类目中,不同类目下的引用基准值不同。在评价过程中更加推荐粒度较细的分类体系,减少热点主题等对引用基准值的影响。 相似文献
3.
大多数期刊评价体系都是分学科进行评价,但是不同的评价体系在进行期刊分学科评价时,对于期刊分类归属的方法都不相同.文章针对北京大学图书馆主持的《中文核心期刊要目总览》的分学科方法进行详细解读,分析了按学科论文入手进行指标值统计,然后根据期刊所载论文和施引论文的分类进行综合计算给期刊自然归类的方法,并提出进一步研究的设想. 相似文献
4.
5.
【目的】通过构建个性化分类体系,研究面向TRIZ应用的专利自动分类方法。【方法】基于主题模型,从宏观、中观、微观三个层面构建面向TRIZ个性化分类体系;通过对不同分类特征项与算法进行组合,挑选分类准确率最高的组合构建初始分类器;采用平滑非平衡数据与特征项降维方式对分类器进行优化,完成对专利的自动分类。【结果】实现半自动构建面向TRIZ的个性化分类体系及基于该分类体系的专利自动分类。在中等数据量级场景下(千条),实现专利自动分类,分类效果综合评价指标高达90.2%。【局限】该方法不适用于数据量较小(百条)时的专利分类;在较大数据量(万条)场景下,该方法的有效性尚未得到验证。【结论】对中等规模专利数据,能快速构建面向TRIZ的分类体系,并实现自动分类。 相似文献
6.
科技期刊评价通常是基于某个数据库的引证数据,计算总被引频次、影响因子等评价指标。要想得到全面客观的评价结果,最关键的是统计源、分类体系、指标体系设计。文章介绍了《科技期刊世界影响力指数(WJCI)报告》在统计源遴选方法、分类体系、评价指标方面的设计,改变过去先有数据库、再有期刊评价的旧模式,将统计源的合理遴选放到第一步,这样有助于改善中国及其他非英语母语国家科技期刊在当前世界期刊评价体系下的不利地位,探索世界科技期刊更加全面、合理的影响力评价方法。 相似文献
7.
8.
图书馆数字资源评价指标体系研究 总被引:3,自引:0,他引:3
数字资源已经成为图书馆资源的重要组成部分,对于数字资源的引进如何选择,目前还没有一个比较满意的评价体系,本文试图通过对数字资源评价指标分类及其指标值的量化,对数字资源评价方法进行探讨。 相似文献
9.
将人工智能研究领域中的文本自动分类技术应用于信息资源管理领域是当前的研究重点之一,而目前信息资源管理领域具有体系结构严格、类目数量巨大、类目层次众多等特点。本文充分考虑这些特点,针对《中国图书馆图书分类法》分类体系下文本自动分类研究的现状,从研究目的、类目体系、资源类型等方面,参考国外相关研究的成果和方法予以分析和评价;结合国外相关研究的最新成果,提出我国在《中国图书馆图书分类法》分类体系下应用文本自动分类技术时应注意的问题及今后的研究方向。 相似文献
10.
11.
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。 相似文献
12.
情报检索语言的发展方向问题--分类主题一体化新论 总被引:3,自引:0,他引:3
对国内外五种著名分类主题一体化词表作了剖析,从新的视角揭示了一体化词表的实质,并根据情报检索语言的发展现状,阐明了分类主题一体化的前景,从而看清情报检索语言的发展方向。 相似文献
13.
借鉴和利用农业科学主题词表的语义关系和领域概念,描述农艺领域内的概念以及概念之间的关系,以农业领域专业词典、《农业专业分类表》、《农业科学叙词表》及农业文本为语料,吸收分面叙词表的编制思想,利用开发工具Protégé2000来构建古代农艺的领域本体,以实现对古代农艺资源的有序组织和有效利用。 相似文献
14.
15.
��������һ�廯�ʱ�����ۼ��������� 总被引:3,自引:0,他引:3
本文主要对分类主题一体化词表的理论及研制进行述评,包括分类主题一体化研究的发生与发展、分类主题一体化概念、分类法与主题法结合一体的理论及我国检索语言词表研制的发展进程和发展趋势。 相似文献
16.
分面分类在网络资源组织中的应用 总被引:15,自引:1,他引:14
针对网络信息资源的特点,构想在网络信息资源组织中使用分面分类的几种方式,包括在编制分类搜索引擎的分类表时使用复分表、仿分,在信息标引中使用分面叙词表,在综合性分类搜索引擎的检索界面上部分使用分面分类思想,在专业性搜索引擎检索界面上完全使用分面分类表进行可视化检索等。 相似文献
17.
基于叙词表的领域本体构建研究 总被引:15,自引:2,他引:15
论述了叙词表与领域本体(Domain Ontology)的区别与联系,讨论了基于叙词表构建领域本体的优越性,简要介绍了本体开发工具,最后提出了一种基于叙词表的领域本体构建方法,通过一个本体原型构建过程对该方法进行了详细阐述。 相似文献
18.