排序方式: 共有105条查询结果,搜索用时 15 毫秒
101.
海量数据集上基于特征组合的关键词自动抽取 总被引:7,自引:0,他引:7
关键词自动抽取的任务就是使用计算机自动地从文本中抽取能够高度有效表达文本主题的词汇.小规模训练集和测试集下的关键词自动抽取已经有诸多算法实现,但是大规模分布复杂的数据集上的关键词自动抽取却很少有学者提及.本文利用现有的信息检索技术,对海量数据集上自动抽取关键词问题进行了研究,给出了一个基于特征组合的关键词自动抽取方法.该方法构造了一个大规模的关键词词典;基于TF× IDF值和其他特征,提出了更有效的关键词权重计算方法;根据关键词本身的特点,对候选关键词进行了后处理,使得抽取的关键词更符合读者的要求.本文的后续实验表明,该方法同基于Bayes和KNN等的机器学习方法相比,性能相当.使用自动评价和人工评价两种方法对抽取的关键词进行了评估.专业编辑对抽取结果的人工评价显示,约95%的自动抽取的关键词可以被专业编辑或者读者接受. 相似文献
102.
2021年中国科协学会服务中心启动编制《中国科技期刊产业发展报告(2021)》(以下简称《产业报告(2021)》)工作,总体目标和定位是梳理中国科技期刊产业发展历程,客观呈现产业发展现状和动态趋势,总结科技期刊产业整体规模、产业结构、上下游分布,以及用户结构和需求等信息,设计科技期刊产业发展的定量化评价指标体系,深入描述和分析科技期刊发展的主要影响因素,分析产业发展面临的新环境和新特征,完成对中国科技期刊产业发展的深度解析和前景展望。 相似文献
103.
《中国学术期刊(网络版)》(CAJ-N)是经国家新闻出版广电总局批准创办的网络连续型出版物.按国家有关网络连续型出版物管理规定,在CAJ-N出版传播平台上网络首发的学术论文可被认定为正式出版,其论文作者可以从"中国知网"下载或打印论文,作为正式发表的论文提交给人事、科研管理等有关部门.学术论文首发流程包括学术质量审查、政治审查、编校出版审查以及终审.其中,终审是论文首发质量把控的最后一道关口.为全面减少或消除首发论文的差错,从而保证论文快速及时上线,本文从网络首发论文终审编校需要注意的问题着手,对政治质量、学术质量、编校出版审查3个方面的审查重点进行了阐述,可为作者写作投稿以及入编期刊编辑部论文首发的编校提供参考. 相似文献
104.
105.
【目的】从传播力角度客观真实反映我国科技期刊发展现状,提出符合科技期刊传播实践、具有可操作性的科技期刊传播力指标体系。【方法】以传播学5W经典传播模式为框架,采用文献调研法、专家咨询法、实践调研法,对我国科技期刊传播链各环节要素进行梳理分析,设计构建科技期刊传播力指标体系。【结果】总结分析科技期刊传播链及传播要素,从传播者、传播内容、传播渠道、传播受众和传播效果5个方面,构建由5个一级指标、13个二级指标、21个三级指标构成的科技期刊传播力定量评价指标体系。【结论】提出具有可操作性、系统性、客观的科技期刊传播力综合评价方法,并在《中国科技期刊传播力报告(2022)》中应用,验证指标体系的可靠性。该体系在指标相关性研究、新媒体传播指标设计等方面仍存在不足,需要持续研究、不断完善。 相似文献