首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 17 毫秒
1.
在智慧政务的应用背景下,利用深度学习的方法对海量的科技政策文本数据进行自动分类,可以降低人工处理的成本,提高政策匹配的效率。利用BERT深度学习模型对科技政策进行自动分类实验,通过TextRank算法和TF-IDF算法提取政策文本关键词,将关键词与政策标题融合后输入BERT模型中以优化实验,并对比不同深度学习模型的分类效果来验证该方法的有效性。结果表明,通过BERT模型,融合标题和TF-IDF政策关键词的分类效果最佳,其准确率可达94.41%,证明利用BERT模型在标题的基础上加入政策关键词能够提高政策文本自动分类的准确率,实现对科技政策文本的有效分类。  相似文献   

2.
基于OCC模型和LSTM模型的财经微博文本情感分类研究   总被引:1,自引:0,他引:1  
吴鹏  李婷  仝冲  沈思 《情报学报》2020,39(1):81-89
为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法 (support vector machine,SVM)和基于深度学习的半监督RAE方法 (semi-supervised recursive auto encoder)。  相似文献   

3.
沈立力  姜鹏  王静 《图书馆杂志》2022,(5):109-118+135
Google AI团队发布的BERT模型在多项自然语言处理任务中取得了研究成果,但在中文文献自动分类领域尚有待探索。本文旨在探索BERTbase中文基础模型在中文社科、科技期刊文献分类上的实际分类效果,指出模型在实际应用中存在的问题并提出解决方法。本文选取R大类(医药、卫生)、TG大类(金属学与金属工艺)、F大类(经济)、J大类(艺术)共1 745 000条数据作为训练语料,并以另外9 610条数据作为测试样本,利用BERT模型分别对社科、科技期刊文献进行分类研究。测试结果表明BERT模型在社科文献中的四级准确率为76.95%,科技文献为68.55%。之后引入惩罚策略,为实际工作中免检数据阈值的设定提供参考。BERTbase模型在《全国报刊索引》实际分类标引工作中有一定可行性,基本满足当前网络环境下中文文献自动分类的需求。  相似文献   

4.
颠覆性技术是一个具有复杂的内在结构的技术群。从空间维度来看,颠覆性技术是包含了主导技术、辅助技术、支撑技术的复杂技术群,涉及多学科、多领域。在此背景下,运用科学计量的方法对颠覆性技术进行科技评价和科学技术演变规律探索面临挑战,实质表现为数据检索。本文探索了一种基于机器学习的专利数据集构建新策略,将专利检索任务作为机器学习的二分类任务,类似于信息检索中基于主动学习的查询分类思想,并提出了将F-measure特征最大化方法与CNN(convolutional neural networks)模型相结合的文本分类改进方法。本文以人工智能(artificial intelligence,AI)技术域为例进行训练实验,实验结果的准确率、召回率和F1值分别达到98.01%、97.04%和97.89%,这表明本文提出的策略能够精准地识别人工智能专利,提高了专利检索的准确率和召回率,以利于构建精、准、全的人工智能技术域专利数据集。  相似文献   

5.
《全国报刊索引数据库》与高校图书馆用户服务   总被引:1,自引:0,他引:1  
<全国报刊索引数据库>具有收录数据多、学科种类全、报刊回溯久和检索效果佳等特点,在国内有着广泛影响.文章重点探讨<全国报刊索引数据库>对高校图书馆用户的影响、作用及对其发展的期待.  相似文献   

6.
《中文社科报刊篇名数据库》是《全国报刊索引》的电子版检索工具,由上海图书馆文达信息公司《全国报刊索引》编辑部负责研制和编辑.收录哲学社会科学期刊3,800余种,报纸160余种,基本上覆盖了全国哲社类邮发和非邮发的报刊.其检索系统软件运行在中文Windows或Windows+中文之星(或RichWin)上,提供分类、题名、著者、出处、年份、人名和主题等七个检索入口,并支持布尔检索.笔者所在图书馆购买了该数据库的光盘版,收录1993至1996年的数据(另有部分92年及97年的数据)70余万条.该系统以数据量大,检索点较多,用户界面较友好等特点受到读者的欢迎.  相似文献   

7.
人工智能技术推动了新时代图书馆服务的转型,其所具备的大数据分析、图像识别、自然语言处理和机器学习为智慧图书馆带来了新的机遇,使图书馆获得更加宽广的发展空间。利用人工智能技术开展图书馆数字阅读推广活动的应用形式,包括智能搜索与挖掘、智能语音合成、智能阅读助手、智能数据分析、智能推荐、智能代理。目前,利用人工智能开展数字阅读推广活动还存在一些问题,需要国家、各级各类图书馆共同努力。未来,人工智能必将成为数字阅读推广的重要动力。  相似文献   

8.
作为国内最重要的报刊信息类检索刊物,《全国报刊索引》创刊五十年了。五十年来,《全国报刊索引》本着“揭示报刊信息资源,服务社会大众”的宗旨,为全国广大读者与专家学者提供了检索报刊信息资源的便捷工具。上个世纪九十年代以来,伴随文献内容数字化和信息传输网络化的社会进程,《全国报刊索引》也顺应形势,出版了《全国报刊索引》电子版,为读者提供了数字化资源检索的途径。逐步成为图书馆馆藏数字化资源和知识库的重要组成部分。  相似文献   

9.
基于机器学习的中文书目自动分类研究   总被引:2,自引:1,他引:1  
面对与日俱增的图书出版量,图书馆编目人员的手工书目分类显得力不从心,如何实现由计算机自动完成图书分类成为数字图书馆建设中亟待解决的关键问题之一。本文尝试将BP神经网络和支持向量机等机器学习算法引入到书目分类中,建立了面向中图法的基于机器学习的书目层次分类系统模型,提出了采用特征加权方式描述书目和浅层次分类体系构建的设计思路,并通过大规模实验验证了该模型的可行性和合理性,基本上解决了没有主题标注情况下书目的自动分类问题。图9。表5。参考文献14。  相似文献   

10.
上海市报刊图书馆编制和发行的"全国主要报刊资料索引"和复制的报刊资料卡片,无论在为科学研究服务或为"百家争鸣"提供参考资料等方面,都起着一定的作用,并且大大节省了全中各地省市图书馆、大专院校教研室及图书馆、机关资料室等写制卡片的人力、物力和时间。可是,报刊图书馆并不以编制和发行上项资料索引和卡片为满足,因为对科学研究来说,解放前旧期刊资料,也有其一定的参考和使用价值。为此,报刊图书馆现正着手进行曾经在"人文月刊"杂  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号