首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
[目的/意义]基于专利技术—应用二维网络框架开展研究,有助于企业全面识别竞争对手,为战略制定提供情报支撑。[方法/过程]从专利技术文本和应用文本相结合的视角,提出基于文本信息分析的竞争对手识别框架。搜集和预处理专利数据,构建技术和应用的词汇文档矩阵,采用t-SNE方法开展降维和主题识别,构建专利技术—应用二维热图,结合焦点企业技术布局,识别直接竞争对手、潜在竞争对手、间接竞争对手。[结果/结论]以DHA技术领域为例,全面识别了雅培公司的多种竞争对手,证实了方法的可行性。  相似文献   

2.
[目的/意义]提出融合母评论文本信息的评论短文本情感分类模型以提高互联网环境下短文本评论情感分析效果,适应舆情工作中的实际应用需求。[方法/过程]以短视频平台舆情事件的评论数据为实验对象,利用GRU提取母评论文本特征和直接提取评论区特征,分别将这些特征与CNN提取原评论文本特征并行融合进行情感分类。[结果/结论]相较于传统深度学习方法,引入的母评论文本特征使两个数据集的情感分类效果都获得了一定提升,F1值等均分别提升了2%和1%,说明本文提出的特征引入方案能够提升评论短文本的分类效果,为舆情工作中的情感监测实际应用提供了思路,验证了舆情相关理论研究对实际技术应用有借鉴和指导意义。  相似文献   

3.
[目的/意义]探索不同社会科学学科间差异,支持学科建设、科技检索服务,进一步完善文献学科的分类体系。[方法/过程]基于多种深度学习模型和预训练语言模型构建社会科学文献学科分类器,利用CSSCI目录中的20多个一级学科中近350万篇文献构成的数据集进行实验;利用Sentence-BERT输出摘要句子向量并进行层次聚类,根据聚类结果划分学科组,并计算模型对于不同学科组的分类性能以缓和学科交叉的影响;利用模糊准确性指标输出模型对每条记录输出的前N个高概率学科以弥补原有学科分类的局限性。[结果/结论]在“摘要+标题”上使用深度预训练语言模型取得最佳性能;基于层次聚类所得的学科组进行的分类较单一学科性能有所提升;模型的模糊准确性在N=3时能够达到96%。[局限]未考虑从全文文本上获取更丰富的文献学科特征进行自动分类。  相似文献   

4.
LDA模型在专利文本分类中的应用   总被引:1,自引:0,他引:1  
对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。  相似文献   

5.
徐彤阳  尹凯 《情报科学》2019,37(10):13-19
【目的/意义】引入人工智能领域中的深度学习方法来解决数字图书馆中传统文本分类的缺陷,这既是人工 智能领域研究的重点,也是图书馆领域关注的热点问题。【方法/过程】在对数字图书馆传统文本分类进行系统梳理 的基础上,提出基于深度学习的数字图书馆文本分类模型,利用词向量的方法对文本特征进行表示,采用深度学习 模型中的卷积神经网络提取文本信息的本质特征,并进行了实验验证。【结果/结论】实验测试表明,基于深度学习 的文本分类模型可以有效地提高数字图书馆文本分类的准确率和召回率,不仅可以提高数字图书馆内部业务的智 能化程度,还可以提高数字图书馆信息服务的效率和质量。  相似文献   

6.
尹莉 《情报探索》2020,(4):9-15
[目的/意义]旨在研究引文分析中引入情感分析后对论文排名的影响。[方法/过程]提出一种引文情感分析方法,确定引文文本中的情绪,并使用监督分类器为每个文本句分配一个分数来确定其情感倾向,利用C4.5决策树对引文的极性进行分类;提出一个考虑定量(引用次数)和定性(情感分析)因素的论文评价指数pc指数,并基于该指数对论文进行了排名。[结果/结论]C4.5决策树对引文的极性进行分类,获得了较为准确的结果;pc指数对朴素算法进行改进后获得了对被引论文的影响力新的排名,排名对于较小的语料库影响不大(只有4篇论文排名发生了变化),而对于更大的语料库,预计影响会更大。  相似文献   

7.
KNN算法是文本分类技术中比较常用的算法。但是,当训练集容量较大时,KNN算法分类的效率大大降低。在对中文短信文本的分类时,结合中文短信文本的特点,给出了先由LAS算法进行降维,然后利用KNN算法进行分类的算法。实验结果表明,该算法提高了中文短信文本的分类质量和分类速度。  相似文献   

8.
[目的/意义]科技论文是学术界传递和交流知识的重要方式。科技论文评审是对科技论文承载的知识的价值衡量,高效准确的科技论文评审分类预测可以快速判断论文价值,加速有价值的知识传播进程。[方法/过程]本文讨论开放同行评审中自动评审分类方法,利用科技论文语义信息和开放同行评审中的专家评分,分别构建基于传统机器学习和基于深度学习的科技论文文本表示及分类模型,提供自动评审分类结果。[结果/结论]实验结果表明,融合语义信息和评分信息的评审分类模型比单纯依靠评分均值进行评审判断更为有效,以评分+均值为评分信息输入、基于SCIBERT的质量评审分类模型准确率最高,达到90.17%。本文提出的自动评审分类方法具有可用性,准确率较高,可以辅助期刊编辑快速筛选有潜力的科技论文,促进科技论文智能评审的发展。  相似文献   

9.
[目的/意义]丰富的互联网数据为洞悉真实事件提供了多维视角,快速识别突发事件并准确判断其所属类别,有助于各级政府及应急管理部门高效地管理应急情报资源。[方法/过程]文章构建了基于文本—图像增强的突发事件识别及分类的理论模型;通过文本卷积神经网络、视觉几何群网络搭建深度神经网络共同组成Multi-DNN模型;最后以真实的自然灾害类突发事件数据进行实例验证。[结果/结论]通过文本、图像相互增强,多模态特征融合能够提升突发事件识别及分类的准确率,同时在小样本数据的任务处理中仍有良好效果,证明不同模态的数据能够相互补充、相互印证,对其融合处理能够提供比单一模态更为准确和全面的信息分析。  相似文献   

10.
【目的/意义】为了提高图书情报的实时检索能力,需要进行图书情报共引数据整合模型设计。【方法/过程】 提出一种基于文献计量共引分析的图书情报数据的整合方法,构建图书情报文献计量共引数据整合的射频标签识 别模型,采用RFID标签技术进行图书情报文献计量共引数据的自动采样,对采样的大数据采用语义相似度特征提 取方法进行信息融合;结合文献计量共引分析方法进行图书情报数据的自适应聚类分析和整合分类,构建反映图 书情报归类的语义本体模型。通过自相关特征匹配方法实现对图书情报文献计量共引数据的优化分类检索和整 合。【结果/结论】测试结果表明,采用该模型进行图书情报文献计量共引数据整合的分类性能较好,数据检索的查 全率和查准率较高,提高了图书情报的检索效率。  相似文献   

11.
李勇男 《现代情报》2018,38(1):51-55
[目的/意义]聚类分析是数据挖掘的常用方法之一,使用聚类簇内数据相似性大、簇间数据相似性小的特点,可以实现对海量基础涉恐数据快速、准确、有效的分组。[方法/过程]本文研究如何利用基于雅卡尔系数的聚类方法对涉恐情报进行分析。在聚类之前要删减与涉恐相关性小的属性并将所有连续属性进行离散化处理。通过不断迭代计算样本数据集的雅卡尔系数并更新不同簇中的元素,直到达到设定的终止条件为止实现涉恐情报的聚类。[结果/结论]文中的方法可以实现对涉恐基础数据的初步分级分类,同时通过有经验的情报分析员定级以及与数据挖掘分类方法结合使用,可以有效提高情报分析的效率,为反恐预警提供量化的参考依据。  相似文献   

12.
[目的/意义] 在信息检索、科技论文评价和知识结构演化方面,引文分析都起着至关重要的作用。随着格式化全文数据库的出现,引文分析迈入了4.0时代——全文引文分析阶段。但是,目前还没有中文的格式化全文数据库,这极大地制约了全文引文分析在我国科技文献中的研究和应用。[方法/过程] 在本文中我们提出建立高效的中文全文引文分析依赖的数据集和检索平台的方法,主要包括:1)提出了基于规则和SVM分类方法的论文元数据和引用提取方法;2)提出基于Spark平台的实现高效引文内容分析标准化数据集生成方法;3)提出建立引用内容的科技文献检索平台。[结果/结论] 引文内容分析标准化数据集的建立将全面提升全文引文分析在我国科技领域中的研究效能,提高科技文献查找精度。  相似文献   

13.
[目的/意义]针对单纯使用统计自然语言处理技术对社交网络上产生的短文本数据进行意向分类时存在的特征稀疏、语义模糊和标记数据不足等问题,提出了一种融合心理语言学信息的Co-training意图分类方法。[方法/过程]首先,为丰富语义信息,在提取文本特征的同时融合带有情感倾向的心理语言学线索对特征维度进行扩展。其次,针对标记数据有限的问题,在模型训练阶段使用半监督集成法对两种机器学习分类方法(基于事件内容表达分类器与情感事件表达分类器)进行协同训练(Co-training)。最后,采用置信度乘积的投票制进行分类。[结论/结果]实验结果表明融入心理语言学信息的语料再经过协同训练的分类效果更优。  相似文献   

14.
闫肖婷  刘向 《现代情报》2019,39(6):24-31
[目的/意义]主路径上核心主题的演化可以反映行业发展方向,凸显行业热点技术并预测技术的未来发展,有效判断技术主题间的传承演变关系。[方法/过程]本研究构建一种凸显主路径上的核心主题及演化方法。该方法不同于文本挖掘和聚类,是基于引文网络主路径映射专利分类号的链接计数,通过专利的分类号替代技术主题在主路径上演化并计算节点的技术主题含量,以技术主题含量的变化凸显主路径上的核心主题及其发展历程。[结果/结论]展示有机发光二极管OLED的主题演化图,证实了该方法的合理性。  相似文献   

15.
颜端武  江蕊  杨雄飞  鞠宁 《现代情报》2018,38(7):165-170
[目的/意义]针对网络产品评论细粒度意见挖掘的研究进展进行分析和总结,在明确其主要任务的基础上,探讨涉及的关键技术、研究成果以及未来发展趋势,为该领域研究未来的发展提供建议。[方法/过程]本文主要采用文献综述的方法,对国内外相关研究进展进行分析和归纳,由粗粒度意见挖掘引申到细粒度意见挖掘,在明确细粒度意见挖掘主要任务的基础上,重点针对其关键技术和研究进展进行总结。[结果/结论]本文明确了网络产品评论细粒度意见挖掘的主要任务,包括主客观句分类、评价要素抽取和情感极性计算,总结了各个任务涉及的关键技术。  相似文献   

16.
[目的/意义]有效融合引文网络中的引用关系和文本属性等多元数据,增强文献节点间的语义关联,从而为数据挖掘和知识发现等任务提供有力的支撑。[方法/过程]提出了一种引文网络的知识表示方法,先利用神经网络模型学习引文网络中的k阶邻近结构;然后使用doc2vec模型学习标题、摘要等文本属性;最后给出了基于向量共享的交叉学习机制用于多元数据融合。[结果/结论]通过面向干细胞领域的CNKI引文数据集的测试,在链路预测上取得了较好的性能,证明了方法的有效性和科学性。  相似文献   

17.
目的】学科分类作为科学研究的框架,在科学的发展中具有重要的作用。以计量学理论为基础,以《中国图书馆分类法》自然科学领域二级类目为分析对象,利用引文数据分析学科之间的相关关系,对二级类目进行修正,希望构建适应期刊分类定位需求的合适的分类体系。【方法】基于中国科学引文数据库,借助期刊之间的耦合强度研究学科之间的相关关系。【结果】通过聚类分析的方法,建立起一个经过整合之后的改进的学科分类体系,在此基础上运用关键词识别、主题挖掘等文本挖掘方法对新构建的学科分类体系的合理性进行解释。【结论】基于期刊耦合强度的学科分类体系具有符合目前期刊发展和学科发展的特点。  相似文献   

18.
[目的/意义]在当今数字网络、知识经济和大数据背景下,"五计学"学科群表现出一些新的发展特征和发展趋势,"五计学"领域出现了新现象和新问题,需要采用新思维和新方法来研究和解决"五计学"研究成果,整合"五计学"研究方法,为"五计学"的融合发展指明方向。[方法/过程]本文运用内容分析法与归纳演绎法对相关研究进行分析。[结果/结论]尝试性地提出了6种"五计学"知识融合实现模式:基于语义规则的知识融合,基于贝叶斯网络的知识融合,基于D-S理论的知识融合,基于知识挖掘的知识融合,面向网格环境的知识融合以及面向近似知识的知识融合;提出了2种"五计学"知识融合过程控制手段分别是知识融合评价和知识融合系统。  相似文献   

19.
陆康 《现代情报》2019,39(10):102-109
[目的/意义]互联网社会的形成让高校处于数据圈之中。高校用户的数据搜索习惯存在着差异性。Web搜索仍然是用户信息查阅的基本方式。大数据的非结构化、数据量大以及数据挖掘与语言处理等问题的存在,用户对搜索结果的满意度不高。高校用户的"小数据"能够反映其显性需求,其数据分析与挖掘能够反映出用户的隐性需求。以用户为中心的服务体系是提高服务效率、提升用户满意度与忠诚度的最有效方法之一。[方法/过程]以文献分析为基础,分析高校图书馆业务数据的构成、收集意义、规范、方法与用途。探索高校图书馆业务数据收集方法,以及构建"数据圈"支持图书馆智慧服务开展的必要性。[结果/结论]高校图书馆"数据圈"的形成,是智慧图书馆伴随着互联网社会发展的必经之路,也是智慧服务得以有效实施的基础。"数据圈"形成的规范化、标准化也是智慧图书馆领域所要重视的问题。  相似文献   

20.
[目的/意义]专利是企业技术创新活动的重要成果,对专利数据进行分析,有利于客观评价企业技术创新能力。[方法/过程]从计量的角度对企业专利数据进行分析的同时,结合机器学习的方法,通过LDA模型对专利摘要文本进行内容挖掘,构建基于专利文本内容的评价指标,建立由专利数量、专利趋势和专利内容三方面指标组成的技术创新评价体系。[结果/结论]采用熵值法确定各项指标对企业技术创新的影响权重,并通过实验对国内自主品牌制造企业进行技术创新评价,说明了评价方法的现实意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号