首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
语义相关度算法在主题抽取中的适用性研究   总被引:1,自引:0,他引:1  
语义相关度的计算方法在信息检索、文本挖掘和自然语言处理等方面有着广泛的应用,而其算法种类很多,这些算法针对不同的应用环境具有不同的适用性.本文汇总了多种语义相关度的计算方法,首先全面地概括分析了各类方法的特点,并以应急预案的主题抽取为背景,通过各种语义相关度算法在基于词汇链的主题抽取中的应用,研究了各种算法对主题抽取效果的影响,从而对各种算法在主题抽取中的适用性给出了相应的评价.  相似文献   

2.
提出一种基于词汇链的关键词抽取方法。该方法通过构造词汇链来描述技术路线图的技术领域主题内容,并将词汇链作为表征技术路线图中领域关键词、核心技术关键词及其语义关系的词汇序列。实验表明该方法抽取的关键词能够更全面地揭示技术路线图的技术领域主题内容,其抽词结果的准确率和召回率较TF-IDF方法有明显的提高。  相似文献   

3.
基于SUMO的应急预案本体   总被引:1,自引:0,他引:1  
构建应急预案本体,可提供对该领域知识一致的共同理解,实现应急管理中多部门的业务协同与信息共享.为此,采用当前比较成熟的本体工程方法,对应急预案相关概念、属性及其关系进行深入分析,抽取领域知识并提炼出业务术语及相互之间的关系.以权威、通用的SUMO为上位本体,运用Protégé 3.1工具,分为上位本体和领域本体两层构建了应急预案本体模型,并基于OWL语言从不同层次对相关的属性、限制、公理进行规范描述,最后采用具有一定影响力的本体评价系统,分别从定性和定量两个角度对所建本体进行评价.  相似文献   

4.
林杰  苗润生 《情报学报》2020,39(1):68-80
专业社交媒体中主题图谱的内容包括论坛中的主题及主题之间的关系,其具有挖掘专业产品创新方向、构建专业知识索引等重要应用价值。本文基于深度学习技术与文本挖掘技术,提出了专业社交媒体中的主题图谱构建方法。首先,使用专业社交媒体中的文本训练Skip-Gram模型,利用该模型的隐藏层权重与模型输出的预测结果,分别获取词语间的语义相似度与上下文关联度。其次,基于该语义相似度与上下文关联度,对已有领域种子本体词汇进行扩充,将语义相似或上下文相邻近的词汇纳入本体词汇,为主题抽取提供高质量的领域词汇。然后,基于扩充的专业本体词汇,使用结合本体词汇的LDA主题模型从专业社交媒体文本中抽取主题与主题词。最后,利用语义相似度与上下文关联度,定义关联度权重,通过图模型与谱聚类,获取主题间与主题词的关联关系与层次结构。本文使用汽车论坛语料进行主题图谱生成实验。实验结果表明,本文方法获取的主题词纯净度相比单独使用LDA模型提升了20.2%,且能够清晰合理地展现主题之间的关系。  相似文献   

5.
[目的/意义]以汽车论坛例,提出一种针对专业社交媒体文本的主题知识元抽取方法。[方法/过程]首先,通过LDA模型提取出汽车论坛中文本的主题,并进行去重,形成主题列表;其次,基于融合主题特征的深度学习模型T-LSTM模型构建适于汽车论坛本文的情感分析模型;然后,通过计算各词汇在图模型TextRank中的重要性与各词汇的Word2Vec主题相似度,抽取情感关键词与关键句,用于对文本主题与情感倾向的解释与补充;最后,对上述方法进行集成,输出结构化的主题知识元。[结果/结论]实验结果中,抽取得到的主题知识元合格率达到69.1%,表明本文提出的主题知识元抽取方法,能够围绕知识主题较为准确地抽取知识元,实现知识的结构化转换。  相似文献   

6.
本文通过对我国各档案网站中公布的档案机构应急预案的调查,对我国档案领域应急预案建设现状进行分析,找出我国档案领域应急预案体系建设问题所在,并从档案应急预案的修订机制、内容建设、体系架构、运行支撑等四个角度提出优化策略,形成档案应急预案成熟度模型,以期完善我国档案应急预案体系建设,推动我国档案应急管理工作纵深发展。  相似文献   

7.
本文以国家层级政府应急预案的文本及体系为对象进行分析,应用内容分析法来辨别出我国国家层级单项应急预案的关键维度、基本架构与功能以及国家预案整体的体系与机制,研究发现我国国家层级应急预案文本包含的预案目的、应急资源和应急过程三类内容要素以及理念规划层、基本制度层、操作实施层三层级文本体例,并以此为模型结合档案部门应急的特点与情况,梳理推导出档案部门应急预案理论框架及档案突发事件应急机制,为进一步完善我国档案部门应急预案的制定与实施提供了有益参考。  相似文献   

8.
适用于隐含主题抽取的K最近邻关键词自动抽取   总被引:1,自引:0,他引:1  
众所周知,K最近邻方法作为机器学习领域的一个经典的方法,在很多领域都有出色的表现.本文利用K最近邻方法的思想,提出了一种基于K最近邻的关键词自动抽取方法.现有的关键词抽取技术仅仅是对正文词汇的抽取,不能抽取隐含主题.隐含主题的抽取是关键词自动抽取技术的难点,但是该方法可以有效抽取隐含主题.该方法首先对数据进行预处理,使用向量空间模型将文本表述为数学化语言;然后,以人工标注关键词的文献数据作为训练集,使用K最近邻方法构建新文献的关键词候选集;最后,根据关键词本身的特点对候选关键词做了有效的后处理.实验表明,该方法不仅可以提高关键词抽取的准确率和召回率,还可以有效抽取文章的隐含主题.  相似文献   

9.
建立健全档案馆应急预案体系,对于有效预防和应对各种突发事件,保护档案馆及馆藏档案安全具有重要的现实意义.文章首先阐述了档案馆制定应急预案的必要性,然后对现阶段档案馆应急预案体系建设存在的不足进行了剖析,在此基础上,对如何构建档案馆应急预案体系进行了思考.  相似文献   

10.
2005年"非典"以后,国务院发布了<国家突发公共事件总体应急预案>及与其配套的一系列专项预案和部门预案.之后,全国各省、市、县也都建立了本级自然灾害的应急预案,我国的应急预案框架体系至此已初步建立.企业档案馆作为保管和利用企业档案的重要场所,汇集了企业经营管理的各种信息.因此,制定完善的企业档案馆防灾应急预案,是企业档案安全保障体系建设的重要环节之一.  相似文献   

11.
传统的关键词自动抽取常以候选词的出现频次、位置等非语义信息构建特征,并未考虑关键词在学术文献中承担的特定语义角色,即词汇功能。通过对现有数据统计,本文发现作者标注关键词中约有67.99%是研究问题或研究方法词。因此,本文将关键词的词汇功能分为三类:“研究问题”“研究方法”和“其他”,在传统的词频特征以及位置特征基础上,融合词汇功能特征,使用计算机领域的学术文献基于分类和排序两种思想进行关键词抽取实验。实验结果表明,融合词汇功能后,关键词抽取效果得到明显提升。相较于基准实验,二分类模型的准确率Acc和F值分别相对提升24.63%和25.19%,达到了0.840和0.666;排序模型的MAP、NDCG@5和P@5分别相对提升168.32%、189.50%和148.30%,提升至0.813、0.828和0.447,证明了学术文献词汇功能特征在关键词自动抽取中具有重要作用。  相似文献   

12.
关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。  相似文献   

13.
主题抽取是自然语言处理研究的重要问题之一.目前流行的方法是"词典 匹配",但该方法用于处理动态变化的网页信息时,词典难于及时更新等弊病就表现出来.本文作者在研究中文新闻网页内容、结构特点的基础上,提出了一种利用Web页面结构无需词典的主题抽取算法.我们使用该方法对新华网财经新闻语料1000篇进行主题抽取实验,并与手工抽取的主题进行比较,结果表明,重合率高达93%以上.  相似文献   

14.
面向信息检索的词汇知识发现   总被引:1,自引:0,他引:1  
针对信息检索中词汇知识发现问题,提出面向信息检索的词汇知识发现框架结构,对面向信息检索的词汇的定义、同义词、相关词、排除词等词汇知识获取与挖掘进行详细的介绍,为后续的语义检索研究打下基础。  相似文献   

15.
Web概念挖掘中标引源加权方案初探   总被引:15,自引:3,他引:15  
通过对随机采集的1 800篇涉及经济、心理、文学、教育4个学科类别的网页进行人工自由标引、人工打分、词频统计,并进行统计数据的分析,得出网页内容主题与网页题名、文章标题、第一段首句、第一段尾句、第二段首句、第二段尾句、首段、尾段以及HTML标记等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值。在我们的Web文本挖掘系统中,进行加权的对比实验表明,此权重方案优于前人的方案。  相似文献   

16.
词汇链是文本中一系列词汇关联而成的语义链,构造词汇链有助于提高文本的连贯性,把握文本主题。借鉴概念层次网络(HNC)理论对词汇语义进行形式化描述的原理,研究基于语义网络节点遍历计算的词汇链构造方法。首先对汉语文本进行分词处理,从知识库中获得词语的HNC符号,然后对语义符号进行解析,获得词语的语义关联性并构造词汇链;最后,对词汇链进行优选处理,设定阈值获得优选词汇链。实验结果表明,该方法构造的词汇链可接受度较高,对主题标引、自动文摘、文本分类等有重要价值。  相似文献   

17.
胡漠  马捷  李璐 《图书情报工作》2019,63(15):23-32
[目的/意义]探析智慧城市多元主体信息链的协同效应作用机理,有助于智慧城市管理者获悉提升智慧城市多元主体信息链协同效应的关键因素,从而在多元主体信息链协同服务层面提升智慧城市的智慧水平,为民众提供更加优质的智慧服务。[方法/过程]在识别与分析我国智慧城市多元主体信息链的信息主体、信息、信息环境基础上,围绕主体协同、信息协同与机制协同3个维度提出6个关于智慧城市多元主体信息链协同效应作用机理的研究假设,通过问卷调查获取456组有效数据,并采用结构方程模型对提出的研究假设进行检验。[结果/结论]检验结果表明,机制协同与信息协同直接作用于智慧城市多元主体信息链协同效应;主体协同通过机制协同与信息协同间接作用于智慧城市多元主体信息链协同效应。根据检验结果,提出5个具有针对性的提升智慧城市多元主体信息链协同效应的具体策略,为智慧城市多元主体信息链协同效应作用机理研究与实践提供有益参考。  相似文献   

18.
[目的/意义] 研究美国图书馆组织气候改进方案的决策形成过程,为国内图书馆开展组织气候测评、基于组织气候测评结果制订管理政策改进方案提供参考和借鉴。[方法/过程] 采用典型案例分析法,对美国3所图书馆利用ClimateQUALTM 测评结果确立本馆管理活动优化方案的决策过程进行分析和归纳。[结果/结论] 3所图书馆确立管理活动优化方案的决策过程模式可以归纳为:自下而上式的决策过程模式、决策软件支持下的决策过程模式、咨询顾问主导下的决策过程模式;根据既有案例,可从管理态度重视、实施主体选择、馆员意见征集、管理方案初选和优化等视角得出对国内图书馆开展组织气候优化的启示。  相似文献   

19.
[目的/意义]以用户情感为线索的图像检索已成为机器学习研究的热点,但图像情感特征标注的语料数据多来源于对图像低层特征的抽取,从而导致图像检索过程单一化和程式化。本文提出了一种基于深度学习的图像情感特征抽取的算法,将图像底层特征融合到图像的高层情感语义当中,为实现图像的情感语义检索提供了参考。[方法/过程]利用改进的卷积网络模型,将数据集图像的颜色、纹理作为输入,经多层运算自动提取图像的情感信息,并通过反向传播算法计算出改进后模型的情感检索准确率,构造出准确率较高且过拟合程度低的图像情感特征提取模型。[结果/结论]应用改进的卷积神经网络模型,实现了对图像情感特征的抽取,相较于原模型提升了10%的检索准确率。  相似文献   

20.
从引文分析看档案学与图书馆学、情报学的学科融合   总被引:1,自引:0,他引:1  
从引文分析的角度,利用档案期刊论文的参考文献来研究档案学借鉴图书情报领域相关知识情况及其随时间变化的发展趋势,同时,对学科交叉部分进行词频分析,把握图情档三学科关注的共同问题。从而体现出信息化战略背景下,档案学的研究对象和研究内容的拓展和延伸。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号