首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
新媒体时代网络评论观点信息发现机制研究   总被引:1,自引:0,他引:1  
[目的/意义] 舆情分析工作中的一项重要任务就是从冗杂的网络评论中发现具有代表性的网民观点信息。[方法/过程] 提出一种无监督的信息发现方法,从网络评论内容中抽取具有代表性的网民观点表述。具体发现过程为,在网络评论中选取作为候选的观点表述语句,继而综合考察评论内容与相应文章的相关程度以及候选的观点表述语句中词汇之间的点互信息并对观点表述语句进行信息加工,最终得到具有代表性的用户观点表述信息。[结果/结论] 本文所提出的信息发现方法取得了较好的实验检验效果,可为新媒体时代舆情研判工作者在繁杂冗余的网络评论观点中自动发现观点信息提供决策支持。  相似文献   

2.
俞琰  陈磊  赵乃瑄 《图书情报工作》2019,63(10):134-142
[目的/意义] 为帮助高校师生充分利用网络招聘信息,提出基于大数据量网络招聘文本挖掘的课程知识模型及其自动构建方法。[方法/过程] 本文提出包含"岗位-课程-知识点"的三级课程知识模型,利用自然语言文本挖掘技术实现课程知识点模型的自动构建,并通过实验对其构建过程进行验证和分析。[结果/结论] 实验结果表明本文提出的模型及方法具有高度的可行性与有效性,可为高校和学生提供教学和学习参考。  相似文献   

3.
[目的/意义]针对中文专利候选术语选取方法存在需要对不同的数据集分别制定不同的模式匹配规则、专利术语抽取准确性不高等问题,本文提出基于依存句法分析的中文专利术语选取方法,以提高中文专利术语抽取准确性。[方法/过程]主要包括依存句法分析、剪枝、生成依存子树等三个主要步骤。首先对中文专利进行依存句法分析,得到依存树,对依存树进行剪枝,去除不符合要求的依存关系,生成依存子树,从中选取连续词串作为候选术语,以抽取中文专利术语。[结果/结论]实验结果表明,与已有的中文专利候选术语选取方法相比,本文提出的基于依存句法分析的中文候选术语选取方法能够有效地提高中文专利术语抽取的准确性。  相似文献   

4.
[目的/意义]在海量网络新闻和微博等新媒体文本中自动识别网络热点话题并抽取有意义词串来描述热点事件,对自动识别和描述网络舆情具有重要的研究意义。[方法/过程]在现有热点描述词抽取方法中,利用关联规则或多元词组合方法在抽取过程中存在噪音词较多和特征词语义被放大或转移等问题。本文提出一种基于复合词生成的描述词抽取方法,在所提取的语义更为精确的描述词集合上使用一趟聚类算法对新闻文本进行聚类,自动识别网络热点话题并对热点话题进行排名。[结果/结论]对腾讯新闻事件文本数据集所做的实验结果表明,本文所提出的方法较传统的词特征抽取方法在聚类结果上具有更好的话题簇识别能力和簇描述能力。  相似文献   

5.
[目的/意义]利用自然语言处理技术,研究一种从科技规划文本内容中自动构建研究前沿主题地图方法。[方法/过程]首先,利用自然语言处理领域中的信息抽取、主题识别等技术对科技规划文本进行主题挖掘分析,然后,利用Java语言开发相应挖掘工具,构建科学研究前沿主题地图,并进行可视化展示。[结果/结论]通过对碳纳米管研究领域的实证研究证明,该方法能够全面、快速准确的绘制出该领域科学研究前沿地图。  相似文献   

6.
[目的/意义]以汽车论坛例,提出一种针对专业社交媒体文本的主题知识元抽取方法。[方法/过程]首先,通过LDA模型提取出汽车论坛中文本的主题,并进行去重,形成主题列表;其次,基于融合主题特征的深度学习模型T-LSTM模型构建适于汽车论坛本文的情感分析模型;然后,通过计算各词汇在图模型TextRank中的重要性与各词汇的Word2Vec主题相似度,抽取情感关键词与关键句,用于对文本主题与情感倾向的解释与补充;最后,对上述方法进行集成,输出结构化的主题知识元。[结果/结论]实验结果中,抽取得到的主题知识元合格率达到69.1%,表明本文提出的主题知识元抽取方法,能够围绕知识主题较为准确地抽取知识元,实现知识的结构化转换。  相似文献   

7.
[目的/意义] 构建面向典籍文本的语义本体,能够促进典籍文本的挖掘与分析。然而由于典籍文本与现代文本在语法上存在较大差异,给面向典籍的语义本体构建带来了困难。[方法/过程] 本文运用自然语言处理技术探讨针对先秦典籍的本体构建方法。以国际上文化遗产领域通用的CIDOC CRM为框架,设计先秦典籍本体模型。针对典籍文本内容的特点及句法特征,将规则抽取与条件随机场方法相结合,提出一套本体实例自动获取技术,并以《左传》为实验语料进行测试。[结果/结论] 实验表明,本文所提出的本体实例抽取技术能够较好地提高面向典籍文本的本体构建效率。基于规则的本体实例抽取实验F值在93%左右,基于条件随机场的本体实例抽取最佳特征模板的F值为82.51%。在本体实例获取中,词性信息和位置信息具有重要作用。  相似文献   

8.
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。  相似文献   

9.
中文文本关键词自动抽取方法研究   总被引:6,自引:1,他引:5  
随着信息技术的发展,中文电子文本信息资源正以惊人的速度急剧增长.文本自动处理技术,通过自动组织海量文献信息资源,能够为用户提供简易有效的信息检索服务.关键词自动抽取是文本自动处理的基础和核心.汉语的特殊性加剧了中文文本关键词自动抽取的难度.本文提出了一种基于N-gram权重计算和关键词筛选算法的中文文本关键词自动抽取方法.该方法不依赖特定的数据集和中文分词技术,可以有效地抽取出任意单篇文本的关键词,而且通过参数调整,应用系统可以灵活地控制标引深度和标引专指度.实验表明,该方法简单、快速、断词错误率低,标引性能明显优于基于中文分词和TF/IDF的方法,可以满足大规模文本的在线处理要求.  相似文献   

10.
[目的/意义]以用户情感为线索的图像检索已成为机器学习研究的热点,但图像情感特征标注的语料数据多来源于对图像低层特征的抽取,从而导致图像检索过程单一化和程式化。本文提出了一种基于深度学习的图像情感特征抽取的算法,将图像底层特征融合到图像的高层情感语义当中,为实现图像的情感语义检索提供了参考。[方法/过程]利用改进的卷积网络模型,将数据集图像的颜色、纹理作为输入,经多层运算自动提取图像的情感信息,并通过反向传播算法计算出改进后模型的情感检索准确率,构造出准确率较高且过拟合程度低的图像情感特征提取模型。[结果/结论]应用改进的卷积神经网络模型,实现了对图像情感特征的抽取,相较于原模型提升了10%的检索准确率。  相似文献   

11.
[目的/意义]基于网络招聘文本和学科数据,提出"行业-岗位-知识-学科"的人才需求及供给分析框架,以人工智能领域为例进行挖掘与分析,同时对其他领域的人才供需分析也具有借鉴意义。[方法/过程]采集招聘网站中与人工智能相关的职位招聘公告,综合对比CRF、BiLSTM-CRF、BERT-BiLSTM-CRF、BERT模型对招聘文本的实体抽取效果,并运用社会网络分析方法与学科数据进行关联分析。[结果/结论]BERT-BiLSTM-CRF实体抽取实验效果最佳,分别构建"行业-岗位""岗位-知识"以及"知识-学科"3种关系网络,得到与人工智能领域联系最紧密的行业、岗位、知识及学科。该框架能充分地挖掘人才需求现状,并能较精准地将需求定位到人才培养的学科,对于国家发展战略以及高等院校人才培养计划的制订具有现实意义。  相似文献   

12.
[目的/意义] 微信、微博等自媒体中隐含着大量的用户旅游消费需求的信息,将这些信息进行分类并依据分类结果构建需求本体,从而帮助企业分析和研究用户需求以获取巨大的商业价值。[方法/过程] 利用SVM分类算法将微博信息分类并生成分类结果集,这些结果集中包含大量旅游相关概念的词汇,可以作为构建和扩展旅游需求本体的语料;然后通过调查各大旅游网站的类目确定旅游需求的核心概念,抽取分类结果中与旅游相关的概念。[结果/结论] 利用抽取结果匹配核心概念,生成扩展后的本体,使用HOZO本体编辑工具进行修改和完善,并呈现部分旅游需求本体。从实验结果看,本文所提方法能较为准确地对包含旅游需求的文本进行分类。  相似文献   

13.
沙勇忠  陆莉 《图书情报工作》2015,59(12):120-127
[目的/意义] 社会媒体中的信息抽取是信息过载环境下创新社会媒体服务应用面临的重要问题,为此介绍一种可应用于社会媒体信息处理的语段结构方法。[方法/过程] 梳理语段结构方法的国内外研究进展,阐述其基本原理,并通过一个微博实例进行验证分析。[结果/结论] 通过以上工作,探讨将语段结构方法应用到中文社会媒体信息处理中的可行性,以及应用该方法实现中文信息机器处理所面临的研究问题与挑战。  相似文献   

14.
王莲 《图书情报工作》2020,64(22):135-144
[目的/意义] 通过对中美高校图书馆在线信息素养教育(OILI)理论和实践的比较分析,探讨我国在线信息素养教育的相关问题。[方法/过程] 通过文献调研、网站调研等方法,了解中美两国OILI的差异并进行分析。[结果/结论] 中美高校图书馆OILI的主体内容相对一致,只是国内对某些内容的处理还有改进空间。中美高校图书馆均采用多种形式开展OILI,但差异较为明显。在对多种形式进行比较分析后,认为在线教程是卓有成效的OILI的形式之一。对国内而言,开展OILI,要有求实意识和精品意识;倡导在线教程,体现内容完整性与形式多样性;注重高阶技能培养,融信息、研究、学术于一体。  相似文献   

15.
王莲 《图书情报工作》2021,64(22):135-144
[目的/意义] 通过对中美高校图书馆在线信息素养教育(OILI)理论和实践的比较分析,探讨我国在线信息素养教育的相关问题。[方法/过程] 通过文献调研、网站调研等方法,了解中美两国OILI的差异并进行分析。[结果/结论] 中美高校图书馆OILI的主体内容相对一致,只是国内对某些内容的处理还有改进空间。中美高校图书馆均采用多种形式开展OILI,但差异较为明显。在对多种形式进行比较分析后,认为在线教程是卓有成效的OILI的形式之一。对国内而言,开展OILI,要有求实意识和精品意识;倡导在线教程,体现内容完整性与形式多样性;注重高阶技能培养,融信息、研究、学术于一体。  相似文献   

16.
[目的/意义] 为了能够准确发现满足用户信息需求的有用在线评论,对在线评论按照有用性进行排序,帮助用户进行消费决策。[方法/过程] 首先通过文献调研和专家咨询,结合移动O2O用户在线评论的特点,选取影响移动O2O在线评论有用性的8项指标,采用模糊层次分析法进行指标赋权,然后利用定量方法进行指标量化,使用加权灰色关联分析方法进行有用性计算和排序,构建有用性排序模型。最后获取美团商品的在线评论数据进行应用研究,采用与美团原始评论排序结果对比分析的方法,检验方法的可行性和科学性。[结果/结论] 实验结果表明,采用移动O2O在线评论有用性排序模型进行排序,排名靠前的在线评论信息量大,包含产品或服务的维度较多,能够较好地满足用户的个性化信息需求,为用户消费决策提供更大的参考价值。  相似文献   

17.
中文超声文本结构化与知识网络构建方法研究   总被引:1,自引:0,他引:1  
[目的/意义]超声检查是判断患者病情的重要依据,目前主要检查数据是以文本形式存在。本文提出一种基于超声检查数据的文本结构化和知识网络构建方法,为进一步挖掘临床知识奠定数据基础。[方法/过程]对自然语言处理技术在超声文本环境下的应用进行改进,包括分词处理、内容定位、结构化识别三个主要步骤,实现对超声文本的切分与标记,并且在此基础上建立其结构化知识网络。[结果/结论]真实数据测试结果显示,本文提出的面向超声检查文本的结构化方法具有较好的性能表现。该方法可以实现对批量超声文本结构化网络的自动构建,能够反映超声文本中结构化内容的层次关系与属性结构等潜在知识。  相似文献   

18.
[目的/意义]通过调研国外高校图书馆具体数据服务人才招聘岗位的数据,分析社会对科研数据服务人员的知识结构和技能的最真实需求和要求,从而分析大数据时代国外高校图书馆科研数据服务人员的知识结构和岗位职责。[方法/过程]选取IASSIST网站中2015年1月1日至12月31日科研数据服务人员的招聘信息,经过筛选得到72条相关记录;再运用网络调查法和内容分析法,从人才市场对应聘者的需求类型、知识背景、综合素质能力、专业知识和特殊技能5个角度,深度解析国外高校图书馆科研数据服务人员的知识结构和岗位职责。[结果/结论]研究发现,国外高校图书馆对科研数据服务人员的需求主要为:有硕士以上学历,有图书情报学科、社会科学学科或特定领域学科专业背景,具有较强的数据分析能力和计算机技术能力,其中统计分析能力和计算机编程能力占重要部分,实践能力、工作经验会在招聘过程中成为应聘者的优势条件。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号