首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义]针对在线医疗社区问答文本复杂程度高、结构化程度低的特点,结合卷积神经网络(CNN)和双向长短记忆神经网络(BiLSTM)两种深度学习模型以及条件随机场(CRF)模型,提出一套适用于在线医疗问答文本的实体识别方法并进行验证。 [过程/方法] 将问答文本进行清洗和BIO标注后,分别用CNN和BiLSTM进行字级别的特征抽取,将两种模型抽取到的特征进行融合,后放入CRF中训练出实体预测模型,再将问答文本放入训练好的模型中得到最终的实体识别结果。[结果/结论]在所选取的乳腺癌医疗社区问答文本数据集上,所提出的方法结果优于其他模型,且识别准确率达到92.3%,召回率达到89.3%,F值达到90.8%。  相似文献   

2.
[目的/意义]进一步挖掘与分析网络问答社区用户信息需求,实现用户信息需求序化组织与聚合,提升网络问答社区服务质量。[方法/过程]融合GMM和Kmeans聚类算法对网络问答社区用户提问问题文本进行用户信息需求挖掘与分析,并采集途牛网络问答社区“北京”话题下的全部问题文本数据进行实证研究。[结果/结论]途牛网络问答社区中用户的信息需求主要分为三类:景点、住宿、出行和周转。文章所提出的网络问答社区用户信息需求聚合方法可以高效地识别出用户信息需求,实现话题下用户信息需求序化和组织,对网络问答社区提升信息组织水平和优化信息服务质量具有一定的参考价值。  相似文献   

3.
陈晨  侯景瑞  吴任力  王平 《情报科学》2019,37(7):139-145
【目的/意义】社会化问答社区现已成为网络用户共享、传播及获取知识的重要平台,但其开放性和交互性 也给其问题推荐工作带来了巨大的挑战。本文提出的基于多源混合标签的方法能够有效提高社会化问答社区的 问题推荐质量,以促使问题得到及时有效地解决。【方法/过程】利用自动标签标注系统从问答文本中提取关键词, 将语义扩展后的关键词作为基本标签,并建立多源混合标签库;利用标签表示用户的兴趣偏好与权威度,并建立用 户特征模型;最终通过协同过滤的方式进行匹配推荐。【结果/结论】实验结果表明,本文提出的基于多源混合标签 的问题推荐方法在检全率、检准率以及F值等指标方面均不同程度地优于基于文本相似度的基准方法。  相似文献   

4.
[目的/意义]社会化问答社区的投票机制有利于信息消费者筛选高质量回答。本文以用户原创回答为研究对象,探讨影响知识分享用户感知有用性的影响因素。[方法/过程]以信息接受模型为基础,基于知乎社区71 495条回答,结合文本分析与负二项回归分析方法,从回答特征、回答质量和回答者特征3个方面探讨知识分享有用性的影响因素。[结果/结论]研究结果表明,回答特征(及时性、图片或引用)、回答质量(答案中心度、情感支持)、回答者特征(社会网络中心度、可信度)均对回答有用性投票具有正向影响。回答的语言多样性对回答有用性投票具有负向影响。本研究通过实证进行客观分析,有利于促进回答者贡献高质量回答并对社会化问答社区进行高质量的信息服务提供可行性建议。  相似文献   

5.
[目的/意义]研究在线问答社区中不同社会支持与社区信息如何影响“潜水中”社区成员的认知与行为,分析在线问答社区中潜水用户在线体验,以提高社区活跃度。[方法/过程]构建提问信息效价与回答社会支持之间的匹配对潜水用户(视作观察者)的平台满意度和参与意向的影响模型,采用2(接收信息效价:积极vs.负面)×2(社会支持类型:情感vs.信息)组间实验进行模型验证。[结果/结论]在线问答社区中信息效价与社会支持对潜水用户的认知与行为影响存在差异且对感知有用性和敏感性有交互效应,在积极信息中,潜水用户对情感支持比信息支持有更高的敏感性,而在负面信息中,信息支持比情感支持有更高的有用性;同时不同问答情景导致潜水用户的平台满意度和参与意愿存在差异。  相似文献   

6.
陈锟  裴雷  范涛 《现代情报》2023,(6):24-34
[目的/意义]针对突发事件分类研究中模态单一或缺失、分类效果不理想等问题,本文提出结合文本和图片特征信息,以多模态融合的方式对突发事件进行分类。[方法/过程]本文提出一种基于多模态融合的突发事件分类模型(Emergency Classification Model with Hybrid Fusion, ECMHF),由BERT联动BiLSTM构成的文本特征抽取分类模型、VGG19为基础的图像特征抽取分类模型、融合文本描述特征和视觉语义特征的多模态融合层加上预测类别输出层组成的多模态分类模型3部分构成主体框架,最后将所有模型的决策层输出分配权重后再融合。[结果/结论]以收集的突发事件新闻数据为实验样本进行实证研究。结果表明,ECMHF模型在所有模型中性能最佳,F1值达到最高的99.072%,比次优模型高出0.51%。加入混合融合策略的ECMHF模型能够有效地识别出突发事件的类别。未来将在更为广泛和多元的突发事件多模态数据集中进行验证。  相似文献   

7.
徐彤阳  滕琦 《情报杂志》2021,(4):163-169
[目的/意义]作为科研人员知识获取、交流与利用的重要场所,虚拟学术社区资源具有数量多、价值高等特征,探索智能问答服务在社区的理论、方法与应用,对推动学术资源高效检索与利用,促进知识服务创新具有重要意义。[方法/过程]梳理虚拟学术社区研究现状与目前知识服务存在的不足,联合双向长短期记忆网络(BiLSTW)、文本相似度等技术作为支撑,基于注意力机制的CNN的智能问答方式构建学术社区内资源的智能问答模型,增加注意力分支以抽取细粒度特征,提高检索速度,提升科研效率。[结果/结论]智能化技术的应用实现学术资源的深度聚合,实现传统信息交互与智能化新技术的协同发展,提升了学术资源利用率,扩大信息资源共建共享。  相似文献   

8.
[目的/意义]旨在探索虚拟社区用户集体意愿研究。[方法/过程]结合在线问答社区特点,采用结构方程模型,先后利用SPSS 23.0和AMOS 21.0进行数据分析并进行模型验证。[结果/结论]研究认为,虚拟社区感、社会资本均对在线问答社区用户集体意愿产生正向影响;在线互动、线下互动除了直接对在线问答社区用户集体意愿产生正向影响,还可以通过虚拟社区感、社会资本对在线问答社区用户集体意愿产生间接的正向影响。  相似文献   

9.
[目的/意义]近年来,在新媒体逐渐发展成熟的情况下,微博、微信、QQ、问答社区等泛网络产品成为网络用户进行信息交流的主要方式,这些新媒体平台在方便用户的同时,也存在明显的信息生态问题,本文尝试针对这些问题提出治理对策。[方法/过程]本文分析了新媒体环境的特征,提出了新媒体环境下的信息传播和信息治理模型,针对信息治理问题展开一系列探讨。[结果/结论]本文提出的新媒体环境下的信息传播模型和信息治理建议可为解决新媒体环境下的信息生态问题提供一些思路。  相似文献   

10.
[目的/意义]针对单纯使用统计自然语言处理技术对社交网络上产生的短文本数据进行意向分类时存在的特征稀疏、语义模糊和标记数据不足等问题,提出了一种融合心理语言学信息的Co-training意图分类方法。[方法/过程]首先,为丰富语义信息,在提取文本特征的同时融合带有情感倾向的心理语言学线索对特征维度进行扩展。其次,针对标记数据有限的问题,在模型训练阶段使用半监督集成法对两种机器学习分类方法(基于事件内容表达分类器与情感事件表达分类器)进行协同训练(Co-training)。最后,采用置信度乘积的投票制进行分类。[结论/结果]实验结果表明融入心理语言学信息的语料再经过协同训练的分类效果更优。  相似文献   

11.
[目的/意义]将社会网络分析与突变理论相结合,提出识别潜在颠覆性技术的新方法,帮助企业获得市场、经济的先行优势,同时有助于加强政府对重点技术的前期引导作用。[方法/过程]首先,基于文本三元组结构,构建语义信息层面的技术共现网络。其次,基于社区网络结构和颠覆性技术特征,提出社区网络关系强度和对外资源利用力两个指标,利用突变理论模型识别易突变社区。最后,对易突变社区内节点进行主题词突发性监测和词频异常监测确定技术突发可能性,以此识别潜在颠覆性技术。[结果/结论]以造血干细胞领域2001—2018年论文数据作为分析对象,验证了方法的有效性,发现“建立完善的关于免疫缺陷疾病及相关移植治疗手段的临床研究模型”是该领域的潜在颠覆性技术。  相似文献   

12.
李颖  肖珊 《现代情报》2019,39(2):111-120
[目的/意义]为解释知识问答社区用户分享知识时的情绪和体验,从PAT模型(Person-Artifact-Task model)入手,探求用户自身特征、社区的工具特征、知识共享任务特征对心流体验产生的影响以及心流体验与持续知识共享意愿之间的关联。[方法/过程]论文以百度知道社区的活跃用户为调查对象,回收205份有效问卷,利用Amos21.0软件对数据进行结构方程模型分析。[结果/结论]研究发现,知识问答社区用户自身特征中的技能水平、感知控制力、兴趣,社区工具特征的互动性、感知易用性,以及任务特征的挑战性对其心流体验的产生有正向影响;按照影响程度降序排列,依次为感知易用性、技能水平、感知控制力、互动性、兴趣;用户产生的心流体验越强,其持续参与知识共享的意愿越强;心流体验在除了清晰目标之外的其他6个自变量与持续知识共享意愿之间的中介作用得到了验证。在此基础上,论文从强化用户粘性、激发兴趣、提升互动等方面探讨对知识问答社区管理实践的启示。  相似文献   

13.
[目的/意义]网络新闻是获取突发事件情报的重要来源之一,提高海量网络新闻中突发事件的识别准确率和分类效果,并减少非突发事件新闻造成的开放集识别问题和降低人工标注非突发事件新闻的成本,这是当前突发事件识别与分类研究的重要课题。[方法/过程]选择BERT预训练模型获得文本的特征表示,融合不同层级之间的语义信息增强文本表示的质量,采用自适应决策边界模型,学习各突发事件类别在高维语义表示空间上的球形最佳决策边界,根据新闻样本的文本表示和各突发事件类别的球形最佳决策边界的欧几里得距离,检测出突发事件新闻并判断突发事件的类别,并在CEC公开数据集和实时爬取的中文新闻数据集CEN上对模型的有效性进行验证。[结果/结论]实验结果表明,本文模型在CEC数据集和CEN数据集上的宏F1值分别为98.46%和95.80%,与基准模型相比,本文模型的宏F1值分别提升了5.15%和19.69%。模型应用展示了提出方法在解决实际问题时的有效性。[局限]未考虑突发事件新闻可能存在多标签的情况。  相似文献   

14.
【目的/意义】为在线医疗问诊平台中的医生自动生成高质量标签,更好地服务于对医生资源的分类、检索和管理。【方法/过程】基于在线问诊文本信息,提出了结合时间周期特征与文本主题特征的医生标签自动生成算法。首先根据医生相关文本信息提取关键词生成候选标签,然后从患者问题文本和医生回答文本两个方面进行LDA主题模型训练,按时间周期挖掘出问题文本和回答文本的主题特征,对候选标签进行质量控制;最后经标签加权混合后得到最终的医生标签。【结果/结论】实验结果表明,该标签自动生成算法能够反映出医生标签生成的动态性,能够准确生成符合医生专业知识特征的高质量标签,具有较好的标签生成效果。  相似文献   

15.
[目的/意义]研究的目的在于揭示社会化问答网站用户糖尿病相关信息需求,以及随时间的推移这些信息需求的演变。[方法/过程]以中文社会化问答网站糖尿病相关提问文本为基础,构造共词网络,运用词频分析、社会网络分析和社区发现的方法,确定网络社区演变路径,以可视化的形式呈现信息需求的特征及演变。[结果/结论]10年间用户表达出来的信息需求趋于集中,用户对健康管理的信息需求有较大增长,但这部分仍未成为核心关注点。建议用户更多地对健康管理给予关注,公共卫生部门加强糖尿病预防内容的科普,并对相关并发症加强防控和管理。  相似文献   

16.
在线健康社区用户信息需求的层级多标签分类研究   总被引:1,自引:0,他引:1  
[目的/意义]用户健康信息需求研究能够发现用户潜在需求,解决用户健康信息盲区,帮助用户实现更好的自我健康管理。研究目标为挖掘识别用户信息需求主题,提取用户特征,促进完善网络社区交互性与多元性发展,为更好地改善健康信息服务提出建议与意见。[方法/过程]针对在线健康社区的母婴群体,提出在线健康社区用户信息需求层级多标签分类模型。通过扎根理论提出在线健康社区用户信息需求主题体系,利用ALBERT对母婴健康需求类数据进行预训练,使用双向GRU与注意力机制构建基础分类器,以此来构建层级多标签分类模型Multi-BiGRU-Attention,实现在线健康社区提问数据的层级多标签分类。[结果/结论]实验对比发现,随着层级的增加,研究提出的模型相比于单层的基础分类器BiGRU-Attention在micro-Precision, micro-Recall, micro-F1等各项指标上均有所提升,说明该模型的层级结构信息能够一定程度上改善模型效果;相比于层级多标签相关模型,在各项指标上均有所提升,说明该模型存在一定的适用性与扩展性。  相似文献   

17.
[目的/意义]专利关键词提取是专利挖掘任务中非常重要的前置子任务,基于图模型的关键词提取是目前最有效的算法。传统图模型只考虑了单词的局部上下文信息,为了捕获单词的全局信息,提出一种基于图神经网络的专利关键词提取算法,结合词向量与图模型实现专利关键词的提取。[方法/过程]首先,用专利数据集构建异构网络,以专利分类号为标签,训练图神经网络模型,使得同一主题下的单词具有相似的向量表示,获取包含主题信息的词向量;然后,根据专利摘要在滑动窗口内的单词共现关系和词向量相似度,构建融合了单词主题信息的文本图,利用词向量中的主题信息捕获单词的全局联系;最后,在文本图上使用PageRank算法,获取关键节点,构成专利的关键词。[结果/结论]与基线方法相比,该算法在提取专利关键词时,能够检测到新颖性与准确性更高的关键词。  相似文献   

18.
[研究目的]作为一类新兴应用,生成式AI在知识问答领域吸引了众多用户,这可能导致传统的知识问答社区用户流失,因此研究用户转移行为对提高知识问答社区用户粘性来说至关重要。[研究方法]基于PPM(推-拉-锚)模型,整合认知和情感体验因素,研究了用户的知识问答转移行为。对收集的483份有效数据采用混合方法包括结构方程模型(SEM)和模糊集定性比较分析(fsQCA)进行分析。[研究结论]研究结果发现,转移意愿受推力因素(信息过载、社区倦怠)、拉力因素(感知拟人度、感知准确度、感知可信度、沉浸体验)和锚定因素(社会影响)的综合影响。fsQCA识别出了三条导致转移意愿的主要路径。研究结果启示问答社区需降低信息过载,缓解用户的社区倦怠,从而实现用户保持和平台可持续发展。  相似文献   

19.
[目的/意义]针对在线旅游平台,提出一种挖掘游记主题标签,以代表性游记以及其中相关内容进行旅游信息推荐的新策略。[方法/过程]在利用文本挖掘技术,构建LDA主题模型,形成游记文本主题标签的基础上,通过游记代表度算法,筛选出针对相应标签的高描述度与高忠诚度游记进行旅游信息推荐,以客观表达文本聚类结果以及主题词之间的语义关系,并以蚂蜂窝旅游网中的"杭州游记"为例,加以验证。[结果/结论]结果表明,这种方式能挖掘出旅游者在历史旅游经历中真实的旅游热点及重点信息需求,针对高相似度游记的识别与聚类具有良好效果,对旅游信息细粒度推荐具有指导意义与实践意义。  相似文献   

20.
丁浩  孔令圆  刘清  胡广伟 《现代情报》2023,(11):135-145
[目的/意义]本文针对农业领域提出一种基于融合多重特征词嵌入模型的农业命名实体识别方法,以提高识别准确度。[方法/过程]通过使用结合字符、位置语义、领域知识字典特征等多重特征向量作为嵌入层,充分考虑字符的位置信息和上下文语义信息,并根据农业领域的中文实体的特点改进了单一字符向量嵌入,获得更多的农业实体特征,同时采用双向长短时记忆网络BiLSTM和多头注意力机制来学习文本的长距离依赖信息,再利用条件随机场CRF获得全局最优标注序列。[结果/结论]本文在农业领域中文实体语料数据集中与9种基于基线方法进行对比实验,模型的Precision为92.2%,Recall为92.0%,F1值为92.11%,均优于其他基线模型,说明本文模型对于中文农业命名实体识别更精确。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号