首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
王日花 《情报科学》2021,39(10):76-87
【目的/意义】解决自动问答系统构建过程中数据集构建成本高的问题,以及自动问答过程中仅考虑问题或 答案本身相关性的局限。【方法/过程】提出了一种融合标注问答库和社区问答数据的数据集构建方法,构建问题关 键词-问题-答案-答案簇多层异构网络模型,并给出了基于该模型的自动问答算法。获取图书馆语料进行处理作 为实验数据,将BERT-Cos、AINN、BiMPM模型作为对比对象进行了实验与分析。【结果/结论】通过实验得到了各 模型在图书馆自动问答任务上的效果,本文所提模型在各评价指标上均优于其他模型,模型准确率达87.85%。【创 新/局限】本文提出的多数据源融合数据集构建方法和自动问答模型在问答任务中相对于已有方法具有更好的表 现,同时根据模型效果分析给出用户提问词长建议。  相似文献   

2.
曹靖  王朝亮  郑国权  孙毅 《科技风》2023,(29):4-6+48
5G与边缘计算技术已成为新兴业务海量高频数据边缘侧处理的有力支撑,然而算法框架依赖型业务的数据边缘计算尚未得到充分研究。本文构建考虑终端设备具有部分服务缓存和任务卸载与计算功能的边缘计算系统模型,以系统中设备任务处理平均时延与能耗加权和为目标,设计了基于改进粒子群的边缘计算任务卸载策略。仿真结果表明,相较于随机决策与传统粒子群算法,本文所提算法显著降低了系统任务处理时延和能耗开销,提高了系统性能。  相似文献   

3.
赵辉  刘怀亮 《现代情报》2013,33(10):70-74
为解决社区问答系统中的问题短文本特征词少、描述信息弱的问题,本文利用维基百科进行特征扩展以辅助中文问题短文本分类。首先通过维基百科概念及链接等信息进行词语相关概念集合抽取,并综合利用链接结构和类别体系信息进行概念间相关度计算。然后以相关概念集合为基础进行特征扩展以补充文本特征语义信息。实验结果表明,本文提出的基于特征扩展的短文本分类算法能有效提高问题短文本分类效果。  相似文献   

4.
文章提出了一种基于本体和设计情景的产品设计领域知识问答系统解决方案,利用本体表示产品设计知识库,提出了基于问句语义特征匹配的问题分类算法以及本体查询转换技术,并充分考虑问句中带有设计情景的复杂问题,提出情景相似度和问句相似度综合加权的设计情景问题相似度算法,最后设计实现了身管设计知识问答系统,并对实验结果进行分析验证方案的可行性。  相似文献   

5.
数据类间分布不均衡是不平衡数据集分类效果不好的主要原因,为了克服类间分布的不均衡,本文提出了一种基于邻近样本类别判断的不平衡数据分类算法。首先,对待判定样本,计算它的k个最邻近样本,然后将待判定样本的类别指派到它的k个最邻近中的多数类。由于本文所提出的不平衡数据分类算法在类别决策时,只考虑少量的邻近样本的类别,而不是考虑所有的训练样本,因此可以较好地克服类间不平衡对少数类分类结果的影响。在客户流失数据集上的仿真实验充分证明了本文算法能较好地处理不平衡数据分类问题。  相似文献   

6.
基于核聚类算法的高校图书借阅信息分类方法   总被引:3,自引:0,他引:3  
李盼池 《现代情报》2003,23(9):186-188
针对高校图书馆读者借阅文献类型、流量实时监测问题,提出了一种基于模式识别中核聚类算法的自动分类和统计分析方法。首先按照中图法所列22个大类对馆藏图书类型和借阅记录情况进行量化编码,然后对编码后的数据进行规整处理。以流通系统的读者数据库为底层数据支持,采用本文提出的方法开发出流量分类统计和预报应用系统。对大庆石油学院图书馆流通数据进行实际处理,结果证明了该算法的有效性和可靠性。  相似文献   

7.
针对知识发现中的模糊信息查询问题,提出了一种基于反馈网络的模糊概念聚类及模式联想设计方法.按照分类要求对所要查询的概念集合进行量化编码,并对编码后的数据进行规整处理.对于概念聚类采用多层反馈神经网络的FP聚类算法,而概念联想采用自反馈神经网络的椭球学习算法实现.将基于上述算法开发出的信息模糊查询系统应用于图书信息查询,实验结果证明了该方法的有效性.  相似文献   

8.
随机森林算法在数据挖掘领域中得到了广泛的应用,该算法通过构建多个不同的决策树可以获得更高的分类结果。但是,随着数据规模的增大,人们开始接触到各大规模的数据以及更高维度的数据属性。传统的随机森林构建算法不能有效、快速地处理海量高维数据,严重影响了数据的分类效率,从而影响预测效率。本文针对高维、海量数据下随机森林构建算法,改进并提高了该算法的效率,提出了基于云计算平台的随机森林构建算法。该算法可以快速的完成数据分类预测,并通过实验结果进一步展示了该算法的效率以及可扩展性。  相似文献   

9.
进入大数据时代,中文文本的数据量的显著增加,如何针对大数据量的文本数据进行有效分类是一个重要问题。传统的朴素贝叶斯算法在进行分类时,认为特征属性对分类决策的贡献是相同的,同时对于大数据集的处理也存在性能低下的缺点。针对如上问题,本文提出了一种基于TFIDFCF特征加权的并行化朴素贝叶斯文本分类算法,该算法通过Map Reduce并行框架实现。利用THUCNews新闻文本数据开展文本分类处理,实验结果表明,并行框架下的TFIDFCF特征加权的朴素贝叶斯算法在训练速度和预测精度上都有提高。  相似文献   

10.
近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神经网络(TextCNN)的NEWT新型计算框架;实证部分,基于中国地方政府发布的科技政策文本进行算法校验。实验结果显示,在取词长度分别为500、750和1 000词的情况下,应用NEWT算法对中文科技政策文本进行分类的效果优于RCNN、Bi-LSTM和CapsNet等传统深度学习模型,F1值的平均提升比例超过13%;同时,NEWT在较短取词长度下能够实现全文输入的近似效果,可以部分改善传统深度学习模型在中文长文本自动分类任务中的计算效率。  相似文献   

11.
[目的/意义]社会化问答社区的投票机制有利于信息消费者筛选高质量回答。本文以用户原创回答为研究对象,探讨影响知识分享用户感知有用性的影响因素。[方法/过程]以信息接受模型为基础,基于知乎社区71 495条回答,结合文本分析与负二项回归分析方法,从回答特征、回答质量和回答者特征3个方面探讨知识分享有用性的影响因素。[结果/结论]研究结果表明,回答特征(及时性、图片或引用)、回答质量(答案中心度、情感支持)、回答者特征(社会网络中心度、可信度)均对回答有用性投票具有正向影响。回答的语言多样性对回答有用性投票具有负向影响。本研究通过实证进行客观分析,有利于促进回答者贡献高质量回答并对社会化问答社区进行高质量的信息服务提供可行性建议。  相似文献   

12.
[目的/意义]研究的目的在于揭示社会化问答网站用户糖尿病相关信息需求,以及随时间的推移这些信息需求的演变。[方法/过程]以中文社会化问答网站糖尿病相关提问文本为基础,构造共词网络,运用词频分析、社会网络分析和社区发现的方法,确定网络社区演变路径,以可视化的形式呈现信息需求的特征及演变。[结果/结论]10年间用户表达出来的信息需求趋于集中,用户对健康管理的信息需求有较大增长,但这部分仍未成为核心关注点。建议用户更多地对健康管理给予关注,公共卫生部门加强糖尿病预防内容的科普,并对相关并发症加强防控和管理。  相似文献   

13.
在当前"互联网+"背景下,应用大数据挖掘技术提高知识服务的智能化、个性化、自动化水平,实现智慧性的知识服务是图书馆服务的发展趋势。首先提出基于大数据挖掘的图书馆智慧服务模型,通过用户群挖掘、用户兴趣挖掘、学科和领域知识挖掘、业务关联挖掘来沟通大数据应用和智慧服务需求;然后提出基于Hadoop平台的图书馆大数据挖掘技术支撑体系,为智慧服务应用落地提供技术方案;最后探讨大数据挖掘支持下的场景化知识推荐服务和微知识自动问答服务。  相似文献   

14.
本文利用统计翻译模型计算单词之间的语义相似度,并将此语义信息嵌入至核函数,实现了一个基于语义核函数的问句检索系统,利用语义核函数计算问句之间的语义相似度。通过在真实问答对数据上进行的实验,表明基于语义核函数的问句检索模型的效果优于传统的相似度计算模型,可以提高问句语义匹配准确率,具有一定的实用性。  相似文献   

15.
Question classification (QC) involves classifying given question based on the expected answer type and is an important task in the Question Answering(QA) system. Existing approaches for question classification use full training dataset to fine-tune the models. It is expensive and requires more time to develop labelled datasets in huge size. Hence, there is a need to develop approaches that can achieve comparable or state of the art performance using limited training instances. In this paper, we propose an approach that uses data augmentation as a tool to generate additional training instances. We evaluate our proposed approach on two question classification datasets namely TREC and ICHI datasets. Experimental results show that our proposed approach reduces the requirement of labelled instances (a) up to 81.7% and achieves new state of the art accuracy of 98.11 on TREC dataset and (b) up to 75% and achieves 67.9 on ICHI dataset.  相似文献   

16.
随着高校科研水平的不断提高,科研档案作为重要信息资源在教学、科研、管理和文化建设等方面发挥着越来越重要的作用,但是现行的科研档案管理模式已不能适应飞速发展的科研需求,存在科研档案不完整、档案利用率低,信息化步伐滞后、管理队伍专业化程度低等问题。“协同创新”理念的提出,为高校科研档案管理提供了新的思路,高校应紧紧围绕“协同创新”理念,探索科研档案管理的协同创新模式,进一步提高科研档案归档效率,提升档案利用价值,完善档案管理服务体系。本文剖析了高校科研档案管理现状,从体制机制创新、信息化管理和管理队伍建设三方面提出了科研档案管理协同创新体系构建的设想。  相似文献   

17.
[目的/意义]社会化问答社区作为网络知识交互平台,其持续发展的关键在于促进用户知识共享,提升共享知识质量。[方法/过程]通过社区知识"质"与"量"的细分,将社区用户主动或被动参与社区知识共享获得的知识收益区分为"质"的收益与"量"的收益,并构建社会化问答社区用户知识共享的演化博弈模型,探讨不同博弈假设下问答社区知识共享的均衡状态。[结果/结论]通过仿真显示,社会化问答社区共享知识质量与用户共享行为策略会受到用户共享意愿与能力、用户认可与社区激励、感知共享成本等因素的影响。  相似文献   

18.
云制造环境下农机供应链服务平台架构研究   总被引:2,自引:0,他引:2  
为解决现有农机行业存在的集中度分散、分布不均衡、信息化水平低等问题,分析农机供应链的运营现状,将云制造技术应用于农机供应链,提出一种农机供应链服务平台架构。农机供应链运用云服务平台进行优化、重组和精确的管理,依靠云制造农机供应链服务平台对供应链中的物流、信息流和资金流进行优化。阐释对该平台结构模型、业务运营模型和业务处理模型,由云制造平台将需求信息进行分类处理和解决,以满足客户需求。  相似文献   

19.
[目的/意义]探讨以知乎为代表的社会化问答应用的可用性现状,以期提高社会化问答应用的可用性。[方法/过程]以活动理论作为指导,结合可用性评价的研究成果以及社会化问答应用的特点,设计可用性评价指标体系,通过问卷调查的方法来收集数据并进行量化分析,对知乎APP的可用性进行评价分析。[结果/结论]研究结果表明用户对于知乎APP的可用性总体满意度相对较高,知乎APP在内容上的表现较好,在平台以及用户方面仍有待改进。总体上可从界面布局、用户研究、社群关系等三个方面来提高社会化问答应用的可用性。  相似文献   

20.
周文辉  曹裕  周依芳 《科研管理》2015,36(8):129-135
本文运用探索性案例研究方法,选取1家研发服务机构与3家中小制造企业之间合作案例为研究对象,研究发现:研发服务与中小企业价值共创过程模型分为"观念共识-价值共生-价值共赢"三个阶段;研发服务通过互动诊断与考察交流的"言传+身教"的"传道"方式,帮助企业"觉察"与"觉醒"以达成观念共识;研发服务通过"授之以鱼"与"授之以渔"的"教授+教练"的"授业"方式,帮助企业"学习新知"与"学以致用"以促成价值共生;研发服务通过"答疑+答辩"的"解惑"方式,帮助企业执行方案与达成目标以实现价值共赢。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号