首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 549 毫秒
1.
基于文献结构的自动文摘的初探   总被引:5,自引:1,他引:4  
首先阐述了人们进行自动文摘研究的必要性,并介绍了自动文摘的技术背景。然后着重论述了基于文献结构的自动文摘的特点和实现方法,并对已有的数学模型进行评价,提出了作者的一些改进想法。指出了传统自动文摘方法的缺陷,并根据基于文献结构的自动文摘的特点提出了解决问题的办法。本文在最后还探讨了自动文摘在“知识发现”和文本信息挖掘领域内的初步应用。  相似文献   

2.
自动文摘系统评价方法的研究与实践   总被引:7,自引:2,他引:5  
自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了当前国内外自动文摘的评价方法 ,最后提出并实践了一种参照Turing测试的思想进行自动文摘系统评价的方法  相似文献   

3.
自动文摘综述   总被引:22,自引:1,他引:21  
本文概述了自动文摘的发展历史和研究状况 ,给出当前自动文摘领域主要的研究方法和策略 ,剖析了它们的优点和不足。进一步结合自动文摘自身的特点和难点 ,提出近期自动文摘的研究重点是基于篇章话语形式的浅层分析方法生成指示型文摘。  相似文献   

4.
探寻自动文摘的研究起点,挖掘自动文摘研究领域的核心作者、期刊分布及其发展动向等,不仅有助于国内业界人士明确自动文摘的研究源起和重点,而且有利于把握未来的自动文摘研究动态.本文利用情报研究中常用的计量统计、内容分析等方法,借助<中国分类主题词表>确定了自动文摘研究领域的主题词,然后依托<中国学术文献网络出版总库>挖掘了自动文摘研究论文的数据集;通过定性与半定量相结合的方法,对2009年前国内自动文摘研究的研究论文数量、学科分布、作者分布等进行分析,最终探明了国内自动文摘研究的源起、发展进程等宏观发展历程及方向.  相似文献   

5.
汉语文本特征词的抽取方法   总被引:13,自引:3,他引:10  
薛翠芳  郭炳炎 《情报学报》2000,19(3):242-247
本文从自动文摘的需求出发 ,探讨特征词自动抽取的方法和技术 ,设计并实现了两种不同的特征词自动抽取算法。这些方法对文本的自动分类和全文检索也有一定的借鉴意义。  相似文献   

6.
刘茵  李弼程 《情报学报》2008,27(2):235-243
自动文摘系统的评测是自动文摘技术研究与发展的关键部分.随着摘要技术的快速发展,国外学者十分重视评测技术,研究工作也如火如荼,而国内相关工作相对贫乏.文摘评测对文摘系统的性能有重大影响,对自然语言处理、信息检索等相关技术有着促进作用.本文详细介绍了文摘评测的两大方法:内部评测和外部评测,并对多年来文摘评测中应用的关键技术做了简要总结,最后指出文摘评测面临的挑战及未来需要努力的方向.  相似文献   

7.
基于全信息词典的自动文摘系统研究与实现   总被引:3,自引:1,他引:2  
本文根据文摘与文本结构的关系,提出了一个以文摘框架为核心的文摘系统模型。系统的运行是建立在一部对词语进行了语法、语义、语用三个层面描写的全信息词典的基础上。文本分析器在其作用下,能有效地对与文摘有关的文本部分进行分析,填充预定的文摘框架,最后生成风格一致的文摘。基于上述理论的研究,设计并实现了计算机病毒领域的自动文摘实验系统,其效果较为理想。  相似文献   

8.
杨建林 《情报学报》2001,20(4):460-463
本文提出了几个可以改善中文自动文摘系统的文摘效果的措施 :1 将字频统计方法和词频统计方法有机结合起来 ;2 进一步研究人工文摘中理解性文摘句的形成机理 ,完善仿人算法 ;3 将自动聚类的方法引入自动文摘研究。  相似文献   

9.
自动文摘的生成方法与评价研究   总被引:1,自引:0,他引:1  
林莉 《图书馆学刊》2009,31(5):94-95
自动文摘系统一般包括基于理解的自动文摘和基于统计的自动文摘两大类。主要论述了从自动文摘建立的方法和自动文摘的评价方法。  相似文献   

10.
微机辅助文献标引系统的设计与研究 3. 自动标引研究   总被引:2,自引:0,他引:2  
在微机辅助文献标引系统中引入了自动标引方法, 进一步提高了标引的速度和质量。自动标引的基本思想是: 以机内主题词典为依据, 采用遍历扫描和相似性匹配两种方法, 从标题和文摘中抽词, 本文介绍了这一自动标引技术, 并对自动标引的结果进行了分析和讨论。  相似文献   

11.
自动摘要方法综述   总被引:2,自引:0,他引:2  
谭翀  陈跃新 《情报学报》2008,27(1):62-68
自动摘要是计算机语言学领域的一个研究重点,自动摘要的研究和应用受到了计算机学、语言学、认知心理学等相关学科的广泛关注.本文讨论了摘要的定义及其分类.依据自动摘要的特点对其分类,并作为构造自动摘要系统和思考自动摘要技术发展的参考和启示.本文概述了自动摘要的发展历史和研究现状,并将现有的自动摘要方法分为三类,分别阐述了这三类方法的基本特征和研究方法,并剖析了它们的优点和不足.本文着重讨论了基于篇章结构的方法的几个不同研究方向及其局限和趋势.最后,文章讨论了自动摘要研究存在的问题,并指出自动摘要的研究趋势.  相似文献   

12.
微博短文本预处理及学习研究综述   总被引:1,自引:0,他引:1  
王连喜 《图书情报工作》2013,57(11):125-131
认为因短文本具有特征稀疏性和高度冗余性,微博短文本的预处理及学习方法研究已经成为微博信息挖掘及应用的关键,并在许多方面有着非常重要和广泛的应用。重点分析微博短文本的特性,并对微博短文本的预处理和学习方法及其应用现状进行归纳和总结,包括短文本特征表示、短文本特征拓展与选择、短文本分类与聚类学习、热点事件发现及自动文摘等。最后指出相关研究的局限性,并对未来的发展方向进行展望。  相似文献   

13.
在理解自动摘要处理流程和梳理国内外重要研究成果的基础上,重点对自动摘要研究在文本分词、冗余度控制、质量评价、短文本自动摘要以及多语言与跨语言文本自动摘要等方面所面临的若干基本问题及其主要解决方法进行归纳和总结,并对部分研究内容的发展方向进行展望,以期为未来的自动摘要和自然语言处理研究提供有意义的参考。  相似文献   

14.
自动文本摘要中一个关键的步骤是确定文章的主旨并将反映文章主旨的句子提取出来.在讨论分析k-means, k-medoids等聚类算法的基础上,根据对文本摘要的实际要求以及文档自身的特点,提出一种基于聚类算法的主旨句提取方法.实验结果表明,在提高聚类准确性的基础上,新方法较其他聚类算法能够更加有效地避免遗漏主题的问题,能较全方位地反映全文的主旨,提取出的摘要既覆盖全面又突出重点.  相似文献   

15.
关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。  相似文献   

16.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

17.
一种使用自动聚类思想的自动文摘方法   总被引:5,自引:0,他引:5  
杨建林 《情报学报》2001,20(5):532-536
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选出与文献主题相关的段落类作为候选的用来挑出文摘句的段落类 ,最后从候选段落类中选出文摘句构成文摘  相似文献   

18.
自动分类研究进展   总被引:10,自引:0,他引:10  
在对自动分类研究状况进行概述和分析的基础上, 指出了自动分类研究的主要发展方向。  相似文献   

19.
文本聚类结果描述研究综述   总被引:1,自引:0,他引:1  
首先对文本聚类结果描述的研究背景和相关的研究情况进行说明,分析自动标引、自动文摘、概念聚类与文本聚类结果描述的关系,定位文本聚类结果描述的研究内容;然后根据文本聚类结果描述的具体要求,对该问题进行形式化;最后给出文本聚类结果描述的评价方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号