共查询到19条相似文献,搜索用时 549 毫秒
1.
基于文献结构的自动文摘的初探 总被引:5,自引:1,他引:4
沈玮杰 《现代图书情报技术》2002,18(3):23-27
首先阐述了人们进行自动文摘研究的必要性,并介绍了自动文摘的技术背景。然后着重论述了基于文献结构的自动文摘的特点和实现方法,并对已有的数学模型进行评价,提出了作者的一些改进想法。指出了传统自动文摘方法的缺陷,并根据基于文献结构的自动文摘的特点提出了解决问题的办法。本文在最后还探讨了自动文摘在“知识发现”和文本信息挖掘领域内的初步应用。 相似文献
2.
3.
4.
探寻自动文摘的研究起点,挖掘自动文摘研究领域的核心作者、期刊分布及其发展动向等,不仅有助于国内业界人士明确自动文摘的研究源起和重点,而且有利于把握未来的自动文摘研究动态.本文利用情报研究中常用的计量统计、内容分析等方法,借助<中国分类主题词表>确定了自动文摘研究领域的主题词,然后依托<中国学术文献网络出版总库>挖掘了自动文摘研究论文的数据集;通过定性与半定量相结合的方法,对2009年前国内自动文摘研究的研究论文数量、学科分布、作者分布等进行分析,最终探明了国内自动文摘研究的源起、发展进程等宏观发展历程及方向. 相似文献
5.
汉语文本特征词的抽取方法 总被引:13,自引:3,他引:10
本文从自动文摘的需求出发 ,探讨特征词自动抽取的方法和技术 ,设计并实现了两种不同的特征词自动抽取算法。这些方法对文本的自动分类和全文检索也有一定的借鉴意义。 相似文献
6.
自动文摘系统的评测是自动文摘技术研究与发展的关键部分.随着摘要技术的快速发展,国外学者十分重视评测技术,研究工作也如火如荼,而国内相关工作相对贫乏.文摘评测对文摘系统的性能有重大影响,对自然语言处理、信息检索等相关技术有着促进作用.本文详细介绍了文摘评测的两大方法:内部评测和外部评测,并对多年来文摘评测中应用的关键技术做了简要总结,最后指出文摘评测面临的挑战及未来需要努力的方向. 相似文献
7.
基于全信息词典的自动文摘系统研究与实现 总被引:3,自引:1,他引:2
本文根据文摘与文本结构的关系,提出了一个以文摘框架为核心的文摘系统模型。系统的运行是建立在一部对词语进行了语法、语义、语用三个层面描写的全信息词典的基础上。文本分析器在其作用下,能有效地对与文摘有关的文本部分进行分析,填充预定的文摘框架,最后生成风格一致的文摘。基于上述理论的研究,设计并实现了计算机病毒领域的自动文摘实验系统,其效果较为理想。 相似文献
8.
本文提出了几个可以改善中文自动文摘系统的文摘效果的措施 :1 将字频统计方法和词频统计方法有机结合起来 ;2 进一步研究人工文摘中理解性文摘句的形成机理 ,完善仿人算法 ;3 将自动聚类的方法引入自动文摘研究。 相似文献
9.
10.
微机辅助文献标引系统的设计与研究 3. 自动标引研究 总被引:2,自引:0,他引:2
在微机辅助文献标引系统中引入了自动标引方法, 进一步提高了标引的速度和质量。自动标引的基本思想是: 以机内主题词典为依据, 采用遍历扫描和相似性匹配两种方法, 从标题和文摘中抽词, 本文介绍了这一自动标引技术, 并对自动标引的结果进行了分析和讨论。 相似文献
11.
12.
微博短文本预处理及学习研究综述 总被引:1,自引:0,他引:1
认为因短文本具有特征稀疏性和高度冗余性,微博短文本的预处理及学习方法研究已经成为微博信息挖掘及应用的关键,并在许多方面有着非常重要和广泛的应用。重点分析微博短文本的特性,并对微博短文本的预处理和学习方法及其应用现状进行归纳和总结,包括短文本特征表示、短文本特征拓展与选择、短文本分类与聚类学习、热点事件发现及自动文摘等。最后指出相关研究的局限性,并对未来的发展方向进行展望。 相似文献
13.
在理解自动摘要处理流程和梳理国内外重要研究成果的基础上,重点对自动摘要研究在文本分词、冗余度控制、质量评价、短文本自动摘要以及多语言与跨语言文本自动摘要等方面所面临的若干基本问题及其主要解决方法进行归纳和总结,并对部分研究内容的发展方向进行展望,以期为未来的自动摘要和自然语言处理研究提供有意义的参考。 相似文献
14.
15.
关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。 相似文献
16.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。 相似文献
17.
一种使用自动聚类思想的自动文摘方法 总被引:5,自引:0,他引:5
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选出与文献主题相关的段落类作为候选的用来挑出文摘句的段落类 ,最后从候选段落类中选出文摘句构成文摘 相似文献
19.
文本聚类结果描述研究综述 总被引:1,自引:0,他引:1
章成志 《现代图书情报技术》2009,3(2):1-8
首先对文本聚类结果描述的研究背景和相关的研究情况进行说明,分析自动标引、自动文摘、概念聚类与文本聚类结果描述的关系,定位文本聚类结果描述的研究内容;然后根据文本聚类结果描述的具体要求,对该问题进行形式化;最后给出文本聚类结果描述的评价方法。 相似文献