首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
张晗  赵玉虹 《图书情报工作》2016,60(11):135-142
[目的/意义]针对共词分析存在的普遍问题,提出一种基于细粒度语义分析的共词网络构建与分析方法。[方法/过程]借助SemRep实现源文本主题概念及其语义关系的规范化抽取并由此构建语义共词网络,然后以节点的中心度和边的频次为指标对内容特征词进行抽取,利用UMLS语义网络规定的语义搭配模式,通过概念-语义类型-语义类型组的两级映射,对语义述谓项进行类团划分。[结果/结论]通过与常规共词分析方法比较,发现基于细粒度语义关系的共词分析能有效地揭示文本主题内容,利用UMLS语义网络资源能从语义学角度清晰准确地对语义共词网络进行类团划分。  相似文献   

2.
赵一鸣  尹嘉颖 《情报学报》2023,(10):1187-1198
共词网络是研究语言现象的重要方法,语义特征是词汇共现现象中重要的隐性知识,研究共现词之间的语义关系及特征,可以从语义视角改进共词网络的研究,并利用语义学知识为现有的共词分析方法赋能。本文提出了一种语义增强型的共词网络构建和分析方法,从共现特征、网络特征与语义特征3个维度丰富了共词网络节点和边的属性。通过实验构建了基于14万余篇新闻文本数据的语义增强型全文本共词网络,并重点对共现词对的语义特征进行分析,结合案例呈现了该方法在计算语言学研究和行业应用上的价值。本文从词间语义关系的视角,拓展了共词网络的构建和分析方法,描述了共现词汇的语义特征,证实了语义关系的非对称性和传递性,为语义关系的分类与推导提供了理论依据,在语义消歧、词义理解等方面具有应用价值。  相似文献   

3.
胡雪婵 《出版广角》2021,(16):80-82
语料库是数字出版知识服务领域常见的产品形态.汉语成语在汉语语料库中传递信息并具有时代性,汉语成语的词项搭配具有语义趋向,影响用户对汉语语言的认知.当前,汉语语料库中的成语语义韵相对稳定,但随着时代的发展会进行局部语义韵扩展,形成新的语义韵,具有可开发性.成语文化内涵体现了文化精神,具有时代性,在汉语语料库建设蓬勃发展的当下,需关注成语在现代汉语语境中的使用,提升汉语语料库的引导力,服务广大用户.  相似文献   

4.
基准词是具有明确褒贬义倾向的词汇,基准词的选择对词汇倾向性判别的准确率有影响.现有的基准词选择方法主要关注的是基准词的频率、类别区分度和上下文敏感性,忽略了基准词的褒贬强度,这导致了词汇乃至更大粒度的语言单元的语义信息遗失.本文提出了一种含强度的基准词选择和词汇倾向性判别方法,首先对情感词进行语义相似性计算和聚类,然后进行倾向性计算和分类,由此得到包含语义及强度信息的基准词集,该基准词集可用于词汇褒贬性及褒贬强度的判别.我们分别使用通用搜索引擎和领域搜索引擎对该方法进行了验证,实验结果表明,领域搜索引擎下的词汇褒贬性及正负性词的褒贬强度判别准确率分别可以达到84.00%、80.49%和76.47%.  相似文献   

5.
面向信息检索的词汇知识发现   总被引:1,自引:0,他引:1  
针对信息检索中词汇知识发现问题,提出面向信息检索的词汇知识发现框架结构,对面向信息检索的词汇的定义、同义词、相关词、排除词等词汇知识获取与挖掘进行详细的介绍,为后续的语义检索研究打下基础。  相似文献   

6.
自互联网诞生以来,网络语言的流行已蔚然成风,丰富了汉语的词汇储备,增强了汉字的表达功效。网络流行语"尬舞"产生于偶然的谐音,但却促动了"尬"类词的不断衍生。这种衍生反过来又促使"尬"义的变异。文章从"尬舞"的起源入手,考察了"尬"的语义变化及用法扩展,分析了"尬"类词的形式和语义的搭配变化,阐释了"尬"类词的产生机制及传播特征。"尬"类词的出现及演变集中体现了网络流行语的传播特点,是汉语网络语言词汇泛化的典型。  相似文献   

7.
周雷  李颖  石崇德 《情报工程》2015,1(3):064-075
基于机器学习的分词模型可以借助科技词汇构词特征分析提升其在科技领域的适应性,本文对传统语言学的句法构词、韵律构词、语义构词几个方面理论进行总结归纳,融合术语学研究理论,围绕提升分词准确率的目的,提出了适用于科技词汇的构词特征标注系统,并对标注系统的结构进行了规划。这为科技词汇构词特征标注工作完成了前期的探索,为后期批量标注,辅助分词等环节提供了基础依据。  相似文献   

8.
为提高引文网络社区划分的准确性,以文档之间的语义关系以及引文之间的引用关系为基础,结合词汇在文档中的位置关系等信息,构建基于词汇语义加权的引文网络。通过GloVe模型对词汇向量化以充分利用词汇语义信息,结合WMD模型度量文献之间的相似度,把文档相似度的计算转变为在约束条件下求线性规划最优解的问题,结合文本的内容及结构特征对网络中的边进行赋权,以Louvain社区发现算法对加权后的引文网络进行社区划分,并对划分后的社区进行分析与检验,实验证明GloVe-WMD模型可提高引文网络社区划分的准确度。  相似文献   

9.
汉语科技词系统建设实践——以新能源汽车领域为例   总被引:2,自引:1,他引:1  
汉语科技词系统是汉语科技词汇深层次知识组织与应用服务工具的集成体系,其知识组织核心内容包括词汇属性描述、词间关系组织、词汇类别信息模型,其核心工具包括词汇和关系的自动获取工具、协同编辑和管理平台系统以及相关应用服务接口.本文比较分析了目前国内典型的词汇语义知识工程,提出了汉语科技词系统数据模型,并以新能源汽车领域知识组织系统为例详细介绍了汉语科技词系统的内涵及相关知识模型.结合实例详细介绍了新能源汽车词系统建设过程中的数据收集策略、分析处理流程,并展望了科技词系统下一步的研发和应用方向.  相似文献   

10.
作为文本内容理解的媒介与载体,词汇语义知识库已被广泛应用于信息检索、信息提取、问答系统、自动文摘等方面,成为自然语言处理不可或缺的基础资源.本文介绍词汇语义知识库研究与开发的现状,重点分析了WordNet、Sinica BOW、HowNet及CCD等具有代表性的词汇语义知识库的具体情况.在此基础上,盘点各种需求和解决方案,提出词汇语义知识库研究面临新的挑战和机遇,即本体化和多语化的大趋势,它们将从不同方面弥补词汇语义知识库在知识共享和知识交流上的不足,使其更好地为自然语言处理服务.本文最后探讨了词汇语义知识库未来发展中可能存在的问题和新的课题.  相似文献   

11.
李向阳  张亚非 《情报学报》2005,24(1):100-106
简单分析了语法上界定汉语短语的困扰,提出一种利用语义搭配关系界定汉语短语的方法。首先,借助同义词词林实现语义知识的编码,用这种语义编码来表示语义搭配关系;其次,在此基础上,定义短语与已知语义搭配关系的相似性,计算词语搭配的合理性;最后,利用短语内部的语义搭配合理性优于其他搭配这一性质,用算法实现了基于语义的汉语短语界定过程。该方法应用于军事文本,从中界定出描述作战单位等信息的短语,取得较好的效果。此外,经该方法界定出的短语具有较强的语义信息,对信息抽取等实际应用具有一定的适用性。  相似文献   

12.
刘畅  宋筱璇 《图书情报工作》2017,61(16):122-134
[目的/意义]用户的检索式行为是用户信息搜索的重要环节,本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。[方法/过程]通过对国内外相关文献的梳理,将检索式构建行为划分为检索词、检索式和会话层三个层面,以及词汇、语法和语义三个维度,对每个维度及不同维度之间的研究的区别与联系进行讨论,并对检索式的重构行为、检索式的质量和效果评估、以及影响用户检索式行为的要素等几个方面的相关研究进行总结。[结果/结论]已有研究对于检索式行为中的检索词和检索式的词汇研究较为丰富,未来需要增加对检索式的语法和语义的研究,以便深入理解用户的检索式构成特征。另外,关于检索式重构的类别和模式的自动识别的探索有所不足。在检索式的质量和效果评估方面,还需结合多种情境因素,更深入地研究易于用户理解和利于其搜索的检索式推荐模式。  相似文献   

13.
作为一名编辑,每天都要审阅大量的通讯员来稿。从来稿中又往往能挑出不少语法上的差错。这些语法差错,大量地表现在语义的措配和成语的运用上。笔者根据自己编辑实践,试以若干例句对这两方面的差错加以剖析,以供各位同仁参考。一、语义搭配要合乎事理,合乎逻辑汉语组合方式主要有两种,一是直接组合,一是关联组合。无论是直接组合,还是关联组合,实质问题是语义搭配,也就是说,  相似文献   

14.
笔者作为一名编辑,每天都要审阅大量的通讯员来稿。从这些来稿中,往往能挑出不少语法上的差错。而这些语法差错,大量地表现在语义的搭配和成语的运用上。笔者根据自己的编辑实践,试以若干例句的形式对这两方面的差错加以剖析,以供各位通讯员参考。 语义搭配要合乎事理,合乎逻辑 学过现代汉语的人都知道,汉语组合方式主要有两种,一是直接组合,一是关联组合。无论是直接组合,还是关联组合,实质问题是语义搭配。也就是说,组合除了要符合语言习惯之外,还必须合乎事理,合乎逻辑。  相似文献   

15.
黄希玲 《出版参考》2015,(18):66-67
商务印书馆自日本小学馆引进出版的《英汉多功能学习词典》(以下简称《多功能》),与英美人编纂的牛津、朗文等词典有所不同,在对同一语义场的词汇描写、名词标注、词语搭配的呈现等方面独具匠心,有别于一般词典词汇描写和语法设置针对性较弱的做法,能解决我国英语学习者学习过程中遇到的问题,为读者所喜爱.  相似文献   

16.
词汇相似度研究进展综述   总被引:1,自引:0,他引:1  
从有背景信息和没有背景信息两个角度对国内外词汇相似度研究现状进行深入分析和比较。没有背景的统计方法不能真正挖掘出词对间的语义关系,语义词典也存在覆盖词汇范围有限等局限性,而维基百科作为含有语义词典功能的大型语料库,成为新的词汇语义信息的重要来源。详细阐述维基游走法、内涵概念图法和时间语义分析法这三种最新的基于维基百科的词汇相似度算法,指出词汇相似度研究今后将有机融合维基百科和其他背景信息,使各种词汇语义信息来源优势互补。此外运用复杂网络的分析方法来挖掘词汇网络中词汇的相关性将是词汇相似度研究的又一发展方向。  相似文献   

17.
广州,作为中国知名的一线城市,其经济实力和文化底蕴等方面的发展日益受到国内与国外媒体尤其是美国媒体的关注。本研究基于两个自建的中美新闻语料库,使用语料库检索软件AntConc3.4.3提取高频词汇,分析其语义趋向及语义韵,结合批判性话语分析,对比中美媒体所塑造的不同的广州城市国际形象。研究表明,美国媒体关于广州的报道比中国媒体更为灵活和多样,用词方面的准确性更能体现出媒体或者国家对待事件的情感态度。国内媒体因有加强广州的国际影响力的责任,在报道上主要宣传广州具有积极意义的事件。  相似文献   

18.
提出一种基于词汇链的关键词抽取方法。该方法通过构造词汇链来描述技术路线图的技术领域主题内容,并将词汇链作为表征技术路线图中领域关键词、核心技术关键词及其语义关系的词汇序列。实验表明该方法抽取的关键词能够更全面地揭示技术路线图的技术领域主题内容,其抽词结果的准确率和召回率较TF-IDF方法有明显的提高。  相似文献   

19.
词汇链是文本中一系列词汇关联而成的语义链,构造词汇链有助于提高文本的连贯性,把握文本主题。借鉴概念层次网络(HNC)理论对词汇语义进行形式化描述的原理,研究基于语义网络节点遍历计算的词汇链构造方法。首先对汉语文本进行分词处理,从知识库中获得词语的HNC符号,然后对语义符号进行解析,获得词语的语义关联性并构造词汇链;最后,对词汇链进行优选处理,设定阈值获得优选词汇链。实验结果表明,该方法构造的词汇链可接受度较高,对主题标引、自动文摘、文本分类等有重要价值。  相似文献   

20.
解读语义Web     
介绍语义Web的概念及目的,认为语义Web的实质就是使计算机能够理解网络信息资源的元数据,并以书目数据的发展变化为例解读语义Web中元数据的结构和意义。提出书目数据向元数据发展,需要著录项目标准化,构建元数据描述框架,制定计算机能理解的词汇,科学地定义词汇的属性和词汇之间的关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号