首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
介绍了词性标注系统的设计与实现,描述了该系统的功能和总体结构,系统的各模块及其功能,系统所使用的兼类词典、非兼类词典、词性标注集,最后对系统的总体性能进行测试并对测试结果进行了分析.  相似文献   

2.
在线词典具有种类繁多,资源丰富,检索简单方便等优势,为语言学习也为语言研究等工作提供了相当大的便利,愈来愈受到各国的重视,但较之纸质词典它又存在总体质量不高,信息量不够充实等缺点。本文认为在线词典与纸质词典是互补关系,将二者很好地综合利用才是词典使用的最佳选择。  相似文献   

3.
张秋秋 《科教文汇》2007,(10Z):223-223
在线词典具有种类繁多,资源丰富,检索简单方便等优势,为语言学习也为语言研究等工作提供了相当大的便利,愈来愈受到各国的重视,但较之纸质词典它又存在总体质量不高,信息量不够充实等缺点。本文认为在线词典与纸质词典是互补关系,将二者很好地综合利用才是词典使用的最佳选择。  相似文献   

4.
论在线词典与纸质词典   总被引:1,自引:0,他引:1  
在线词典具有种类繁多,资源丰富,检索简单方便等优势,为语言学习也为语言研究等工作提供了相当大的便利,愈来愈受到各国的重视,但较之纸质词典它又存在总体质量不高,信息量不够充实等缺点.本文认为在线词典与纸质词典是互补关系,将二者很好地综合利用才是词典使用的最佳选择.  相似文献   

5.
本文从精心编纂、严谨治典的《现代汉语规范词典》的编纂谈起,简要介绍了词典的功用,《现代汉语规范词典》的特色,以及词典编纂中的精神。  相似文献   

6.
赵智楠 《科教文汇》2009,(34):161-161
语用信息是词典微观结构的一项重要组成部分。本文致力于分析单语词典在提供语用信息方式上的特点,以期从中揭示出语用信息在词典整体结构中所扮演的重要角色。  相似文献   

7.
一、什么是集成词典和集成词典模式集成词典是一部集中体现现代辞书学研究最高成就的智能化的多功能语言(文字)应用工具书,是对人类思维语言工具的一次重大改造和全面展示,是《世界共同语智能辞典》的雏形。集成词典模式,就是把集成词典的创新精神,把集成词典首创的多语言的收词方式,模拟和展现思维语言规律的检索方法、编排体例及多类型的《多用途集义词目检索表》等,推广应用到本民族语言(文字)、外民族语言(文字)、外国语言(文字)及世界共同语言的智能词典或检索词典的辞书研究、编纂的实践中去。集成词典和集成词典模式又…  相似文献   

8.
[目的/意义]情感分析技术广泛应用于网络舆情方面,该技术可以有效地区别分析网民在网络社交平台所发布言论的情感极性。受到应用领域的限制,基础的情感词典并不能满足特定应用领域对于情感分析的需求。本文构建的词典可以满足网络舆情领域的情感分析需求。[方法/过程]先使用TF-IDF和TextRank提取种子词,然后采用SO-PMI算法构建突发事件网络舆情领域的情感词典。[结果/结论]使用该情感词典对“昆山反杀案”这一突发事件的微博评论进行情感分析,证明了所构建的情感词典在一定程度上具有准确性及适用性。  相似文献   

9.
通过对已有的分词算法尤其是快速分词算法的分析,提出了一种新的分词词典结构,并据此提出了二次Hash^+二分最大匹配快速分词算法。该算法具有较快的分词速度。  相似文献   

10.
杨一宁 《内江科技》2009,30(11):35-36
塞缪尔·约翰逊是18世纪最杰出的词典编撰家,他以广泛的背景知识以及丰富经验,成功地编撰出那个年代独一无二最具权威的词典的百科全书。本文从多个方面剖析和评论了作者编撰该词典时的种种艰辛,以及词典本身的影响和优缺点。  相似文献   

11.
PFIBF方法是一种基于Wikipedia链接关系建立关联词典的方法.该方法仅仅对Wikipedia中的概念进行分析,而忽略了出现在概念解释文档中的术语与概念间的关系.本文利用共现分析法提取在解释文档中出现的术语并将提取出的术语定义为PFIBF分析的对象,扩展了PFIBF法分析的范围,从而实现了对PFIBF法的改进.使用改进后的方法建立关联词典,与原PFIBF方法建立的词典比较,改进后的方法能在不改变准确率的情况下提高关联词典的术语数量和关联关系数量,完善关联词典.  相似文献   

12.
俞烨敏 《科教文汇》2009,(27):267-267
搭配在语言中无处不在,对搭配的掌握有助于我们使用一门语言。然而搭配问题又是学习者遇到的最大绊脚石之一。现已出版的搭配词典尚存在很多问题。本文试图分析英汉双解版《牛津英语搭配词典》的优缺点,希望对今后搭配词典的编纂有一定的帮助。  相似文献   

13.
本文在已有研究基础上,针对中文粗分词,设计了多重哈希词典结构,以提高分词的词典匹配效率,同时基于删除算法改进了中科院ICTCLAS分词系统的K-最短路径搜索思想.最后,论文对所研究技术方案进行了系统实现.系统实验结果表明,对于大规模文本,论文所提出的粗分词方案体现出了很好的性能.  相似文献   

14.
搭配在语言中无处不在,对搭配的掌握有助于我们使用一门语言。然而搭配问题又是学习者遇到的最大绊脚石之一。现已出版的搭配词典尚存在很多问题。本文试图分析英汉双解版《牛津英语搭配词典》的优缺点,希望对今后搭配词典的编纂有一定的帮助。  相似文献   

15.
基于词表和N-gram算法的新词识别实验   总被引:1,自引:0,他引:1  
曹艳  杜慧平  刘竟  侯汉清 《情报科学》2007,25(11):1687-1691,1695
目前未登录词问题仍然很大程度上影响着自动标引和信息检索的效率。本文提出了一种选择期刊论文的题名和摘要作为训练语料,利用N-gram算法切分和停用词典等过滤筛选的非专名的新词识别方法。该方法主要分为两步:先进行N元切分,保存关键词候选集并统计词频;然后进行一系列的过滤,主要有词频闽值限定、前停后停词典过滤、相邻词比较、子父串比较、抽词词典和过滤词典的过滤,最后进行人工判别。对实验结果的测评表明这一方法是简便易行的。训练语料可以不用全文,只用题名和摘要;在新词识别上,摘要可以代替题名。  相似文献   

16.
基于词典的汉语自动分词算法的改进   总被引:6,自引:0,他引:6  
傅立云  刘新 《情报杂志》2006,25(1):40-41
综合分析了目前在计算机自动分词领域取得的进展和面临的困难,针对词典法提出了一种新的词典构筑方法以及相应的匹配算法。  相似文献   

17.
[目的/意义]网民情感变化是影响政府舆情应对进程、政策、策略的关键。因此,构建科学高效的情感词典,对网民情感分析研究及应对策略的选择具有重要的实际意义。[方法/过程]结合扎根理论的质性研究特点,在情感词典的构造中融入突发事件演化规律影响因素,采用点互信息算法,TF-IDF,统计量等方法对微博表情符号词典及突发事件专属情感词典进行构建,编制了突发事件情感词典,随后选取"6.22"杭州保姆纵火案微博语料进行情感分析。[结论/结果]实验发现,与不加入影响因素的情感词典相比,本文构造的词典在准确率召回率等指标的对比中均得到了一定程度的提高。同时,结合扎根理论与主题分析的结果,对舆情发展的不同阶段所选择的舆情应对策略提供了参考。  相似文献   

18.
在互联网环境下,新闻数量以海量方式增长,对其进行智能化分类、知识提取处理迫在眉睫。基于此,主要研究了如何在原有关键词词典的基础上,提出一种发现新词的方法,并将提取出的未登录词添加到原始词库中,从而构造一部数量适当、覆盖面全、更新方便的关键词词典。基于大规模的新闻语料作为实验资源,采用了一种利用N-gram算法切分,用关键词抽词词典、停用词词典等过滤筛选非专名的新词识别方法。实验结果的测评表明这一方法是简便易行的。  相似文献   

19.
[目的/意义]明晰政策意图是当前政策文本量化分析的重要目标。结合基于中文政策文本词汇语义强度差异构建的程度词典的政策文本量化分析,具备高效识别政策意图的潜力。然而,现有程度词典存在词语数量少、权重设计单一、缺乏应用场景的问题,有必要开展进一步的优化与应用研究,以深化中文政策文本语义挖掘以及政策研究实践。[方法/过程]参考已有程度词典构建方法,使用不同类型的政策文本语料进行程度词数量的扩展,利用专家调查法进行程度词权重的优化,以近20年我国综合性科技规划文本为例,使用优化后的程度词典进行科技政策文本重要内容的识别与分析。[结果/结论]优化得到的分级程度词典具有信度和效度。使用程度词典分析科技政策时,可结合科技政策文本特有的体系结构,从多个层面细致地梳理政策的主要关注点及其发展演变,还可根据实际需求选择合适的分析粒度,开展问题导向型的中文政策研究或实践。  相似文献   

20.
汪蕊  邓琳 《科教文汇》2007,(11Z):97-98,100
本文通过问卷调查对成人英语学习者在英语学习词典宏观结构和微观结构方面的需求进行了调查并加以分析,旨在为编纂符合广大成人英语学习者需求的英语学习词典提供广泛并有价值的读者意见。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号