首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
通过研究目前中文分词领域各类分词机制,注意到中文快速分词机制的关键在于对单双字词的识别,在这一思想下,提出了一种快速中文分词机制:双字词-长词哈希机制,通过提高单双字词的查询效率来实现对中文分词机制的改进.实验证明,该机制提高了中文文本分词的效率.  相似文献   

2.
结合中文分词的贝叶斯文本分类   总被引:1,自引:0,他引:1  
文本分类是组织大规模文档数据的基础和核心。朴素贝叶斯文本分类方法是种简单且有效的文本分类算法,但是属性间强独立性的假设在现实中并不成立,借鉴概率论中的多项式模型,结合中文分词过程,引入特征词条权重,给出了改进Bayes方法。并由实验验证和应用本方法,文本分类的效率得到了提高。  相似文献   

3.
文本聚类是建立大规模文本集合的分类体系实例的有效手段之一。本文讨论了利用标准的分类测试集合进行聚类质量的量化评价的手段,选择了k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比。对实验结果的分析表明,STC聚类算法由于在处理文本时充分考虑了文本的短语特性,其聚类效果较好;基于Ant的聚类算法的结果受参数输入的影响较大;在Ant聚类算法中引入文本特性可以提高聚类结果的质量。  相似文献   

4.
文本与文化     
对翻译中过分强调文化而忽略文本的倾向,矫枉不得过正。翻译的终极目标是传播文化,但是通过一个个文本来实现的,译者的直接目的是文本。文本的内容、形式本身就是文化,而文化也只有借文本才得以体现。文本的性质、译者的目的都影响文本中文化因素的处理。文化交流方式的增加也减轻了翻译中文化传递的负担。  相似文献   

5.
在信息系统运维服务过程中,大量客户的咨询问题都是重复的,这为运维人员带来了很多重复性工作。基于文本分词的智能人机对话系统可以很好解决这个问题。提出一种利用运维语料库和基于中文文本分词的智能人机对话模型,该模型可以针对用户提出的问题,自动给出最优的解答,解决了人工运维过程中存在的速度慢、效率低的问题,实现了借助人工智能促进企业运维服务水平不断提升的目的。  相似文献   

6.
通过相关性分析、单因素方差分析等统计学方法分析了长篇阅读文本(小说)、中长篇阅读文本(论说文)及短篇阅读文本(应用文)对同一种题型--多项选择题的效度影响.结合对英语专业学生泛读能力的培养要求,比较了三种文本类型的测试效度,提出泛读测试试卷开发的新思路.  相似文献   

7.
新课标提倡教师个性化教学,语文课堂教学也日趋多元化、现代化,但无论哪一种个性的凸显、哪一种角度的侧重,都不能脱离最重要的课程资源——文本。语文教学不能架空文本,脱离文本;上语文课,必须紧贴文本地面行走,脱离文本的空谈就是违背了语文教学的实质。对文本的阅读就是走进文本,理解文本,融进作者的心灵,触摸情感的脉搏。语文教师在语文课堂教学实践中,应引导学生读出文本的“情”,让学生与文本直接对话,去品出文本的“味”,悟出文本的“旨”,并能走进文本,再走出文本,获得阅读上的超越,从而拓出文本的“境”,以实现对语文课堂教学的回归与超越。  相似文献   

8.
英语规范性法律文本使用的立法语言具有多种特点,这些特点的存在共同为法律文本规范性而服务。英语规范性法律文本汉译不仅跨语言、法系,也是一种跨文化的活动,翻译者应该秉承法律功能对等的原则,对各种翻译策略进行灵活使用,最终使东西方国家文化交际活动变得更加顺利,希望本文的分析可以为相关研究提供一些帮助。  相似文献   

9.
基于中英文酒店介绍文本平行文本语料,对酒店官网电子介绍文本进行研究,依据Nord文本类型和Werlich文本语法理论,对比中英文本特征,藉此更好地指导中文酒店外宣文本的英译。  相似文献   

10.
针对网络中主观感情色彩的评论性文本进行处理可以获得有用的意见、结论.介绍文本倾向性分类技术,并基于该技术分析网络中对商品的评论信息.提出构建商品评价模型的方法.  相似文献   

11.
对文本的自动分类进行了研究,介绍文本分类的基本过程和文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法——K-最邻近算法.利用K-最邻近算法(KNN)并结合改进的词特征权值计算方法和文本相似度的计算方法完成了文本的自动分类.通过KNN方法分类之后的结果的查准率、查全率得以明显提高.  相似文献   

12.
文本的诠释过程是复杂的,它涉及到文本的社会——历史背景,文本本身的语言以及文本的“误读”,而意识形态却是我们进行文本诠释时所不可忽视的。文章从诠释学的基本理论出发,分别从社会——历史背景、文本语言与对话和文本的意义创生三个方面试图阐释这一现象。  相似文献   

13.
旅游文本属应用类文本,其主要功能与翻译目的是传达信息,吸引西方游客,同时兼顾传播中华文化。德国功能学派认为翻译目的决定翻译策略。依据该理论,在翻译复杂的中文旅游文本时,采取何种策略或技巧,要看是否能达到预期翻译目的。  相似文献   

14.
提出一种新的用于识别视频中字幕文字的方法。鉴于视频中文字的大小、颜色、渲染风格和分辨率的不同,以及视频中各种复杂背景的影响,识别视频中的叠加文字是一个尚未解决的问题。目前,大多数视频叠加文字识别方法都基于视频文字的二值化和传统OCR引擎的结合。然而,二值化过程容易引入噪声和文字笔划信息的丢失。另外,传统OCR技术主要专注于高分辨率的扫描打印文档,这些文档具有背景单一、噪声少和笔划信息较完整的特点。因此,传统OCR引擎用于识别叠加文字二值化后的结果可能不够鲁棒。为解决这个问题,直接从未二值化的叠加视频文字图像中提取Gabor特征用于训练二层字符识别器。实验结果表明,本文提出的方法在多字体视频叠加中文文字识别上有良好的效果。  相似文献   

15.
以迁移理论为基础,采用实证的研究方法,从语篇的角度分析了汉语在非英语专业大学英语写作学习中的迁移现象并提出了相关的教学建议。研究结果表明学生的汉语水平对其英语写作学习既存在正迁移也有负迁移。  相似文献   

16.
以中西民族整体性思维和个体性思维倾向的差异为前提 ,寻找这种差异在汉、英语中在表现法、语段组织及语序等几个方面的体现。汉、英语在表现法上的差异表现为汉语偏重“意合”而英语则偏重“形合” ;在语段组织方面 ,汉语的语段呈现“流散型”的铺排 ,而英语则呈现“聚集型”的扩展 ;在语序方面 ,汉语中语言成分的排列按照从大概念到小概念、先整体后局部的顺序 ,而英语则反之。  相似文献   

17.
针对智能手机难以全面保障短信息传输的安全, 提出一种新的基于Android系统的短信息移动分级安全方法.对一般用户短信息, 使用计算复杂度较低的序列加密;对涉及商业信息安全的短信息, 使用基于RSA数字签名的序列加密;对含有用户账号密码的重要短信息, 使用基于数字签名的RSA非对称加密.仿真实验和实际应用表明, 这种移动分级安全方法, 加密的密文中的"0"和"1"接近等概率分布, 具有比特效应, 且性能稳定, 适合应用于资源受限的手机或其他移动终端.  相似文献   

18.
对话是沟通古今之间的有效路径,如何更真实、全面地还原文本生成的历史语境,众多研究偏重从文本内容上的分析,而忽视了对文本媒介性的分析。文本的媒介性通过媒介符号结构和物质结构这两个层面发挥作用,对文本的构思、呈现以及传播流布等方面产生不同程度的影响,而这些影响尤其在跨文本对话时是不可回避的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号