首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
基于词片网格的语音文档主题分类,为了从网格(lattice)多候选中得到语音文档主题分类召回率更高,提出了在lattice音节网格上直接提取词片,并且在处理语音词片的同时,将非负矩阵分解方法引入语音文档主题的分类。该方法避免了语音识别率低所导致的语音文档主题分类准确性的降低。实验结果表明:当N-best的召回率为91.66%时,基于混淆网络的关键词检出系统的召回率为96.67%,当SVD的F1值为83.38%,NMF的F1值为96.944%。  相似文献   

2.
陈晶 《大众科技》2010,(1):55-56
基于词片网格的语音文档主题分类,为了从网格(lattice)多候选中得到语音文档主题分类召回率更高,提出了在lattice音节网格上直接提取词片,并且在处理语音词片的同时,将非负矩阵分解方法引入语音文档主题的分类。该方法避免了语音识别率低所导致的语音文档主题分类准确性的降低。实验结果表明:当N-best的召回率为91.66%时,基于混淆网络的关键词检出系统的召回率为96.67%,当SVD的F1值为83.38%,NMF的F1值为96.944%。  相似文献   

3.
杜利民 《中国科学院院刊》2001,16(3):222-224,240
1 合作背景近几十年来 ,信息技术的发展加速了世界的快速变革 ,旅游、商贸、通信和互联网的发展使人类的活动全球化 ,口语语音交互的语言壁垒 ,开始成为束缚人类活动的又一桎梏。语言交流和沟通不是人类活动的本质 ,而是帮助达到活动目的的一种工具。在人类文明和科学技术发展的现代社会 ,用语音翻译的科技手段解决人与人之间、人与机器之间的口语语音交互的“频发”障碍 ,越来越迫切地成为当代高科技的一项重大使命。语音翻译是一项综合运用语音识别与理解、语言翻译、文语转换、通信协议、对话管理等多项功能技术的创新研究 ,受到国际科…  相似文献   

4.
本文综述了语音文本中标点符号识别的相关概念和基于句法—语义规则以及基于语料库和统计语言模型的主要识别方法,并介绍了几个典型的标点符号识别系统。最后,指出了有待进一步研究的关键性问题。  相似文献   

5.
本文主要介绍了一款面向旅游领域的Pocket PC终端上应用的软件.这个软件紧密结合奥运会期间奥林匹克大家庭成员的需求,是运用语音识别、语音合成、对话管理等各种先进技术研发的一款专用软件它利用移动终端方便、灵活的特性,提供多语言、语音识别、语音合成等更为人性化的交互方式,能够在2008年奥运会期间用中、英、法三种语言为奥运大家庭成员提供各种移动信息服务和奥运领域多语言互译服务.  相似文献   

6.
英语学习者在学习过程中必然要犯这样或那样的错误,分析学生的错误对教学工作起着重要作用。错误分析可以使教师了解学生学习过程中所存在的问题和面临的困难,并以此调整教学内容和教学计划,指导教学工作,使所有的教学时间有效地用于提高学生的英语水平上。语言学家根据不同的理论对学习者所产生的错误有不同的分类方法。列举出学生普遍存在的错误典型并将之归纳为语言错误和语用错误,即是否违反了语言的结构规则:语法,词汇,(没有表述语音错误),还是违反了语言的使用规则:语言的使用时间,场合是否得体。通过分析错误,指出教学和学习中存在的问题,由此说明错误分析是十分必要的。  相似文献   

7.
本文结合桂诗春提出的中国学习者英语失误分析认知模型和中国学生口笔语语料库错误分类方法,对自建的“辽宁省英语专业学生口语语料库”中的语言错误进行量化分析,总结出英语专业学生口语表达中存在的错误,并重点分析高频错误出现的原因,旨在帮助提高学生的口语表达能力和水平。  相似文献   

8.
随着信息时代的到来,计算机已成为人类不可缺少的日常工具。在计算机中,通常人机交互界面以键盘为主。键盘使用起来很不方便,为了计算机的界面与人更加“友好”,科学家开发出了若干种易学易懂、操作简单的界面。其中最方便最自然的界面首推口述的语言。多少年来人类主要通过语言来传达信息。如果采用语音人机对话交互界面,让计算机能听懂人的自然语言,而且能讲人的语言,这无疑是最受欢迎的理想界面。基于语音识别、语音合成及自然语言理解的人机语音对话技术  相似文献   

9.
本文主要介绍了一款面向旅游领域的Pocket PC终端上应用的软件。这个软件紧密结合奥运会期间奥林匹克大家庭成员的需求,是运用语音识别、语音合成、对话管理等各种先进技术研发的一款专用软件它利用移动终端方便、灵活的特性,提供多语言、语音识别、语音合成等更为人性化的交互方式,能够在2008年奥运会期间用中、英、法三种语言为奥运大家庭成员提供各种移动信息服务和奥运领域多语言互译服务。  相似文献   

10.
盛宇  刘俊熙  龙怡  郭金兰 《现代情报》2010,30(1):159-161
系统基于Windows平台,使用VB语言在微软.NET框架下完成,设计并实现一个基于"非规范用词"和"典型案例词典"的文本分类系统,系统采用人脑对自然语言理解的心理学原理"人们总是根据已知的最熟悉的、最典型例子的进行判断,只有在该方法不奏效的时候才使用频率这一概念,并且使用的是十分简单的频率"的分类策略。详细介绍词语切分统计、词库设计、父类词匹配、子类词匹配等子系统模块。  相似文献   

11.
基于ontology的语义检索模型架构   总被引:1,自引:0,他引:1  
焦玉英  张璐 《情报探索》2006,(10):54-57
将本体(ontology)与叙词表、语义网络、语义检索和概念空间等几个容易混淆的概念进行比较,提出了一个基于ontology的语义检索系统的结构模型。  相似文献   

12.
中科院自动化所模式识别国家重点实验室前不久被国际口语自动翻译协会正式接纳为该协会的第七个核心成员。这意味着中文这个全世界最为广泛使用的语言被纳入了国际语音互译的大家庭,也标志着我国口语自动翻译研究已跨入世界领先水平的行列。所谓口语自动翻译,即是通过计算机进行不同语音之间的同声翻译。据模式识别国家重点实验室副主任徐波博士介绍,国际口语自动翻译协会是该领域里最具权威性学术机构,该协会下一阶段目标是从2001年开始到2004年,利用公共电话网络和国际互联网,实际通过手机、电话、计算机终端等设备进行不同语种人类之间在旅行期间的场景对话。  相似文献   

13.
基于聚类的词表等级关系自动识别研究   总被引:3,自引:0,他引:3  
杜慧平  何琳 《情报科学》2008,28(11):1680-1684
词汇等级关系的识别是自动构建叙词表的重点和难点之一.基于相似度的词聚类方法,突破了按字面聚集等级关系词汇的传统做法的局限性,能够深入语义,识别出字面上无此特点的等级关系词汇.介绍了该方法并进行测试,试验结果表明该方法具有一定可行性.  相似文献   

14.
李海蓉 《情报科学》2012,(6):852-857
简要介绍语义模板的概念,提出基于语义模板向量空间的文档自动分类模型。利用支持向量机(SVM,Support Vector Machine)分类算法对文档测试集进行基于语义模板空间、词向量空间的分类实验,实验结果表明,基于语义模板空间的文本分类性能比基于词向量空间的分类性能要高。  相似文献   

15.
目前,国内外许多学者借助语义词典Word Net进行标签间语义关系挖掘方面研究,并取得了一定的进展,但却很少有专门针对中文语义词典与标签结合的研究。文章通过选取豆瓣读书上的标签数据,充分分析并利用中文语义词典《同义词词林》的分类体系和编码特点,利用一种基于《同义词词林》的词汇语义相似度计算系统Word Similar计算标签数据的语义相似度,进而挖掘标签间的语义关系,该方法得到的结果与我们思维中的词汇语义关系基本一致,有比较高的准确性。  相似文献   

16.
孙文俊  杜娟 《现代情报》2010,30(7):87-92
单词在句子中的交互不是随机的,而是基于一定的规则,这种规则可以通过语言网络进行研究。词同现网络是人类语言网络的一种表现形式,它利用单词在句子中的相邻关系来确定一个连接。文中采用语言网络分析的方法对论文进行甄别:将论文用词同现网络表示,计算网络的特征参数并输出一个向量来表征论文,然后运用支持向量机对论文进行分类。结果表明,使用该方法对高水平的论文和文本发生器产生的论文具有很好的甄别效果,对领域差别大的论文甄别效果也较显著。  相似文献   

17.
基于同义词词林的文本特征选择与加权研究   总被引:1,自引:0,他引:1  
特征选择与加权是文本分类的关键问题之一,而噪音与数据稀疏则是特征选择过程中遇到的主要障碍.介绍了一种基于同义词词林的统计与语义相结合的文本特征选择与加权方法.该方法首先对同义词进行合并,将原有的特征提取从词的层面上升到主题概念层面,然后采用词频与相对熵的剩余度的组合TF*Ensu对特征进行加权,强化对分类贡献大的主题特征.实验结果表明,这种方法较之传统方法在特征选择与加权的效果上有明显改善,并能提高文本分类的精度.  相似文献   

18.
高原 《科技风》2015,(1):207
科学技术的换代发展将电子计算机、网络等多种方式带进了当代教学课堂当中,为教学开展提供了多种方式。基于数字媒体环境下进行教师口语的训练,将能够有效的提高教师的语言运用、理解、表达的能力。  相似文献   

19.
王莉 《中国科技信息》2005,(11):383-384
英语学习者在学习过程中必然要犯这样或那样的错误,分析学生的错误对教学工作起着重要作用.错误分析可以使教师了解学生学习过程中所存在的问题和面临的困难,并以此调整教学内容和教学计划,指导教学工作,使所有的教学时间有效地用于提高学生的英语水平上.语言学家根据不同的理论对学习者所产生的错误有不同的分类方法。本文列举出学生普遍存在的错误典型并将之归纳为语言错误和语用错误,即是否违反了语言的结构规则:语法,词汇,(本文没有表述语音错误),还是违反了语言的使用规则:语言的使用时间,场合是否得体.通过分析错误,指出教学和学习中存在的问题。由此说明错误分析是十分必要的。  相似文献   

20.
教学目标是教学活动的出发点和归宿点,而对话教学的目标设计又是整个教学设计的关键一环.明确对话教学目标分类的基础上,保持对话教学目标设计的预设性与生成性之间恰当的张力,同时要求对话教学目标设计遵循一定的规则和基本步骤.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号