首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
针对目前市场上语音控制家居产品的语音识别必须在服务端进行,在缺乏互联网情况下则无法使用,以及智能家居设备采用有线组网方式导致升级维护成本高的问题,设计一款采用WiFi、蓝牙等无线混合组网技术搭建的异构家庭网关,可以动态添加设备,组网灵活方便且成本低,即使在断网情况下,网关也可自动切换到本地语音识别。为此,使用基于上下文相关的GMM-HMM算法训练声学模型与语言模型搭建语音识别引擎,采用BP神经网络学习算法实现语音智能控制。测试结果表明,系统功能基本符合预期,在断网情况下系统仍可以进行语音识别并对家庭设备进行语音控制。  相似文献   

2.
本文在分析目前改卷方法现状与存在问题的基础上,基于微软SpeechSDK5.1语音识别引擎,使用.NET平台和SQLserver数据库,设计和实现了联网语音改卷系统。该系统可以用语音读入标准答案和学生答题,语音控制程序的运行,是改卷的一种新工具。  相似文献   

3.
朝鲜语是我国目前适用范围较为广泛、使用人口较多的一种少数民族语言。朝鲜语紧急呼叫号码的语音识别软件,采用语音命令来呼叫号码,能够准确识别拨叫号码,在特定场合可以起到至关重要的作用。将语音控制指令范围设定为报警求助、火警等词汇的识别中,实现了朝鲜语紧急呼叫号码语音识别系统的软件算法部分。通过对信号处理的每个步骤和朝鲜语数字连读问题进行深入分析及研究,选择DTW(动态时间弯曲)算法作为该软件的核心算法。Matlab实验结果表明,采用的语音识别过程及算法可以准确地对录制的朝鲜语紧急呼叫号码进行识别。  相似文献   

4.
分析了在航管雷达模拟系统增加语音识别和合成功能的实现过程。根据航管雷达模拟系统的特点,采用中英文皆可识别且适合连续识别的语音引擎,以及符合人类语言特点的TTS语音库,与系统内部通讯机制相结合,实现语音识别和合成的过程。该系统运行稳定,在识别率和数据传输速度等方面效果比较好。  相似文献   

5.
《商洛学院学报》2017,(4):15-19
为了通过语音控制空调工作,针对带Wi Fi功能的空调和传统的不带Wi Fi功能的空调分别设计了两种不同的控制方案,应用讯飞语音识别与合成技术实现对空调的控制。研究了语音控制的关键技术,包括语音技术的选取、语音识别的流程、BNF语法的编写、语音识别结果检测以及语音合成的流程等,设计了手机APP并对手机APP进行了测试,结果表明,在低噪音环境下语音识别准确率能够达到90%以上,在中等噪音环境下语音识别准确率能够达到80%以上,识别准确率较高。  相似文献   

6.
针对书房中书籍过多而引发的查阅书籍点位难、耗时长等问题,提出一种基于语音识别的智能书架,利用语音识别与匹配代替人工查找,并通过控制中心控制步进电机进行定位与推送,实现智能书架的设计。该智能书架由语音识别终端、STC89C52控制中心以及步进电机执行结构组成。实施现场主要由语音识别终端识别语音指令,并对控制中心传输识别结果,然后控制步进电机执行定位以及推出功能。应用结果表明,该书架在家庭、办公室等环境下进行语音识别查找书籍,具有较高的实时性和识别准确率,并且人机交互友好,解决了查阅书籍耗时长等问题。  相似文献   

7.
基于Matlab设计了以动态时间规整(dynamic time warping,DTW)算法和Mel频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)参数提取算法为基础的孤立词自动语音识别系统;然后结合机器人语音识别的需求,基于凌阳SPCE061A设计了语音识别应用系统。结合上述两部分工作,设计、实现了机器人语音识别系统演示实验和机器人语音识别半开放实验,实现效果达到预期实验设计目标。  相似文献   

8.
刘并竹 《考试周刊》2010,(4):237-238
语音识别技术是最近十年信息技术领域重要科技发展技术之一.现在的绝大多数家电都是采用单独的遥控器.各自通过独立的微处理芯片进行控制。智能家庭语音识别系统是一种集成的嵌入式系统,它是一种非接触识别技术.通过用户的声音控制家电的操作。本文作者通过对目前声音识别系统发展的了解与市场做菜辅助用具的调查,针对相关辅助用具在使用过程中所存在的一些问题.创造性地提出了采用智能声音识别技术的一款多功能厨具.而声控系统的应用使得该产品操作更方便。  相似文献   

9.
随着DSP和专用集成电路技术的发展,语音识别已具有非常高的识别率,特别是针对计算量较小、特定人、孤立词等方面。为此,利用SPCE061A单片机设计开发的一种针对特定人语音识别的灯具开关,既免去了手动开关灯具的麻烦,又实现了无线准确可靠地控制。  相似文献   

10.
HTK(是一套专门用于建立和处理删的语音处理工具箱,主要应用于语音识别领域,也可用于语音合成、字符识别、模拟DNA排序等多个领域.本文结合隐马尔可夫模型(HMM)原理,利用HTK(HMM ToolKit)语音处理工具箱,实现了汉语数码语音识别系统.实验表明,该系统具有较好的语音识别率,且便于进行二次开发.  相似文献   

11.
语音交互系统以“说话”的方式来使用计算机,实现真正意义上的人机对话。本详细阐述了语音交互界面的结构和主要实现技术,如语义框架集合,语音识别/合成功能的实现。  相似文献   

12.
基于二维情感空间的语音情感识别   总被引:1,自引:0,他引:1  
为提高语音情感的正确识别率,在利用反映"激发维"维度信息的韵律特征基础上,提出了采用反映"评价维"维度信息的音质特征作为新的情感特征使用。再将韵律特征参数和音质特征参数结合并用于语音情感识别,并采用支持向量机分类器实现对汉语生气、高兴、悲伤、厌烦和中性五类情感的识别。试验结果表明,基于"激发维"和"评价维"二维情感空间取得的情感总体平均正确识别率为84%,比基于"激发维"一维情感空间取得的识别率高出了12%。可见同时考虑从"激发维"和"评价维"二维情感空间进行语音情感识别,识别结果得到了较大改善。  相似文献   

13.
语音识别中的端点检测技术是语音识别的基础,低信噪比环境下的端点检测很大程度决定语音识别工作的有效进行.提出了一种利用一阶有限差分商结合折半查找来判定语音端点检测的方法,提高了端点检测的准确率.仿真实验表明,在噪声环境下该方法较好地实现了语音端点检测.  相似文献   

14.
黏着性语音的元辅音区别性特征对口语环境下的连续语音识别影响很大。通过维吾尔语和谐语音现象下的发音规律及其规则,采用语言学、实验语音学技术和数字语音信号处理等方法,研究和谐发音现象下的元音、辅音区别特征系统,建立扩展元辅音集,并以此为基础,开展基于扩展元辅音集的连续语音识别研究,进一步通过其声学模型比较研究,构建连续语音识别模型,为维吾尔语口语环境下的连续语音识别提供一种新方法。  相似文献   

15.
本系统主要是由51单片机、蓝牙无线模块、电机驱动模块、语音识别模块、显示模块组成的语音遥控小车.它的制作工艺简单且成本不高,语音识别功能相对稳定,而且无线通讯抗干扰能力强.它在识别到人体的语音信息时,把检测到的语音信号转换成电信号,并通过一系列的数据处理转换成简单的数据,然后传输到单片机,单片机通过蓝牙无线传输模块将数据传输给下位机,下位机按照收到的指令做出相应的反应.  相似文献   

16.
在VC++环境下,提取PLAR特征参数,基于听觉特性和语谱特性的语音增强器作为预处理器,对语音信号首先进行降噪处理,建立了基于DTW的抗噪声说话人识别系统.实验结果表明,即使在信噪比比较低的情况下,该系统都会在一定程度上提高多种噪声环境下说话人识别系统的识别性能.  相似文献   

17.
语音识别技术及应用   总被引:5,自引:0,他引:5  
语音识别技术近年来得到了飞速的发展并且在越来越多的领域得到了广泛的应用。隐马尔可夫模型(HMM)语音识别技术是一种基于训练数据提供的概率自动构造识别系统的技术,主要用于大量词汇的语音识别,而且具有良好的识别性能和抗噪性能。因此,一般的语音识别系统都采用基于HMM的识别方法作为其基本算法。本文列举了语音识别在教学中的应用示例来分析其基本算法。  相似文献   

18.
Speaker variability is an important source of speech variations which makes continuous speech recognition a difficult task. Adapting automatic speech recognition (ASR) models to the speaker variations is a well-known strategy to cope with the challenge, Almost all such techniques focus on developing adaptation solutions within the acoustic models of the ASR systems. Although variations of the acoustic features constitute an important portion of the inter-speaker variations, they do not cover variations at the phonetic level. Phonetic variations are known to form an important part of variations which are influenced by both micro-segmental and suprasegmental factors. Inter-speaker phonetic variations are influenced by the structure and anatomy of a speaker's articulatory system and also his/her speaking style which is driven by many speaker background characteristics such as accent, gender, age, socioeconomic and educational class. The effect of inter-speaker variations in the feature space may cause explicit phone recognition errors. These errors can be compensated later by having appropriate pronunciation variants for the lexicon entries which consider likely phone misclassifications besides pronunciation. In this paper, we introduce speaker adaptive dynamic pronunciation models, which generate different lexicons for various speaker clusters and different ranges of speech rate. The models are hybrids of speaker adapted contextual rules and dynamic generalized decision trees, which take into account word phonological structures, rate of speech, unigram probabilities and stress to generate pronunciation variants of words. Employing the set of speaker adapted dynamic lexicons in a Farsi (Persian) continuous speech recognition task results in word error rate reductions of as much as 10.1% in a speaker-dependent scenario and 7.4% in a speaker-independent scenario.  相似文献   

19.
基于韵律变换的情感说话人识别   总被引:1,自引:0,他引:1  
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号