排序方式: 共有14条查询结果,搜索用时 27 毫秒
1.
以DSP实现基于概率DP匹配算法的说话人识别系统 总被引:1,自引:0,他引:1
提出了利用概率DP匹配算法进行说话人识别的的设想。并给出了运用TMS320C5416实现说话人自动识别系统的方案。该系统利用一种新的语音信号r阶的倒谱线性回归系数等参数构成识别的特征矢量集,运用提出的概率DP匹配算法进行与文本无关的说话人识别。实验结果表明该系统具有识别精度高、识别速度快,占用系统资源少等特点,是一种有效的说话人自动识别的实现方法。 相似文献
2.
首先提出了最优形状子空间概念,它由主要形状子空间和主要形状变化子空间联合构成,最大程度上包含了搜索形状上的变化,更贴近现实中要搜索的目标.然后,在仔细研究了经典算法中的搜索过程后,通过引入代价函数和反馈机制,提出了一种最优搜索的概念,使在搜索过程中搜索、评价、反馈不断地进行,最后得到最佳的搜索结果.实验表明:提出的最优形状子空间在保证主要形状的基础上给出了最大限度的形状变化,最优搜索过程可保证搜索到局部的惟一最优形状.它们的综合大大改善了动态形状模型的性能,并提高了搜索的精确性. 相似文献
3.
4.
5.
基于韵律变换的情感说话人识别 总被引:1,自引:0,他引:1
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音. 相似文献
6.
为了达到减少比特数同时保持画面质量的目的,提出了一种基于最小可视失真(JND)和自回归(AR)模型的感知视频编码方法.首先,设计了基于JND的纹理分割算法,建立了空时JND模型,以MB为基本单元,通过计算其JND能量并与阈值做比较,用以分割出视频序列中的纹理区域.然后,开发了AR模型来合成纹理区,在使用最小二乘法计算出AR模型的参数后,用相邻的前后参考帧对应像素的线性插值来生成重构像素.最后,为了检验所提方法的效果,将其与H.264/AVC视频编码系统做比较,用不同的视频序列实验来验证所提方法的有效性.实验结果显示,对于具有不同纹理特点的实验序列,所提方法可以在保持感知质量的同时将比特率减少15%~58%. 相似文献
7.
在基于强度调制、直接检测的多输入多输出无线光通信系统中,为了保证发射信号非负特性,提出一种基于直流偏置的自适应调制技术,并且利用奇异值分解将多输入多输出信道转换为并行信道。此外,提出一种基于 QR 分解、逐次干扰消除的自适应调制技术。在目标误比特率性能条件下,利用 QR 分解、逐次干扰消除的特性将多输入多输出信道等效为并行信道。根据最大化可达速率的优化目标,最优地给各个子信道分配功率。仿真结果表明所提出的2种自适应调制方法在保证误比特率性能和平均发射光功率恒定的前提下,有效地提高了系统的传输速率。这2种自适应调制技术在利用多输入多输出技术空分复用增益的同时,进一步提高了无线光通信系统的频谱利用率。 相似文献
8.
为了改善广义旁瓣抵消(GSC)语音增强方法的性能,提出了一种带有泄漏约束的判决反馈旁瓣抵消(LCDF-GSC)方法.采用DF-GSC方法以解决GSC对波达方向敏感的问题,在代价函数中引入泄漏因子,以此改善语音失真的问题,而这种问题是由于噪声参考信号中含有语音成份造成的.试验结果表明,尽管经过LCDF-GSC处理后的语音信号信噪比要略低于DF-GSC,IS测度表明这时前者的语音信号失真度要小于后者.MOS分也表明LCDF-GSC方法要优于DF-GSC和单通道Weiner滤波算法. 相似文献
9.
10.