首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种改进后的递增式语音语料抽选算法
引用本文:宁振江,杜利民.一种改进后的递增式语音语料抽选算法[J].中国科学院研究生院学报,2005,22(2):140-146.
作者姓名:宁振江  杜利民
作者单位:中国科学院声学研究所语音交互技术研究实验室,北京,100080
基金项目:国家 973重点基础研究发展项目 (G19980 3 0 5 0 5 )资助
摘    要:提出一种改进后的递增式语料抽选方法 ,通过在递增的每个抽选阶段对所获语料进行二次筛选 ,加强对语料中语音单元的平衡控制能力 .该方法的实验佐证以 1 0年《人民日报》等报刊杂志为待选语料 ,共约 2 0 0 0万个句子 ,包括 8472个前后语境子音 .从这批待选语料中抽选获得的语料仅包括 1 7865个句子 ,但对出现次数超过 1 0的前后语境子音的覆盖率却达到了 94 3% ,语料中前后语境子音的分布方差为 0 1 8× 1 0 -3 .该方法除了在音子单元的覆盖率和分布均匀化方面的优异性能外 ,还具有较低的计算代价和存储代价 ,适宜于从报刊杂志、互联网等海量的真实语料中抽选语音识别声学模型的语料 .

关 键 词:语音识别  声学模型  语料抽选
文章编号:1002-1175(2005)02-0140-07
修稿时间:2004年4月12日

An Improved Incremental Approach to Speech Corpus Selection
NING Zhen-Jiang,Du Li-min.An Improved Incremental Approach to Speech Corpus Selection[J].Journal of the Graduate School of the Chinese Academy of Sciences,2005,22(2):140-146.
Authors:NING Zhen-Jiang  Du Li-min
Abstract:
Keywords:speech recognition  acoustic model  corpus selection
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号