基于医学影像的语音驱动舌位运动合成
张大伟; 杨明浩; 陶建华
2017-10
会议日期2017-10-11~13
会议地点中国连云港
关键词舌位运动合成 语音驱动 医学影像 组合深度神经网络
英文摘要发音器官运动可视化对人类发音机理研究、语言教学和病理语音分析等具有重要意义。本文提出一种文本无关的语音驱动舌位运动合成方法,基于医学影像和舌位轮廓自动提取方法,利用组合深度神经网络模型实现舌位运动的实时合成,并对舌位轮廓去噪、声学特征选取、映射模型结构等进行对比分析。实验表明,本文所提方法在有限带噪数据样本下能有效平衡过拟合与欠拟合问题,相比基线方法在准确率上有明显提升,甚至个别关键点预测结果优于自动提取的舌位轮廓边缘点。
内容类型会议论文
源URL[http://ir.ia.ac.cn/handle/173211/41005]  
专题模式识别国家重点实验室_智能交互
推荐引用方式
GB/T 7714
张大伟,杨明浩,陶建华. 基于医学影像的语音驱动舌位运动合成[C]. 见:. 中国连云港. 2017-10-11~13.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace