发音逆推现状及进展

发布日期: 2024-05-31 浏览次数:
题目:发音逆推现状及进展
主讲人:方强
时间:2024-06-06 09:30 至 2024-06-06 11:30
地点:主南215
主办单位:信息科学学院
讲座内容:

内容简介:发音逆推现状及进展

发音逆推是一种从语音声学信号估计声道形状或发音器官位置的技术,在可控语音合成、健壮语音识别、发音教学等领域有重要的应用前景。从上世纪70年代起,就有研究人员开展发音逆推方面的工作。随着时代的发展,主流的技术经过基于码本的技术、到基于统计学习的技术、到基于深度神经网络的技术,发音逆推的性能也得到大幅提高。人们关注的问题逐渐从原来的发音相关扩展到发音人无关,从单一语言扩展到跨语言,从标准语音扩展到带口音的语音等等。本报告将回顾发音逆推研究的历史、近些年的进展,并展望发音逆推将来的发展方向。


主讲人介绍

方强,中国社会科学院语言研究所副研究员。2001年、2004年、2009年分别毕业于南京理工大学、中国社会科学院研究生院、和日本北陆先端科学技术大学院大学。2004年加入中国社会科学院语言研究所,主要从事实验语音学、发音生理建模、发音逆推等方面的研究,在IEEE VRICASSPInterspeech等重要会议发表论文多篇,担任JASASpeech Communication、中国语文、当代语言学、语言学论丛等期刊的审稿人。研究兴趣包含深度学习、语音识别、语音合成、发音逆推、病理语音分析等方面。