语音技术圈顶会之一INTERSPEECH 2020,以“Cognitive Intelligence for Speech Processing”为主题,即将登陆上海。2020口音英语语音识别技术研讨会暨挑战赛(以下简称2020AESRC)作为本年度INTERSPEECH的旗舰技术活动,计划于2020年10月25日在中国上海同步举行。
竞赛背景
英语作为最具影响力的全球性交流语言之一,与其相关的英语语音识别系统也在学术界和工业界受到广泛关注。 当前阶段,标准英语ASR系统已经能够获得较高的识别正确率,满足一定场景的商用要求,但是口音英语识别仍然是具有挑战性的课题,商用系统往往通过大量的口音标注数据覆盖来缓解口音带来的识别性能影响。
口音语音识别面临着口音本身的不一致性、语速与音素发音的多变性带来的建模难题。另外,带有口音标注的语音数据的短缺也严重限制了相关研究的开展。
Interspeech 2020口音英语语音识别挑战赛 (Interspeech2020 Accented English Speech Recognition, AESR) 向参赛者开放了来自不同国家的共八种口音英语数据,覆盖了各种发音特点、口音轻重,旨在加强英语语种识别、口音语音识别的研究交流。期待来自学术界与工业界的学术研究者能够相互切磋,有所收获。
赛道介绍
赛道1:口音种类识别
使用官方提供的各种口音英语的训练数据,训练语种分类模型。提交测试集合上的语种识别结果。
赛道2:口音英语语音识别
使用规则限定的训练数据,训练语音识别模型。提交测试集合上的语音识别结果文本。测试集合中会出现训练集外的口音以验证模型泛化性能。
指定数据
数据堂向参赛者提供8个国家(俄罗斯、韩国、美国、葡萄牙、日本、印度、英国、中国)的口音英语数据,每个国家20小时,总量160小时。
训练数据将与按如下格式组织的metadata同时开放。
两个赛道中允许使用Librispeech数据 http://www.openslr.org/12/
奖项设置
参赛日程
2020年8月20日 参赛报名截止
2020年8月21日 组委会提供训练数据
2020年9月22日 组委会提供测试集
2020年9月24日 参赛团队提交测试结果
2020年9月30日 组委会公布评测结果
2020年10月9日 参赛团队提交方案介绍
2020年10月25日 获奖团队颁奖
竞赛指导委员会竞
联合主办单位
中国计算机协会语音对话与听觉专业组
西北工业大学音频语音与语言处理研究组
上海交通大学智能语音实验室
新加坡南洋理工大学计算机科学与工程学院
美国约翰霍普金斯大学语言与语音处理中心
西安高新产业技术开发区软件园发展中心
陕西鲲鹏生态创新中心
数据堂(北京)科技股份有限公司
大赛面向语音技术爱好者,高等院校、科研单位、企业、创客团队等人员均可报名参赛,每位选手只能加入1支队伍。