2.6 KiB
简介
竞赛介绍
语音识别(Automatic Speech Recognition)、说话人日志(Speaker Diarization)等语音处理技术的最新发展激发了众多智能语音的广泛应用。会议场景是语音技术应用中最有价值、同时也是最具挑战性的场景之一。因为这样的场景包含了丰富的讲话风格和复杂的声学条件,需要考虑到重叠语音、数量未知的说话人、大型会议室中的远场信号、噪音和混响等挑战。
为了推动会议场景语音识别的发展,已经有很多相关的挑战赛,如 Rich Transcription evaluation 和 CHIME(Computational Hearing in Multisource Environments) 挑战赛。然而不同语言之间的差异限制了非英语会议转录的进展。MISP(Multimodal Information Based Speech Processing)和M2MeT(Multi-Channel Multi-Party Meeting Transcription)挑战赛为推动普通话会议场景语音识别做出了贡献。MISP挑战赛侧重于用视听多模态的方法解决日常家庭环境中的远距离多麦克风信号处理问题,而M2MeT挑战则侧重于解决离线会议室中会议转录的语音重叠问题。
在上一届M2MET成功举办的基础上,我们将在ASRU2023上继续举办M2MET2.0挑战赛。在上一届M2MET挑战赛中,评估指标是说话人无关的,我们只能得到识别文本,而不能确定相应的说话人。 为了将现在的多说话人语音识别系统推向实用化,M2MET2.0挑战赛将在说话人相关的人物上评估,并且同时设立限定数据与不限定数据两个子赛道。 我们对数据集、规则、基线系统和评估方法进行了详细介绍,以进一步促进多说话人语音识别领域研究的发展。主办方将选择前三名论文并将其纳入ASRU2023论文集。
时间安排(AOE时间)
2023.5.5:参赛者注册截止2023.6.9:测试集数据发布2023.6.13:最终结果提交截止2023.6.19:评估结果和排名发布2023.7.3:论文提交截止2023.7.10:最终版论文提交截止
竞赛报名
来自学术界和工业界的有意向参赛者均应在2023年5月5日前向 m2met.alimeeting@gmail.com 发送邮件,按照以下要求注册参加挑战赛:
- 主题: [ICASSP2022 M2MeT2.0 Challenge Registration] – 团队名(英文或者拼音)- 参与的子赛道;
- 提供团队名称、隶属关系、参与的赛道、团队队长以及联系人信息(团队人数不限定);
主办方将在3个工作日内通过电子邮件通知符合条件的参赛团队,团队必须遵守将在挑战网站上发布的挑战规则。