Deprecated: Creation of dynamic property db::$querynum is deprecated in /www/wwwroot/xrzulin.com/inc/func.php on line 1413

Deprecated: Creation of dynamic property db::$database is deprecated in /www/wwwroot/xrzulin.com/inc/func.php on line 1414

Deprecated: Creation of dynamic property db::$Stmt is deprecated in /www/wwwroot/xrzulin.com/inc/func.php on line 1453

Deprecated: Creation of dynamic property db::$Sql is deprecated in /www/wwwroot/xrzulin.com/inc/func.php on line 1454
NCMMSC-CNVSRC 2024视觉语音辨认比赛满意闭幕_乐鱼官网登录入口手机版-成人英语_乐鱼官网登录_乐鱼官网登录入口手机版_乐鱼游戏

核心课程

联系我们

名   称:乐鱼官网登录

电 话:15254285253

邮 箱:2213001773@qq.com

网   址:www.xrzulin.com

地 址:胶州宝龙广场16栋5楼

NCMMSC-CNVSRC 2024视觉语音辨认比赛满意闭幕

发布日期:2024-11-21 作者:乐鱼官网登录入口手机版-成人英语

  8月16日上午,NCMMSC-CNVSRC 2024 学术研讨会在乌鲁木齐举办的第十九届全国人机语音通讯学术会议(NCMMSC 2024)上举办。会上发布了本次视觉语音辨认比赛 CNVSRC 2024 的终究成果,并重办了颁奖仪式。

  本次比赛由 NCMMSC 2024 组委会建议,清华大学、北京邮电大学、海天瑞声和语音之家联合主办。比赛旨在查验当时视觉语音辨认(或称唇语辨认)技能在中文大词表接连辨认场景下的体现。

  本次比赛招引了45支海内外部队参赛,历经近三个月的比赛,西北工业大学、内蒙古大学、武汉大学等部队体现杰出,独占鳌头。

  本次研讨会由清华大学王东教授掌管。海天瑞声CMO王潇蔓女士和语音之家创始人兼CEO卜辉先生为获奖团队颁奖。北京邮电大学刘泽华同学共享了基线体系与技能陈述,三支优异参赛部队代表还受邀共享了他们的技能计划和赛事经历。

  视觉语音辨认,也称唇语辨认,是一项经过口唇动作来揣度发音内容的技能。该技能在公共安全、助老助残、视频验真等范畴具有极端严重使用。当时,唇语辨认的研讨方兴未已,虽然在独立词、短语等辨认上取得了长足发展,但在大词表接连辨认方面仍面对巨大应战。特别是关于中文而言,因为缺少相应的数据资源,该范畴的研讨发展受到了约束。为此,清华大学在2023年发布了 CN-CVS 数据集[1],成为首个大规模的中文视觉语音辨认数据库,为逐渐推进大词表接连视觉语音辨认 (LVCVSR) 供给了或许,并于同年举办了 CNVSRC 2023 比赛[2],推进了唇语辨认在中文范畴的发展。

  为了逐渐推进这一研讨方向,清华大学联合北京邮电大学、海天瑞声和语音之家在 NCMMSC 2024 持续举办了中文接连视觉语音辨认应战赛 (Chinese Continuous Visual Speech Recognition Challenge 2024, CNVSRC 2024)。本次比赛中,许多参赛部队在唇语辨认使命上完成了体系功能的显着提高,其间最佳成果相较于基线%。此外,与 CNVSRC 2023 比较,2024年各赛道的成果均有显着前进。各支参赛部队提出了许多立异计划,为中文大词表接连视觉语音辨认研讨供给了新的思路和办法。

乐鱼官网登录

微信公众号

乐鱼官网登录

 联系我们