您好,欢迎来到济南中科泛在智能计算研究院官网!

综合新闻

重磅|我院院长陈益强团队参与研发的“手语播报数字人”正式“上岗”,助力听障人士感受冬奥魅力!

时间:2022-02-10 17:33:26

根据全国第二次残疾人抽样调查数据,中国有超过2700万名残疾性听力障碍人士,他们也期待及时了解北京冬奥会的比赛资讯。北京2022年冬奥会和冬残奥会首次在中国举办,我国广大听障人群也期待着深入了解比赛资讯,全面感受这场精彩卓越的奥运盛会。

2月9日,由北京市委宣传部、北京市科委、中关村管委会等单位组织的“科技冬奥企业行”大型主题采访活动第四站启动,来自市科委、中关村管委会、清华大学、中科院计算所、北京广播电视台、凌云光、智谱AI的领导专家以及来自24家媒体单位的记者参与了此次活动。活动第四站采访了科技冬奥专项“冬奥手语播报数字人”。


 


近日,采用超大规模智能信息模型和虚拟数字人技术,为听障人士打造的“冬奥手语播报数字人”正式亮相北京卫视,为观众带来冬奥期间赛事新闻的专业手语翻译播报。

“冬奥手语播报数字人”由北京市科委、中关村管委会支持,智谱AI、凌云光和北京广播电视台联合打造,清华大学贾珈教授团队和中科院计算所陈益强研究员团队参与了相关关键技术的研究和开发,项目还得到了北京市残疾人联合会和市残联聋人协会的帮助和支持。这一系统以超大规模预训练模型为核心技术,自主搭建多模态肢体动作、表情、手指同步采集系统,运用跨模态拟人生成算法、超高精度写实数字人等行业领先技术,实现冬奥期间赛事新闻的专业手语翻译播报。

“学识”渊博:语料储备更丰富

随着2018年《国家通用手语常用词表》和《国家通用盲文方案》作为语言文字规范正式发布,为了推广和普及国家通用手语,“冬奥手语播报数字人”系统完成了《国家通用手语词典》收录的8214条通用手语的采集和录制,并且语法都以听障群体习惯打法为准,以确保手语播报成果的准确性和专业度,更好地服务听障人群。

由于当前国内缺少较完善的手语语料数据,研发人员在北京市残联及其聋人协会的支持下,邀请超过40余位聋人老师及手语专家进行手语文本转写和技术指导,并进行大范围的听障群体评测,最终构建了符合国家通用手语规范的国内最大规模多模态手语语料库,词汇及语句总规模超10万。


1.jpg

媒体群访环节

 

❊精准翻译:播报方式更智能

陈益强表示:与传统的语音AI播报相比,冬奥手语播报数字人的最大区别是表意的准确性和表达的可懂度。传统的语音播报的技术特点主要集中在对语音的理解上;而面对听障人士,手语播报还需要用具有韵律感的手势、丰富甚至有些夸张的表情来提升播报的可懂度。两者追求的方向是不一样的,是不同的技术路线。前者主要是语音与视觉之间的转换,后者不仅要“听得懂”更要“做得对”,背后的技术细节更复杂。从1999年开始中科院计算所就开始研发手语虚拟人合成系统,通过虚拟人的手语识别与合成技术,帮助听力障碍者进行交流。国家通用手语虚拟人合成系统在2021年第四届中国·济南新动能国际高层次人才创新创业大赛上海赛区成功获奖。


2.jpg

中科院计算所所务委员、泛在中心主任兼济南中科泛在智能计算研究院院长陈益强接受媒体采访


为构建能理解、翻译语音和手语的智能数字大脑,冬奥手语播报数字人系统以超大规模预训练模型为核心技术,通过语义蒸馏及手语翻译快编模型,将新闻播报语音蒸馏成语义高度接近的手语文字,并翻译成符合手语习惯的语序。最终,手语数字脑可以通过计算机模仿听障人士的大脑,进行手语播报驱动。

此外,为实现高精度、高自然度的人物形象和手语动作姿态,研发团队还自主搭建了多模态肢体动作、表情、手指同步采集系统。通过肌肉绑定技术驱动实现面部采集,结合业内领先的语音识别及高清视频合成等技术,呈现给听障人群亲切自然的冬奥手语播报服务。


3.jpg 

媒体参观

❊便利生活:应用场景更广泛

目前,冬奥手语播报数字人正在北京卫视《北京您早》节目中对“冬奥赛事集锦”和“一起看冬奥”进行手语播报,手语信息播报服务降低了冬奥节目的运营成本,也便捷了听障人士收看赛事报道的途径。

未来,手语播报数字人有望在机场、车站、银行等公共场所落地,方便听障人士生活。此外,手语播报数字人的应用还将助力国家通用手语推广,推动国家通用手语标准普及,为残疾人平等参与社会生活创造无障碍环境,让科技更有温度。