讯飞输入法语音识别精准度(粤语识别率可达95)

讯飞输入法语音识别精准度(粤语识别率可达95)(1)

在台上,孩子们用粤语声情并茂朗诵一首小诗、一段文字,而讲台的一侧,大屏幕实时将粤语翻译成普通话,这让他们感到非常新鲜。

4月23日,是世界读书日,讯飞输入法与新华书店,在广州四阅书店共同打造了一个“方言保护计划公益联名店”,以粤语读书会的形式,邀请方言研究专家、粤语爱好者、讯飞粤语发音人,共同用声音传递粤语之美。

当天,讯飞输入法还发布了最新语音技术成果应用,实现方言翻译,解决粤语沟通障碍。

首创“输入法方言翻译”功能,1分钟可输入400字

在读书会现场,嘉宾用粤语朗诵经典文段,现场观众也能充分感受粤语的魅力。与此同时,朗诵文也被实时翻译显示在大屏幕上。

数据显示,目前全球粤语使用人数超过1亿。在广东,粤语不仅仅是简单的信息传递工具,也是很重要的情感根系,正所谓“冇粤语,唔广东”。

早在2012年讯飞输入法在行业首家推出“粤语语音输入”,有用户惊呼,“咁都识得出真系好劲”。经过不断的迭代,目前讯飞输入法的粤语识别准确率已经超过95%,粤语跟普通话一样也能1分钟输入400字。

在提高粤语用户输入效率的同时,面对九成以上粤语用户与非粤语用户沟通的强烈需求,讯飞输入法首创“输入法方言翻译”功能,支持粤语语音输入翻译成普通话文字,方便与不懂粤语或不认识粤语正字的人进行沟通。

这个技术背后,是怎么实现的呢?讯飞输入法业务副总经理程坤解释道,实现方言翻译需要克服特殊词汇多和数据量少两个技术难题。基于此,科大讯飞提出了基于多源知识融合的端到端翻译模型结构,并将迁移学习训练机制成功用于方言翻译任务,从而大大提高了粤语翻译成普通话的性能,进而应用于讯飞输入法产品,满足粤语用户清晰传递信息的需求。

支持23种方言输入,七种方言混合普通话免切换

方言背后,蕴藏着文化多样性的精髓。所以保护方言,尊重方言母语者的使用习惯,并保护以方言为载体的民间文化,已经势在必行。

根据讯飞输入法AI方言保护计划,以用AI为世界留下多彩乡音为目标,努力通过技术手段推进“语言复制”。截至目前,讯飞输入法已经支持23种方言语音输入,并加入方言“随心说”功能,即普通话模式下可直接使用东北话/天津话/河南话/河北话/山东话/皖北话/四川话七种方言与普通话的混合语音输入,免切换想说就说。

中国语保工程数据显示,中国现存的130多种语言中,48种使用人口在5000人以下, 25种不足千人。“语言复制”的概念是通过人工智能技术对一种语言实现完整记录,语音合成就是其中一个重要的组成模块,让机器可以开口说方言。目前科大讯飞已经实现了包括粤语、四川话、湖南话等11种方言的语音合成系统,并进行产品化应用,走到了推动方言保护的最前线。

关于方言保护计划的新思路以及语言资源保护的重要性,暨南大学文学院中文系教授、博士生导师、全国汉语方言学会副秘书长、常务理事甘于恩教授提出了“语言资源保护要多模态化”的观点,认为语言资源的保护传承,最重要的指标是语言活力的保持和语言能力的强化。2017年,讯飞输入法联合中国声谷发起的方言保护计划,通过“AI 公益”创新方言保护形式,引起大众对方言保护的关注,用智能语音技术加速推动方言留存。

【指引】

如何体验输入法方言翻译功能?具体来说,使用讯飞输入法Android新版在语音识别模式中选择【粤语】,进入粤语语音输入界面,点击左上【粤/普】选择翻译结果。在粤语文字输出模式下,语音输入展示粤语正字;开启粤语识别为普通话模式,语音输入翻译为普通话。

【记者】郜小平

【作者】 郜小平

【来源】 南方报业传媒集团南方 客户端

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页