人工智能声音应用实例(AI算法在音频领域有巨大进化)

人工智能声音应用实例(AI算法在音频领域有巨大进化)(1)

声网Agora创始人、CEO赵斌

钛媒体App 11月3日消息,全球实时互动云服务商声网Agora(NASDAQ:API)主办的RTE2022第八届实时互联网大会正在线上举行。

相比往年,今年RTE大会更加聚焦实时互联网技术、人工智能(AI)降噪算法技术突破、安全合规和标准制定、实时互动生态以及“元宇宙”技术落地等。

RTE是“实时互动”的英文缩写,指用来解决在远程条件下沟通互动的双方能够实时性的真实、无缝还原线下互动的场景和信息传递体验的相关活动,涉及的典型场景包括音视频通话、直播、实时指令、互动工具、虚拟形象等。

声网Agora创始人、CEO赵斌(Tony Zhao)在演讲中表示,随着行业的发展,RTE概念与边界已逐步清晰化,更聚焦用户所需要的共享时空/场景,并能够达到或者超越线下场景的互动体验和效果。他还表示,最近一年,AI算法在音频领域产生了巨大进化,AI 降噪强力能够抑制超过100个突发噪声。

早在2015年,实时音视频技术的布道在国内还处于“三无”状态,即:无行业会议、无专业书籍、无专业媒体及社区。而刚成立不久的声网,就在那年就将海外WebRTC大会引入国内。2016年,声网举办实时互联网大会,并形成一年一会至今。

今年6月,声网发布2022年第二季度财报,季度营收4100万美元,比去年同期4230万美元下降3.2%,主要由于受到“双减”影响,季度净亏损为3070万美元。2022年上半年,声网总收入达7956.4万美元,接近8000万美元,低于2021年全年1.68亿美元收入的一半。声网称,公司预计2022财年总收入将在1.76亿美元至1.78亿美元(约合12.97亿元人民币)之间。

声网披露,自2015年诞生以来,RTE大会覆盖超200个行业场景,累计影响超过200万开发者。截至今年6月30日,声网全球注册应用数量超47.5万个,同比增长41%。

不过,受到“双减”等因素影响,声网部分业务有所调整,并正在寻找新的发展路径,其中包括通过合规标准占据市场主导和构建生态体系等。

10月下旬的媒体日上,声网首次披露,其与工信部直属的中国信息通信研究院建立实时互动联合实验室,并且过去一年还参与实时音视频、SDK安全、智能双录、儿童手表、智能电视等多项行业和应用相关的标准建设。

人工智能声音应用实例(AI算法在音频领域有巨大进化)(2)

实际上,当线上会议平台Zoom不再对中国客户提供付费视频会议服务后,中国正在加紧制定关于实时互动音视频体验的场景标准。

中国信通院泰尔终端实验室智能产品测评部主任张睿表示,场景标准将首先聚焦在成熟的视频会议和智能门铃门锁的创新场景上,这两个场景标准也得到了声网生态伙伴金山办公与乐鑫的支持。据张睿介绍,实时互动音视频体验通用标准4个系列标准将于11月正式发布。

对于“元宇宙”领域,赵斌表示,无论是虚拟形象还是其他玩法,“元宇宙”如果想在社交领域有大的发挥,玩法上还有更多需要突破的空间。因此,声网把“元宇宙”和API(应用程序接口)能力聚焦在了基础能力模块上,并以组合的方式来提供,从而方便合作伙伴灵活选用其中的组件,自行创造不同方式的组合和互动玩法。

赵斌此前接受钛媒体App采访时表示,声网希望做“元宇宙”技术服务商,只专注在实时音视频领域,帮助解决实际问题,使得他们更快打造相对应的场景。(详见钛媒体App前文:《声网Agora创始人赵斌:未来声网还将做“元宇宙”技术服务商》)

今年是声网RTE实时互联网大会的第8年。据悉,本届RTE大会还邀请了其投资方GGV纪源资本、五源资本等机构,以及思必驰等生态伙伴参与。(本文首发钛媒体App,作者|林志佳)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页