ai的声音由何而来(AI声似真人我们该怎么办)

作者:王向坤

最近,短视频平台上出现了高度模仿真人声音的场景视频片段,这样的视频往往以某一段非常有名的角色带入,开始还是角色的本来说话内容,可是,接下来内容变了,原来的角色竟然说起了与新的场景相吻合的话语,没有听过的,肯定先是一愣,诧异于TA怎么会这么说?不过,很快就明白了,这是人为的改变,具体说就是,借助了AI技术,让角色说出了不同于原场景的话语。关键问题是,这个语音与角色的原来语音整体一样,语调、语速等几乎与原声相同,这才是人们关注、思考的重点。至于UP主让TA说什么,完全是为了配合新场景、新表达的需要。

站在技术的角度,这个东西非常不一般。

曾几何时,有人为了制作视频,拍摄、剪辑都不是问题,问题在于配音不好解决。一般人说话,带有很强的口语化,如果不是经过特别的播音训练,录制的声音效果很一般,所以说,早期的配音,都是去找专业的播音员。

后来,随着技术的进步,电脑合成声音慢慢普及,但是,也仅限于有限的几种,且生成的声音较为机械,与真人发声相差较大,就是现在的短视频中仍然可以感受到这个效果。时间长了,人们就习惯了,不太较真,但是,对于重要的配音,仍要选择专业人员。

这要说,随着技术进步,电脑声音会越来越流利、流畅,人们信,但是,这个电脑声音还要由标准化变为个性化,这就有点匪夷所思。

可是,对于AI来说,没有什么不可能,研究人员终究还是克服了真人个性化发音的问题,这仿佛是打开了潘多拉魔盒,让有些场景,让人们的认知,开始变得不确定。

自从有了电脑存储,声音、图像成了记录特定时间、场合内容的工具和形式,里面包含着我们所需要的资料,甚至可以作为证据。

但是现在,由于AI对于声音的改变,让我们不得不重新审视现在及未来的内容和规则,究竟还能不能相信,能不能作为证据,又如何进行鉴别?都是问题。

说到声音,我们就不得不再进一步说说视频,尤其是AR技术对于视频内容和形式的改变,这个代入感很强,只要代入的实体和视频现场采集的场景高度吻合,就会造成真假难辨。短视频,作为娱乐的属性很强,几乎没有人去想其他的事情,人们更多的是去欣赏和沉浸。由于技术的普及,普通人亲自试一试都不是问题。

随着元宇宙概念的提出,AI、AR技术成为了构成基础,我们真人不可能有足够的时间亲自下场元宇宙场景,那么我们本人的代表在元宇宙里,不止需要AR沉浸,还需要AI代表本人发声,它们越接近,效果越好。

不难看出,AI、AR对于声音、视频的改变有着特定的现实需求,不是单纯的出于娱乐性质。那又如何管控呢?我们可以把这些都归为产品的范畴,作为产品,作为视听产品,必须具备清楚的标记,让人们很容易的识别它的出处,从而不至于造成混淆,给其他环节带来困惑,这个是必要的。

ai的声音由何而来(AI声似真人我们该怎么办)(1)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页