最自然的ai配音(这个给人工智能配音的姑娘)


最自然的ai配音(这个给人工智能配音的姑娘)(1)

最自然的ai配音(这个给人工智能配音的姑娘)(2)

每天,都有数以千万计的人听到“她”的声音。


在地图导航里,在智能音箱里,在智能家居里,在手机助手里,在机器人里……


但很少有人知道“她”是谁。曾有人百度这个甜美声音背后的人是谁,没人回复,因为没人知道。


“她”,就是给小雅智能音箱配音的人——史苡凡(喜马拉雅ID: 眯着眼的凡小妞)。


除了小雅外,她还给宝马、美的、锤子、小米等品牌的智能产品配过音。


前不久,我们采访了史苡凡,听她讲述“人工智能声音背后的故事”。


以下是她的自述——


故事主人公、自述者:眯着眼的凡小妞


最自然的ai配音(这个给人工智能配音的姑娘)(3)

录着录着,就哭了


录音棚里面是冬天没暖气,夏天没空调。


我觉得最经典的就是夏天的时候,在录音棚里戴着耳机,空间又密闭,一点风都不透。


你知道吗?特别惨!工作人员就会在我旁边放一箱冰块,用于降温。热得我手里就捏一个冰块,继续录。


最自然的ai配音(这个给人工智能配音的姑娘)(4)

夏天的录音室


冬天穿着羽绒服抱着暖宝宝录,而且有一个很讨厌的要求:不能穿化纤的衣服,因为有摩擦。


稍微动一下,摩擦的声音很大,就会录到话筒里面。最好是穿纯棉的,但你想,羽绒服有可能是纯棉的吗?


羽绒服一摩擦就会有嗤嗤的声音。当有这个声音时,我就像木头人一样固定在那里。心里想:赶紧录吧,录完再说。


所以,我的各种奇葩姿势被工作人员拍下来。因为有时候真的是坐不住了,有跪着录的、躺着录的、趴着录、站着录的,就是怎么舒服怎么来。


最自然的ai配音(这个给人工智能配音的姑娘)(5)

冬天在录音室


录人工智能的语料,不像录广告什么的,几秒钟完事儿了。录的时间一长,又是一些很枯燥的文本,人会烦躁起来,所以有时候也有小情绪。


但我的声音人设又是一个拥有甜美声音的“邻家女孩”,我又不能有明显的情绪……所以有时录着录着,就录不下去了,越录越委屈,录哭的时候也有。


断断续续录了两年,加起来至少一百个小时以上。不过,我对录小雅的这段时光还是特别有感情的。


为什么录了两年?也不是因为工作量有多大,是因为我要上班,我都是中午时间,快马加鞭开着车去配音的。


我中午可能配两个小时,下了班再继续去,有时候配到晚上10点、11点,或者周末我可能从早晨9点配到凌晨才结束。


因为我周一到周五的本职工作时间是不能用的,我只能见缝插针地做。所以在不正常的时间里配了两年,录音师也跟着我加班加了两年。


之所以录那么多,是因为人的真声录得越多,合成的声音才会越自然、更有情感,不然就很机械。


比如说Siri什么的,它的声音就是很机械的,就因为录得语料少,录得多的话,它就会好一些。


而且,并不是简单的我录了就可以,或者是切音的人切了就可以,需要很多人,经过大量的工作,才能呈现一个完美的语音合成效果。


需要一个庞大团队来做这个事情,可能整个公司几百号人都在为你这个声音而努力。


所以参与这个,我觉得是特别特别荣幸的。



最自然的ai配音(这个给人工智能配音的姑娘)(6)

凡小妞与小雅智能音箱一个字,需要录多少遍?


宝马是我录的第一个人工智能品牌。


录了一个月的时间,天天就是“向左转”“向右转”“在下一个红绿灯左转”……就这样,很简单。


那次要求也不高,就觉得录人工智能好轻松,后来录小雅的时候才发现要求好严格。


已经选定我,但还没开始录的时候,工作人员给我放《她》这个电影,让我找那种很生活的感觉——有感情、甜美,虽然笑着说话,但还是理智的。


最自然的ai配音(这个给人工智能配音的姑娘)(7)

《她》是一部关于人与人工智能相爱的科幻电影。电影里,化身Samantha的人工智能拥有迷人的声线,声音甜美。


正式开始录的时候,监听师会让先录10个样音听一下。给我10句话,配半天,然后他们会现场合成来听,一听,会说:“今天这个状态不对,再找找。”


到后期就不用了,就很快。一两句样音往里一拼,觉得挺好就继续,于是越来越快。


但也有一些难的,比如,“hi,我是小雅”,这句话是小雅第一次出现和用户打招呼,需要营造一种第一次见面,略带客气,不失亲切,又稍微有点高冷,同时又有气质的感觉。


最自然的ai配音(这个给人工智能配音的姑娘)(8)


这个是有一些难度的,可能需要录几十次。


最难的就是你叫“小雅小雅”时,它的那句回答声“哎!”。只有一个字,但可能录了几百遍都没过。


这个产品还没有问世之前,监听师经常会让我去“哎”几次,看看哪个“哎”更好听,每次都要录到他们满意为止。回去又要推翻,下一次再重来。


录音结束以后,我的耳畔还是会不自觉响起我的那句“哎 哎 哎”……现在每次听到小雅的“哎”,我自己也觉得挺好听的。我就觉得没有白“哎”那么多。


而且还有骂人的语料,你要用一个很甜美的声音来骂一句脏话,或者是谁死了,或者是谁怎么样了,要很甜美地说出来,不能有过分的一些情感。


类似这样的语料:在那苍茫美丽马勒戈壁,有一群草泥马,它们活泼又聪明,它们调皮又灵敏……


遇到这种的时候就笑喷了,你还不能真的笑,还得一本正经。监听师看到我这个样子,早就笑得前仰后合了。


“阿姨,你是小雅吗?”


其实,小雅跟我的性格,还是反差很大的,我本人是一个挺凶悍的人。


别人会觉得给小雅配音的是一个没有结婚的小女孩、邻家妹妹,然后发现原来我已经是两个宝宝的妈妈了。


我老公也经常说:“你就是这个小雅,把大家给骗了。”


因为他同事很多都知道,我是小雅的发音人,然后他们问我老公:“你是怎么娶到声音这么好听的老婆,还这么漂亮?”


最自然的ai配音(这个给人工智能配音的姑娘)(9)

生活中的凡小妞


大家都觉得我声音特别好听,人肯定特温柔。他有苦说不出,感觉大家被这个小雅给“骗“了。


我周围大多数人知道我是小雅的发音人,但我也没有刻意宣传过,不经意间就被大家知道了。主要是产品比较火爆,尤其是像小雅这种平台比较好的,大家就很难不发现。


比如有人会说:“小雅声音感觉跟你特别像!”跟我关系好一些的,我就会忍不住告诉他,那就是我。


每当这时,他们就特别惊讶:“真的假的?!”然后慢慢就一传十,十传百,很多人就知道了。


我会发有关配音的朋友圈,同事之外的人会看到,儿子同学的妈妈们可能就发现了。有一个小同学就跑来跟我说:“阿姨,你是小雅吗?”


要么就在家里冲小雅喊:“小雅小雅,你认识兜兜吗?”兜兜是我儿子。然后小雅就回复他说“我帮不到你”这种类似的话。


那个小同学就很纳闷,就说:“你儿子你还不认识?”


包括现在的万达广场,他们的前台机器人,也是我配的。一些多年不见的朋友,突然发一个这个机器人的视频给我,问,“这是不是你?!”


我妈强烈要求在她家要放一个小雅,她说:“我不是为了自己听,我是为了来人的时候给他们显摆。”就觉得女儿还挺厉害的,谁来了她就给展示一下,她觉得还挺自豪的。


最自然的ai配音(这个给人工智能配音的姑娘)(10)

全家人都睡了,我才能录音


回头想想,之所以能当上小雅的发音人,也是因为一直以来,我的内心还是喜欢这一行的。


从小学开始,我就是我们那地方电视台的小主持人,大学学的是播音主持专业,还得过一个奖,全国推广普通话形象大使。毕业之后,在中央七台做过一段时间的外景主持人。


但是,现在的工作跟我配音的爱好,一点关系都没有,跟我所学的专业一点关系都没有。


没有做播音员主持人,觉得是自己人生的一个小小的遗憾,所以我在寻求一种既能平衡工作,又能平衡家庭,还能发展爱好的这么一个出路的时候,找到了配音这一个职业。


最自然的ai配音(这个给人工智能配音的姑娘)(11)


也是互联网崛起嘛,有喜马拉雅啊,配音秀啊,我就老玩,玩着玩着就觉得,我为什么不可以把它发展一下?


所以就报名参加了一个配音学习班,后来才有了配音、配人工智能这些事情。


对于小雅来说,现在要录的语料很少了。最近一次给小雅录音是国庆前,在家里完成的。我以前家里没有设备,后来我买了很高级的设备,给自己减轻一些跑腿量。


用这些设备也录了一些节目放在网上,一步一步就走到了现在,就是有点闲不住,但也真的把自己逼得太累了。


每天下了班先弄孩子,孩子睡了之后,不光孩子睡了觉,家里所有人都睡了觉,家里才能安静。这个时候,我才有时间去录东西。


比如说一期节目15分钟,我怎么也得空出一个多小时,前面要录,录完了剪好。剪的时候还得再听一遍再剪,然后再给到后期制作,有可能弄完就是晚上12点、1点了。


一星期有三个晚上,需要这一个小时的非常宝贵的时间。


现在,我有两个节目,一个是《时光小酒馆》,一个是《时光小酒馆-夜猫版》。一个2000多万点击量,一个8000多万点击量,加起来过亿了。我也实现了人生上亿的小目标~


我一直觉得这些东西都是幸运,从来没有觉得我的能力就一定比别人强,老天爷还是很眷顾我的。


- END -

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页