估计很快就会有人考虑用这种技术来骗钱。以前完全没有这种技术的时候都有五花八门的钻空子方式,趁某人手机关机的时候打电话给父母骗钱这么简陋的方式都能成功。现在这种可能儿女直接打电话听起来就是本人声音的不是更防不胜防。技术的直接进步一定要尽快的普及教育出来,否则信息不对称就会带来无数的问题。
想要让声音“复活”,必须要借助语音合成技术。语音合成可以进行超大规模音库的制作,包括语料设计、音库录制、精细切分、韵律标注;同时进行规则统计,以此来针对不同发音人进行细致调整。这样合成出来的音频音质比较好,一般句子的自然度也不错。
合成人声究竟是靠音段拼接还是机器模拟:肯定是机器模型,说白了是数据生成。可以根据文本生成语音,也可以根据语音生成语音,本质上,跟用一张图像生成另外一张图像(如生成表情,卡通生成真实图像,真实图像生成卡通等等)没有重大区别。
这项技术应用的领域比我们想象的更多 ,例如应用于电视、电影、游戏等各领域的配音环节,大大地减少人力支出。还可应用于电子书阅读以及充当个人助理等各种私人服务,也就是说,王凯、靳东、胡歌这样的低音炮每天为你读诗将不是梦。
我觉得声音可以说是人类的一笔巨大精神财富,同影像、文字一样,声音所蕴含的内容同样可贵。所以我认为复原逝者声音这个话题其实应该受到更多的社会关注,首先它在心理医学领域绝对是有一席之地的。
但它给人类所带来的后果也是十分可怕,许多国家的司法系统就尤其看重这一点。不法分子可利用这项技术轻易操纵录音,从而破坏了录音作为证据的可信度,这对法律无疑也是一张挑战!





