难以分辨的时代:techno speech & 名古屋工业大学 发布基于AI的虚拟歌手技术你的虚拟老婆快能唱歌了
Techno Speech会社和名古屋工业大学国际声音语言技术研究所共同研发了一种歌声合成技术,对比目前最流行的VOCALOID中的初音未来等虚拟歌手,新技术可以基于真人的唱歌习惯和风格来实现更精确的人声。目前官方提供了新技术试听,详情请点击Techno Speech页面。
Techno Speech会社与名古屋工业大学共同致力于语音合成和歌唱合成技术的研究与开发,为商用卡拉OK设备JOYSOUND与语音创作软件CeVIO Creative Studio投入新技术。在这项研究中只要选择特定歌手约2小时的歌声数据库,通过AI深度学习就能获得歌唱者的声音特征、唱歌的习惯和特点。合成时只需输入任何带有歌词的乐谱,即可合成高品质的歌声。
试听语言包括日语两首《Diamonds》《瞳》、英语两首《Rolling In The Deep》《Everytime》和中文《爱情转移》一首。官方提供了新技术(混合,清唱)和现行技术(清唱)的对比。通过简单试听,日文版已经接近了不预知难以分辨的程度;中文版也比较接近人声但有些气息不足的感觉;英文版本还需继续努力。