AI最前线 篇十五:ElevenLabs:实现语言之间的即时语音转换
AI三大应用其中一个就是声音,今天我状态不错,再研究一个AI的声音应用。
ElevenLabs首页就有Live demo可以玩,中文挺别扭的
ElevenLabs是一家声音技术研究公司,为出版商和创作者开发最引人入胜的AI语音软件。它的目标是实现语言之间的即时语音转换,就是ASR和TTS的结合。它目前由Credo Ventures, Concept Ventures等投资机构和天使投资人支持。
讲故事,朗读博客新闻,加上有声读物,是需要专业的Audio服务
ElevenLabs的产品和服务包括:
- Prime Voice AI:这是一个先进的多用途AI语音工具,可以将任何文字转换为专业的语音,快速且质量高。它利用自主研发的深度学习模型,能够渲染出人类语调和情感,并根据上下文调整语音表达。它还可以让用户选择任何想要的声音和风格,无论是真实的还是合成的。一句话,就是提供已经训练好的模型。
当然是登录Google账号啊,声音公司的登录界面都“很生意”
- Projects:这是一个即将于2023年第一季度发布的语音导演和编辑工作站,可以让用户完全控制创作过程。从调整节奏和插入停顿,到为不同的片段分配不同的说话者,它都可以帮助用户实现自己的愿景。
- Voice Lab:这是一个创意AI工具包,可以让用户从样本或自己的声音中克隆声音,或者从零设计全新的合成声音。它的克隆模型可以根据一分钟的音频学习任何语音特征,无需训练。它的生成模型可以创建从未说过话的全新声音。
- AI dubbing:这是一个计划于今年晚些时候发布的工具,可以让用户自动地用不同的语言重新配音任何音频或视频,同时保留原始说话者的声音。它的最终目标是实现教育、流媒体、有声书、游戏、电影甚至实时对话等领域中对多语言音频支持的需求。
成长企业是330美元每个月,如果是Enterprise客户需要私聊
ElevenLabs的商业模式是基于订阅制度,根据用户使用的功能、时长和质量来收费。它还提供免费试用和优惠方案,以吸引更多的客户。
作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~