VALL_E_X语音克隆带6款模型-整合版
<p><strong>VALL-E X</strong>可以通过仅使用未曾见过的说话者的3秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语/跨语言文本到语音功能。</p><p></p>
<p>上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。</p>
<p>模型将用您的音频提示相同的声音合成给定文本的语音。</p>
<p>该模型还倾向于保留您给定语音的情感和声学环境。</p>
<p>下载地址:<span style="color: #e03e2d;"><a style="color: #e03e2d;" href="https://www.123pan.com/s/b5viVv-jUA8d.html" target="_blank" rel="noopener">https://www.123pan.com/s/b5viVv-jUA8d.html</a></span></p>
页:
[1]