Parler TTS:开源高质量文本转语音 (TTS) 模型

32次阅读
没有评论

Parler TTS 是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。它是根据 Dan Lyth 和 Simon King 在 Stability AI 和 Edinburgh University 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作进行的复现,与其他 TTS 模型不同,Parler-TTS 是一个完全开源的发布版本,所有的数据集、预处理、训练代码和权重都以宽松的许可证公开发布,感兴趣的同学可以在线体验。

开源地址:https://github.com/huggingface/parler-tts

正文完
 0
老马
版权声明:本站原创文章,由 老马 于2024-04-14发表,共计341字。
转载说明:本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络收集整理,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!侵删请致信E-mail:tntwl@qq.com
评论(没有评论)