一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS

国内有很多知名的文本转语音API平台,比如:百度文字转语音-AI智能识别技术、讯飞文字转语音等

功能类似,基本都是在线可以转换,效果接近真人发音,一键导出MP3…

最近一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS 开源了~

Parler TTS是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。

Parler TTS 特色说明:

  • 数据集:
    • 使用更多数据进行训练
    • 添加更多功能,例如重音
  • 训练:
    • 添加 PEFT 兼容性以进行 Lora 微调。
    • 添加在没有描述列的情况下进行训练的可能性。
    • 添加笔记本培训。
    • 探索多语言培训。
    • 探索单扬声器微调。
    • 探索更多架构。
  • 优化:
    • 编译和静态缓存
    • 支持 FA2 和 SDPA
  • 评估:
    • 添加更多评估指标

文本转语音 (TTS) 模型演示地址:

https://huggingface.co/spaces/parler-tts/parler_tts_mini

(可能需要翻墙访问~)

Parler TTS安装用法:

TTS 具有轻量级依赖关系,可以一键快速安装:

pip install git+https://github.com/huggingface/parler-tts.git

使用 Parler-TTS 就像“bonjour”一样简单。只需使用推理片段即可….

Parler-TTS是一个完全开源的发布版本,所有的数据集、预处理、训练代码和权重都以宽松的许可证公开发布,感兴趣的小伙伴们可以在线体验和研究….






文件名称:一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS

更新日期:2024-4-14

文件大小:73K

广

点击下载

本站采用署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)许可协议授权。
本站坚持“不能用的源码发出去都是浪费大家时间“,付费源码都是亲测的
源码已测试,但不保证完美无bug!站长是一位10年老技术,所有会员都可以免费咨询,在线指导提供运营建议!交个朋友~
洽单资源库仅提供学习的平台,所有资料均来自于网络,版权归原创者所有!本站不提供任何保证,并不承担任何法律责任,如果对您的版权或者利益造成损害,请提供相应的资质证明,请联系客服予以删除。

洽单资源库 » 一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS

常见问题FAQ

免费下载或者VIP会员专享资源能否直接商用?
本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
提示下载完但解压或打开不了?
最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
找不到素材资源介绍文章里的示例图片?
对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
洽单资源库
一个免费分享价值的学习平台

提供最优质的资源集合

立即查看 了解详情