一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS
国内有很多知名的文本转语音API平台,比如:百度文字转语音-AI智能识别技术、讯飞文字转语音等
功能类似,基本都是在线可以转换,效果接近真人发音,一键导出MP3…
最近一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS 开源了~
Parler TTS是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。
Parler TTS 特色说明:
- 数据集:
- 使用更多数据进行训练
- 添加更多功能,例如重音
- 训练:
- 添加 PEFT 兼容性以进行 Lora 微调。
- 添加在没有描述列的情况下进行训练的可能性。
- 添加笔记本培训。
- 探索多语言培训。
- 探索单扬声器微调。
- 探索更多架构。
- 优化:
- 编译和静态缓存
- 支持 FA2 和 SDPA
- 评估:
- 添加更多评估指标
文本转语音 (TTS) 模型演示地址:
https://huggingface.co/spaces/parler-tts/parler_tts_mini
(可能需要翻墙访问~)
Parler TTS安装用法:
TTS 具有轻量级依赖关系,可以一键快速安装:
pip install git+https://github.com/huggingface/parler-tts.git
使用 Parler-TTS 就像“bonjour”一样简单。只需使用推理片段即可….
Parler-TTS是一个完全开源的发布版本,所有的数据集、预处理、训练代码和权重都以宽松的许可证公开发布,感兴趣的小伙伴们可以在线体验和研究….
附
件
下
载
文件名称:一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS
更新日期:2024-4-14
文件大小:73K
提示:如遇问题或者链接失效请联系站长,欢迎捐赠本站以及广告合作!
本站采用署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)许可协议授权。
本站坚持“不能用的源码发出去都是浪费大家时间“,付费源码都是亲测的
源码已测试,但不保证完美无bug!站长是一位10年老技术,所有会员都可以免费咨询,在线指导提供运营建议!交个朋友~
洽单资源库仅提供学习的平台,所有资料均来自于网络,版权归原创者所有!本站不提供任何保证,并不承担任何法律责任,如果对您的版权或者利益造成损害,请提供相应的资质证明,请联系客服予以删除。
洽单资源库 » 一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS
常见问题FAQ
- 免费下载或者VIP会员专享资源能否直接商用?
- 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
- 提示下载完但解压或打开不了?
- 找不到素材资源介绍文章里的示例图片?
- 洽单资源库