语音合成 (TTS)
安装所需的依赖并在 conf.yaml 进行配置后后,通过修改 conf.yaml 中的 TTS_MODEL 选项来启用相应的语音合成引擎。
sherpa-onnx(本地 & 推荐)
自
v0.5.0-alpha.1版本起可用(PR#50)
sherpa-onnx 是一个强大的推理引擎,支持多种 TTS 模型(包括 MeloTTS)。项目已内置支持,默认使用 CPU 推理。
配置步骤:
- 从 sherpa-onnx TTS models 下载所需模型
- 参考
config_alts中的配置示例修改conf.yaml
提示
如需使用 GPU 推理(仅支持 CUDA),请参考 CUDA推理。
Piper TTS(本地 & 轻量快速)
Piper 是一个快速、本地化的神经网络文本转语音系统,支持多种语言和声音。使用预训练的 ONNX 模型,可在 CPU 上实现实时语音合成。