【深度学习】【语音】TTS,Matcha-TTS,测试效果,训练中文,chinese
文章目录
- 环境
- 训练 🍵 Matcha‐TTS 使用不同的数据集和语言
- 使用不同数据集进行训练
- 关于音素化
- 使用较小的数据集(例如 20 分钟的数据集)是否可行?
- 纯推理的python代码
- synthesise函数推理过程分析
- 文本到发音ids
- 说话人
- 文本编码器
- 计算y_lengths和y_max_length
- 生成对齐图attn
- 对齐编码文本并获取mu_y
- 通过解码器生成样本
- 解码生成样本
- 初始化 `CFM` 模块
- `BASECFM` 类
- `CFM` 类
- 总结
- 实时因子
- RTF的意义
- synthesise函数返回
- 总结
- 未完待续
环境
ubuntu:
sudo apt-get install festival espeak-ng mbrola -y
创建环境(建议但可选)
conda create -n matcha-tts python=3.10 -y
conda activate matcha-tts
使用 pip 或源代码安装 Matcha TTS
pip install matcha-tts
来自源头
pip install git+https://github.com/shivammehta25/Matcha-TTS.git