环境准备:
- 操作系统: 推荐使用 Linux 或 Windows
- Git: 这是个代码版本管理工具,我们需要用它从 GitHub 下载 MegaTTS 3 的代码。点击这里下载安装。
- Anaconda/Miniconda: 这是一个 Python 环境管理工具。AI 项目经常需要特定版本的 Python 和库,用 Conda 可以创建独立的环境,避免和你电脑上其他 Python 程序冲突。点击这里下载安装。
- Python 版本: 注意!官方 Readme 指定需要 Python 3.10 版本 。后面我们会用 Conda 来创建这个特定版本的环境。点击这里下载安装
- (可选) NVIDIA 显卡 & CUDA: 如果你有 N 卡,并且想用 GPU 加速,需要确保安装了合适的显卡驱动和 CUDA 工具包。但这不是必须的,CPU 用户跳过即可!
- 魔法上网
第一步:下载代码。点击这里下载安装。
git clone https://github.com/bytedance/MegaTTS3
下载完成后:
cd MegaTTS3
第二步:创建并激活 Conda 环境。
conda create -n megatts3-env python=3.10
创建好后,激活这个环境:
conda activate megatts3-env
(注意看命令行前面的环境名变化) "看到命令行前面出现了 (megatts3-env)
就表示成功进入环境了!"
第三步:安装依赖库。
(针对 Windows 用户特别说明),安装前需要先手动打开 requirements.txt
文件,找到 WeTextProcessing==1.0.4.1
这一行,在前面加个 #
号把它注释掉**,保存文件。然后再执行下面的 pip 安装命令。
pip install -r requirements.txt`
如果中途遇到红色报错,可能是网络问题或者特定库安装失败,可以尝试更换国内 pip 镜像源再试一次。
- (针对 Windows 用户补充)Windows 用户在 pip 安装完后,还需要额外执行这两条命令:
conda install -y -c conda-forge pynini==2.1.5 conda install -y WeTextProcessing==1.0.3
- 如果遇到 ffprobe 或 ffmpeg 相关的错误,可以尝试
conda install -c conda-forge ffmpeg
第四步:设置 PYTHONPATH (非常重要!)。
-
Linux/Mac 用户:
export PYTHONPATH="/path/to/MegaTTS3:$PYTHONPATH
把
/path/to/MegaTTS3
替换成你实际存放 MegaTTS3 文件夹的完整路径!不知道路径?在 MegaTTS3 文件夹里打开终端,输入pwd
就能看到。 -
Windows 用户 (CMD):
set PYTHONPATH="C:\path\to\MegaTTS3;%PYTHONPATH%"
把
C:\path\to\MegaTTS3
替换成你实际存放 MegaTTS3 文件夹的完整路径!比如D:\AI_Tools\MegaTTS3
。路径里不要有中文! -
Windows 用户 (PowerShell):
$env:PYTHONPATH="C:\path\to\MegaTTS3;$env:PYTHONPATH"
第五步:下载预训练模型。
huggingface-cli download bytedance/MegaTTS3 --local-dir ./checkpoints --repo-type model
"模型文件不大,应该很快就能下好。"
第六步:(可选) 指定 GPU。如果你有 N 卡并且想用 GPU 跑,执行:"
- Linux/Mac:
export CUDA_VISIBLE_DEVICES=0
- Windows:
- CMD
set CUDA_VISIBLE_DEVICES=0
- powershell
$env:CUDA_VISIBLE_DEVICES=0
- CMD
如果只想用 CPU,就不要执行这一步!CPU很慢,我本地5s的声音要差不多5分钟才能生成,不同cpu时间不一样。
第七步:启动MegaTTS3
python -m tts.gradio_api
启动成功后在浏览器访问http://127.0.0.1:7929/
报错解决方法
pip uninstall torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
一键部署包
提取码:z7f3
直接启动
一键部署包已经下载好了模型及官方的声音。直接使用即可。一键部署包启动过程:
一键部署包启动成功之后跟部署包效果一样。
发表评论