F5-TTS安装部署

F5-TTS安装部署

部署要求

  1. 硬件要求: 这个软件比较吃显卡。推荐使用 NVIDIA (英伟达) 的显卡,最好有 8GB 以上的显存。显卡越好,生成速度越快。如果你是 A 卡或者集成显卡,可能会很慢甚至跑不起来。
  2. 电脑系统: Windows, Mac, Linux 都可以。
  3. 网络: 安装过程需要下载不少东西,请确保你的网络连接稳定。
  4. (重点推荐) 安装小帮手 – Pinokio:
    对于咱们小白用户,我强烈推荐一个“神器”——Pinokio!它就像一个AI软件的“应用商店”,可以帮我们一键安装很多复杂的AI工具,自动处理那些烦人的环境配置问题。
    你需要先去 Pinokio 的官网 下载Pinokio
  5. 手动安装准备: Python, Git, Conda 。 如果你不想用 Pinokio,或者之后 Pinokio 安装失败了,也可以选择手动安装。但这需要你对 Python (需要 3.10 版本)、Git 和 命令行 有一定的了解。还需要自己配置 PyTorch 环境。

安装步骤

方法一:使用 Pinokio (小白首选)

  1. 打开 Pinokio: 安装好后,启动 Pinokio。第一次打开里面可能是空的。
  2. 发现 F5-TTS: 点击 "Discover" (发现) 按钮。在搜索框里输入 F5-TTS 或者 E2F5 TTS。
  3. 下载和安装: 找到 F5-TTS (可能会显示为 E2F5 TTS),点击它,然后点击 "Download" (下载),再点击 "Install" (安装)。
  4. 等待安装: 接下来,Pinokio 会自动帮你下载所有需要的东西,包括 F5-TTS 本身和它依赖的库。这个过程可能需要一些时间,取决于你的网络和电脑配置。
    中途可能会弹出一些提示框,比如问你是否要下载 CUDA (如果你的 N 卡需要),或者其他组件。通常,你只需要一直点 "Yes" 或 "OK" 或 "下一步" 就行了,让 Pinokio 帮你搞定一切!
  5. 启动 F5-TTS: 安装完成后,F5-TTS 会出现在 Pinokio 的主界面列表里。选中它,然后点击 "Launch" (启动)。
  6. 打开Web界面: 等待一小会儿 (可能一两分钟),Pinokio 窗口里会加载出 F5-TTS 的操作界面 (基于 Gradio)。为了方便操作,你可以点击界面右上角通常会有的“在新窗口/标签页中打开”的按钮,把它在你的浏览器里打开,界面更大更清晰!

方法二:手动安装

手动安装 (适合有经验或 Pinokio 无法使用的用户)

第 1 步:安装 “前置工具”

基本工具:

  1. Git: 这是用来从 GitHub 下载代码的工具。去 Git 官网 (git-scm.com) 下载安装。安装时一路点 "Next" 通常就可以了。

  2. Anaconda 或 Miniconda: 这是用来管理 Python 环境的工具,强烈推荐,它可以帮你创建一个干净独立的环境,避免和你电脑上其他 Python 程序冲突。去 Anaconda 官网 (anaconda.com) 下载安装 (Anaconda 包含很多科学计算包,比较大;Miniconda 更小巧,只包含基础功能,推荐后者)。安装过程同样一路 "Next",但注意勾选“Add Anaconda to my PATH environment variable”(添加到环境变量)的选项,虽然官方有时不推荐,但对新手来说可以简化后续操作(或者安装后手动添加)。
    验证安装: 打开你的命令行终端 (Windows 用户可以在搜索栏搜 cmd 或 PowerShell 或 Anaconda Prompt;Mac/Linux 用户打开 Terminal),分别输入 git –version 和 conda –version,如果能看到版本号输出,就说明安装成功了。

    安装git,Miniconda可以去这篇博客(megatts3安装步骤)有一键安装脚本

第2步:创建并激活 Python 环境

输入下面的命令,然后按回车:

    conda create -n f5-tts python=3.10 

解释: conda create 是创建环境,-n f5-tts 是给环境取个名字叫 f5-tts,python=3.10 是指定 Python 版本。
中途会问你是否继续 (Proceed [y]/n)? 输入 y 然后按回车。
激活环境: 环境创建好后,需要“走进”这个工作间才能开始干活。输入:

 conda activate f5-tts

解释: conda activate 就是激活(进入)指定名称的环境。成功后,你会看到命令行提示符前面多了个 (f5-tts) 的标记。之后的所有操作,都要确保你在这个 (f5-tts) 环境下进行!

第 3步:安装 PyTorch

打开 PyTorch 官网 (pytorch.org)。
在官网首页找到 "Get Started" 或 "Install" 部分。
仔细选择你的配置:PyTorch Build (Stable 稳定版)、Your OS (你的操作系统)、Package (选 Conda 或 Pip,推荐 Conda 因为我们用了 Conda 环境)、Language (Python)、Compute Platform ( 这里最关键! 如果是 NVIDIA 显卡,选择你对应的 CUDA 版本;如果是 AMD 显卡,选 ROCm;如果是 Mac 或只有 CPU,选 CPU)。
复制命令: 网站会自动生成适合你配置的安装命令。把它完整地复制下来。
回到你的 (f5-tts) 命令行环境,粘贴刚才复制的命令,然后按回车。
耐心等待: PyTorch 比较大,下载安装需要一些时间。同样,中途可能需要确认,输入 y 回车。

第 4 步:下载 F5-TTS 代码

把 F5-TTS 的源代码从 GitHub 上下载到你的电脑。在你想要存放项目的地方(比如 D 盘的 AI_Tools 文件夹),在命令行里先用 cd 命令切换到那个目录下 (例如 cd /d D:\AI_Tools),然后输入:

git clone https://github.com/SWivid/F5-TTS.git

git clone 就是下载代码,后面是代码仓库的地址。
下载完成后,你会看到当前目录下多了一个名为 F5-TTS 的文件夹。
使用 cd 命令进入刚刚下载的文件夹:

cd F5-TTS

cd 是 Change Directory (改变目录) 的缩写。

第 5 步:安装 F5-TTS 及其依赖

安装 F5-TTS这个包本身,以及它运行所需要的其他 Python 库。输入:

pip install -e .

这个过程会自动下载很多 F5-TTS 需要的小库,也需要一些时间。请确保你的网络连接稳定。
第 5 步:启动 Web UI

东西都装好之后,确保你仍然在 (f5-tts) 环境下,并且当前目录是 F5-TTS 文件夹内。在命令行输入:

f5-tts_infer-gradio

按回车后,程序会开始加载模型。稍等片刻,你会在命令行看到类似 Running on local URL: http://127.0.0.1:7860 的提示。

一键部署包

点击这里下载一键部署包

提取码3z0u

直接启动

一键部署包已经下载好了模型及官方的声音。直接使用即可。一键部署包启动过程:

一键部署包启动成功之后

megatts3安装步骤

Video: 零基础5分钟部署!MegatTS3本地安装全攻略

环境准备:

  1. 操作系统: 推荐使用 Linux 或 Windows
  2. Git: 这是个代码版本管理工具,我们需要用它从 GitHub 下载 MegaTTS 3 的代码。点击这里下载安装
  3. Anaconda/Miniconda: 这是一个 Python 环境管理工具。AI 项目经常需要特定版本的 Python 和库,用 Conda 可以创建独立的环境,避免和你电脑上其他 Python 程序冲突。点击这里下载安装
  4. Python 版本: 注意!官方 Readme 指定需要 Python 3.10 版本 。后面我们会用 Conda 来创建这个特定版本的环境。点击这里下载安装
  5. (可选) NVIDIA 显卡 & CUDA: 如果你有 N 卡,并且想用 GPU 加速,需要确保安装了合适的显卡驱动和 CUDA 工具包。但这不是必须的,CPU 用户跳过即可!
  6. 魔法上网

第一步:下载代码。点击这里下载安装。

git clone https://github.com/bytedance/MegaTTS3

下载完成后:

cd MegaTTS3

第二步:创建并激活 Conda 环境。

conda create -n megatts3-env python=3.10

创建好后,激活这个环境:

conda activate megatts3-env

(注意看命令行前面的环境名变化) "看到命令行前面出现了 (megatts3-env) 就表示成功进入环境了!"
1

第三步:安装依赖库。

(针对 Windows 用户特别说明),安装前需要先手动打开 requirements.txt 文件,找到 WeTextProcessing==1.0.4.1 这一行,在前面加个 # 号把它注释掉**,保存文件。然后再执行下面的 pip 安装命令。

pip install -r requirements.txt`

如果中途遇到红色报错,可能是网络问题或者特定库安装失败,可以尝试更换国内 pip 镜像源再试一次。

  • (针对 Windows 用户补充)Windows 用户在 pip 安装完后,还需要额外执行这两条命令:
    conda install -y -c conda-forge pynini==2.1.5
    conda install -y WeTextProcessing==1.0.3
    
  • 如果遇到 ffprobe 或 ffmpeg 相关的错误,可以尝试
    conda install -c conda-forge ffmpeg
    

第四步:设置 PYTHONPATH (非常重要!)。

  • Linux/Mac 用户:

    export PYTHONPATH="/path/to/MegaTTS3:$PYTHONPATH
    

    /path/to/MegaTTS3 替换成你实际存放 MegaTTS3 文件夹的完整路径!不知道路径?在 MegaTTS3 文件夹里打开终端,输入 pwd 就能看到。

  • Windows 用户 (CMD):

    set PYTHONPATH="C:\path\to\MegaTTS3;%PYTHONPATH%"
    

    C:\path\to\MegaTTS3 替换成你实际存放 MegaTTS3 文件夹的完整路径!比如 D:\AI_Tools\MegaTTS3。路径里不要有中文

  • Windows 用户 (PowerShell):

    $env:PYTHONPATH="C:\path\to\MegaTTS3;$env:PYTHONPATH"
    

第五步:下载预训练模型。

huggingface-cli download bytedance/MegaTTS3 --local-dir ./checkpoints --repo-type model

"模型文件不大,应该很快就能下好。"

第六步:(可选) 指定 GPU。如果你有 N 卡并且想用 GPU 跑,执行:"

  • Linux/Mac:
    export CUDA_VISIBLE_DEVICES=0
    
  • Windows:
    • CMD
      set CUDA_VISIBLE_DEVICES=0
      
    • powershell
      $env:CUDA_VISIBLE_DEVICES=0
      

如果只想用 CPU,就不要执行这一步!CPU很慢,我本地5s的声音要差不多5分钟才能生成,不同cpu时间不一样。

第七步:启动MegaTTS3

python -m tts.gradio_api

启动成功后在浏览器访问http://127.0.0.1:7929/
2

5
报错解决方法

pip uninstall torch torchvision torchaudio

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

一键部署包

点击这里下载一键部署包

提取码:z7f3

直接启动
3
一键部署包已经下载好了模型及官方的声音。直接使用即可。一键部署包启动过程:
4
一键部署包启动成功之后跟部署包效果一样。

© 2025 pappyAI的博客

Theme by Anders NorenUp ↑