FaceFusion使用教程(配置要求) – 资讯及公告 – 星宇智算

FaceFusion对于硬件配置要求相对较高,为了满足数据处理运行下面也要推荐一个基础配置给大家,想要节省一些时间也可以在我们网站上直接免费试用。

一、FaceFusion 简介

FaceFusion 是一款开源 AI 人脸融合工具，支持高清视频 / 图片换脸、表情控制与唇形同步，兼容 Windows、Linux、macOS 系统，可通过 GPU 加速实现高效换脸，适配不同硬件环境，是 AI 视觉爱好者的实用工具。其核心优势在于操作简洁、模型自动下载、支持自定义素材，同时提供 WebUI 与命令行两种操作方式，兼顾新手与进阶用户需求。

二、配置要求(分基础 / 推荐 / 4K 级别)

(一)基础配置(满足基本运行)

操作系统：Windows 10/11 64 位、Ubuntu 20.04+、macOS 12+(用户名需英文，避免路径冲突);

GPU：NVIDIA 显卡(显存≥6GB)或 AMD RX 6000 系列;

内存：≥8GB;

存储：机械硬盘(预留足够临时文件空间);

软件依赖：Python 3.9-3.11、FFmpeg、Git;

加速组件：仅支持 CPU 模式，处理速度较慢。

(二)推荐配置(平衡速度与稳定性)

操作系统：与基础配置一致，需确保用户名无中文;

GPU：RTX 3060 12GB、RTX 4070 等 NVIDIA 显卡(显存≥12GB);

内存：≥16GB;

存储：SSD(预留≥50GB 临时空间，提升文件读写速度);

软件依赖：Python 3.9-3.11、FFmpeg、Git，额外安装 CUDA 12.4 + 与 cuDNN 8.9.x(NVIDIA 专属);

加速组件：NVIDIA 用户启用 CUDA 加速，AMD 用户启用 DirectML 加速，大幅提升处理效率。

星宇智算官网支持免费部署立马安装！点击下方立即试用!

(三)4K 级别配置(处理高清素材)

操作系统：与基础配置一致;

GPU：RTX 4080、RTX 5070 等高端 NVIDIA 显卡(显存≥20GB);

内存：≥32GB;

存储：NVMe SSD(高速读写，适配 4K 素材处理需求);

软件依赖：基于推荐配置，将 CUDA 升级至 12.5 版本，确保兼容性;

加速组件：启用 CUDA+TensorRT 双重加速，优化 4K 视频处理流程，减少卡顿。

三、详细配置与使用教程

(一)环境准备

安装核心依赖

python -m venv facefusion-env

# Windows系统激活虚拟环境

facefusion-env\Scripts\activate

# Linux/macOS系统激活虚拟环境

source facefusion-env/bin/activate

Python 环境：安装 Python 3.9-3.11 版本(避免 3.12 + 及 3.8 以下版本引发依赖冲突)，通过 venv 创建独立虚拟环境：

FFmpeg 安装：Windows 用户需下载 FFmpeg 二进制包，解压后将其安装目录添加到系统 PATH 环境变量;macOS 用户通过brew install ffmpeg命令安装;Linux 用户执行sudo apt install ffmpeg安装。安装完成后，终端输入ffmpeg -version，若显示版本信息则说明安装成功。

GPU 加速配置(NVIDIA)：先安装 CUDA 12.4 + 与 cuDNN 8.9.x，按官方指南配置环境变量，确保系统能识别 CUDA。之后在虚拟环境中安装onnxruntime-gpu==1.16.3.进一步提升 GPU 推理速度。

克隆项目与安装依赖

执行以下命令克隆 FaceFusion 项目仓库，并安装所需依赖包：

git clone https://github.com/facefusion/facefusion.git

cd facefusion

pip install -r requirements.txt

# NVIDIA用户额外安装GPU加速依赖

pip install onnxruntime-gpu==1.16.3

# AMD用户额外安装DirectML加速依赖

pip install onnxruntime-directml

(二)启动与基础配置

启动 WebUI：在激活的虚拟环境中，执行python run.py命令启动程序。默认占用 7860 端口，启动成功后，打开浏览器访问http://localhost:7860.即可进入 FaceFusion 可视化操作界面。

基础参数设置

素材上传：分别上传 “源人脸图片” 和 “目标视频 / 图片”，源图建议选择清晰、正面、无遮挡的人脸照，目标素材分辨率推荐 1080p(平衡处理速度与画质);

执行提供者：根据显卡型号选择，NVIDIA 显卡选 “CUDA”，AMD 显卡选 “DirectML”，支持 TensorRT 的显卡可勾选该选项(需确保模型适配);

视频内存策略：16GB 显存建议选择 “strict”，32GB 及以上显存可选择 “tolerant”，合理分配显存资源;

临时帧格式：优先选择 PNG(保证帧画面质量)，若显存紧张可切换为 JPEG(建议质量设为 70)。

(三)换脸实操流程

素材预处理：使用视频编辑工具裁剪目标视频，保留需要换脸的片段，避免冗余内容增加处理时间;若目标图片 / 视频清晰度较低，可先通过画质增强工具优化。

人脸检测与对齐：WebUI 会自动完成人脸检测与对齐操作，若检测效果不佳，可在 “Face Detection” 设置中调整置信度阈值(建议范围 0.6-0.8)，提高人脸匹配精度。

换脸与后处理：在模型选择列表中挑选合适的模型(如 inswapper_128.onnx，兼顾速度与效果);启用 GFPGAN 或 CodeFormer 工具，可修复换脸后的面部模糊、纹理异常等问题;最后设置输出格式(MP4 用于视频、PNG 用于图片序列)与质量参数。

生成输出：点击界面中的 “Start” 按钮开始处理，处理进度会实时显示。完成后，结果文件会自动保存到项目根目录的output文件夹中，若对效果不满意，可调整参数后重新生成。

四、常见问题 FAQ

启动报错 “系统用户名含中文”?

原因：中文路径会导致依赖包加载失败，是 FaceFusion 常见运行障碍。解决方案：创建用户名纯英文的系统账户，切换账户后重新配置环境;或使用虚拟机、Docker 容器运行程序，避免中文路径影响。

提示 “CUDA out of memory”?

原因：显存不足，无法支撑当前配置的处理任务。解决方案：关闭 GFPGAN、CodeFormer 等后处理工具，减少显存占用;将输出分辨率降低至 720p;在视频内存策略中选择 “strict”，严格控制显存使用;对于长视频，可分割为每批≤100 帧的片段分批处理。

FFmpeg 未找到 / 无法处理视频?

原因：FFmpeg 未安装成功，或未添加到系统 PATH 环境变量。解决方案：重新安装 FFmpeg，按系统类型正确配置环境变量;重启电脑确保配置生效，终端输入ffmpeg -version验证是否能正常识别;确保 FFmpeg 安装路径无中文或特殊字符。

换脸后画面模糊 / 有残影?

原因：源图清晰度不足、人脸对齐精度低，或模型适配性差。解决方案：更换高清、正面的源人脸图片;调整人脸检测置信度至 0.7-0.8.提升对齐精度;更换 inswapper_128.onnx 等高精度模型，或启用后处理工具优化画质。

CUDA 加载失败，回退到 CPU 模式?

原因：CUDA 与 cuDNN 版本不匹配、显卡驱动过时，或onnxruntime-gpu安装异常。解决方案：确认 CUDA 12.4 + 与 cuDNN 8.9.x 版本兼容;更新显卡驱动至最新版本;卸载现有onnxruntime-gpu，重新安装onnxruntime-gpu==1.16.3.确保与 CUDA 版本适配。

模型下载缓慢或失败?

原因：国外服务器网络波动，导致模型文件下载受阻。解决方案：改用国内镜像站点(如hf-mirror.com)手动下载模型;将下载后的模型文件按要求放入models文件夹对应子目录(可参考项目文档的路径说明);也可通过可靠网盘获取模型文件，解压后放置到指定位置。

换脸后音频不同步?

原因：视频处理过程中音频编码异常，或帧处理速度不一致。解决方案：在 WebUI 中勾选 “Copy Audio” 选项，确保音频直接复制到输出文件;设置音频编码器为 “aac”，提升兼容性;若仍不同步，可先用 FFmpeg 分离目标视频的音频，换脸完成后再将音频与视频重新合成。

macOS 无法启用 GPU 加速?

原因：默认依赖包不支持苹果芯片 GPU 加速。解决方案：苹果 Silicon(M1/M2/M3)用户需卸载默认onnxruntime，执行pip install onnxruntime-silicon安装专属版本，启用 Core ML 加速功能，大幅提升处理速度。