LlamaFactory

LlamaFactory

AI训练

AI应用

应用大小：50 GB
适用资源：4090 24G | 5090 32G
主系统：Ubuntu 24.04
应用环境：Docker v570.86.10 | CUDA v12.8 | Conda v25.11.1 | Docker v29.1.3 | Python v3.13.11 | JupyterLab v4.5.0 | FileBrower v2.52.0 | LogViewer v1.0

应用介绍：

让大模型微调变得像“工厂组装”一样简单

免费启动应用

说明文档

LlamaFactory

LlamaFactory 是一个功能强大且极易上手的全栈式大模型微调平台。它将复杂的训练代码封装成了直观的图形化界面和简洁的指令，打破了人工智能训练的技术门槛。无论你是想打造一个行业专家，还是想让 AI 具备独特的说话风格，这个“工厂”都能提供从数据处理、模型训练到一键部署的全流程支持。

核心优势

“零代码”训练体验：内置了名为 LlamaBoard 的网页操作面板，你只需要通过鼠标点击和拖拽，就能完成模型选择、数据导入和参数设置，完全无需编写复杂的 Python 代码。
极广泛的模型适配：支持包括 LLaMA 系列、通义千问（Qwen）、DeepSeek、Mistral 以及各种多模态模型在内的上百种开源基座。这意味着你可以在同一个平台上，实验当前市面上几乎所有主流的 AI 模型。
极低的算力门槛：集成了最先进的显存优化技术（如 LoRA 和 QLoRA）。它能让一张普通的家用游戏显卡也具备微调百亿参数大模型的能力，让昂贵的服务器不再是唯一的选择。
全能的训练模态：不仅支持纯文字的逻辑对谈训练，还支持图像理解、视频分类甚至音频处理的多模态训练。它是真正意义上的“多模态微调工作站”。

功能亮点

全流程自动化工作流：从初始的预训练、指令微调（SFT），到更高级的人类反馈强化学习（RLHF）和 DPO 偏好优化，所有的训练环节都能在一个框架内无缝衔接。
可视化数据监控：集成多种实验监控工具，你可以在训练过程中实时看到 AI 学习进度的“心电图”（损失曲线），随时掌握模型是否学得扎实。
一键模型导出与合并：微调完成后，你可以直接将训练出的“补丁”与原模型合并，导出为标准的格式，方便直接在其他应用中调用。
内置 OpenAI 风格 API：训练好的模型可以一键开启在线服务，提供与 OpenAI 完全兼容的接口，让你的下游应用能够无缝切换到你自创的私有模型上。

适用群体

企业应用开发者：快速训练出适配自家业务逻辑、具备专业领域知识的垂直行业大模型。
AI 研究人员与学生：作为高效的实验平台，快速验证不同的微调策略和数据集效果，节省底层环境搭建时间。
独立开发者与创作者：利用有限的硬件资源，打造具有个人特色或特定角色扮演能力的个性化 AI。
数字化转型团队：在保证数据隐私的前提下，在本地环境中构建和部署私有的智能知识库系统。

联系我们