# SimpAI_Studio

**Repository Path**: windecay/SimpAI_Studio

## Basic Information

- **Project Name**: SimpAI_Studio
- **Description**: Web & Comfy
- **Primary Language**: Python
- **License**: GPL-3.0
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 0
- **Created**: 2026-06-12
- **Last Updated**: 2026-06-18

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# SimpAI Studio

SimpAI Studio 是面向本地创作的 AI 多媒体工作台。项目把面向普通用户的 SimpAI Studio WebUI、ComfyUI、Infinite Canvas 画布玩法和 Forge Neo WebUI后端整合于同一套工程里，覆盖图片生成、图像编辑、视频处理、音频/TTS、3D 姿态、模型管理和方便的更新工具。

- Wiki 入口：[SimpAI.cn](http://SimpAI.cn)
- 应用指南：[《SimpAI 创意生图集中营：应用指南全收录》](https://acnmokx5gwds.feishu.cn/wiki/QK3LwOp2oiRRaTkFRhYcO4LonGe)
- 用户交流：QQ 交流群 `1005085136`

## 项目定位

SimpAI Studio 的目标是纵深整合，从快速起步的“预置包式创作”到“节点式复杂编排”放在同一个本地环境里，一路探索，步步是惊喜：

- SimpAI Studio WebUI 内置了许多通过大量调试验证，无需过多调节即可生成高质量媒体的预置包，工作中一键快速补全，立即生成，使用社区热门Lora对专用场景优化、生成结果快速浏览和再度编辑。
- Infinite Canvas 负责预置包编排、批量任务、素材复用、模板库、时间线编辑素材、X/Y/Z 对比、VLM Agent辅助和复杂工作流展示，是你贴心的工作区域。
- ComfyUI 是细粒度、原子化的图像、视频、音频等任务的节点界面，复杂度高，支持用户自定义节点加入进行进阶探索。
- Forge Neo 迁移至 Gradio 6 前端风格，兼容原后端、SDAPI/ControlNet 兼容接口、扩展运行和独立界面。

## 能做什么

### SimpAI Studio (主 WebUI)

- 通过预置包快速使用 SDXL、Illustrious / NoobAI、Anima、Flux、Flux2-Klein、Qwen、Wan、LTX、Hunyuan Foley、Z-Image、Nvidia VSR 等热门模型，并不断新增迭代高价值项目。
- 支持文生图、图生图、重绘、扩图、变化、放大、局部增强、换脸、抠图、风格迁移、视频生成、视频编辑、音频驱动视频和 TTS。
- 提供 图像提示Image Prompt、Upscale / 放大与变化Variation、内外重绘Inpaint / Outpaint、增强修图Enhance+、反推提示词Describe Image、元数据Metadata、风格选择器Styles、Tags选择器、通配符助手Wildcards Helper等实用面板。
- 方便的图像浏览器、图片中转站、划像对比、预置包模型缺失提示和一键补全模型。
- 集成 SAM3 图像/视频遮罩、姿势编辑器Pose Studio、高斯泼溅角度编辑器Gaussian Studio、图层编辑器LayerForge、Qwen TTS、VLM/LLM 图片对话和提示词助手，支持LMStudio、Ollama等第三方API接入。

### SimpAI Infinite Canvas

- 在 WebUI 内打开节点画布，可将WebUI的固有预置包作为“超级节点”，辅以各种工具节点，方便快速组合常用工作流程。
- 模板库覆盖入门模板、可运行图片模板、Wan 视频模板、Qwen TTS 音频模板、Timeline 混剪模板和 Result 复用示例。
- 支持保存/读取画布项目、用户模板、运行队列、结果复用、素材浏览、Danbooru画廊、WD14标签器、在线双语翻译、VLM Chat聊天、Canvas Agent 和 X/Y/Z 对比。
- Batch Any 支持图片、文件和文本批次，适合多提示词、多素材、多参数对比批量任务。
- 画布Agent 内置Canvas Skill，根据素材和预置包知识辅助用户选择、编排工作流，还拥有专业的Prompt SKILL，分别对自然语言、Danbooru Tags类型提示词进行优化，生成符合用户意图的优秀提示词。

### Forge Neo

- `forge_neo/` 是从Gradio 4.40迁移到 Gradio 6.9 的 Forge 风格前端用户界面，运行独立于主 WebUI 的进程。
- 提供 `webui-forge-neo.py` 主入口，并实现 SDAPI、ControlNet、Extra Networks、Settings、Extensions、PNG Info、Extras、Checkpoint Merger 等接口和页面。
- 主动适配了 ControlNet、IPAdapter、MultiDiffusion、Regional Prompter、ADetailer-Neo、Qwen Vision Chat、SAM Matting、Trellis2、Tagcomplete 等扩展。
- 为喜欢A1111界面风格的用户提供了新的选择，与主WebUI共享模型目录，不需要另外部署一个Python环境。

### ComfyUI

- 从SimpAI Studio使用的comfyD后端进化而来，保留了所有功能和接口，并且专门优化了资源调度和性能。
- 集成了大量常用节点（多达140+），覆盖了图像、视频、音频等任务的大部分功能。
- 提供 ComfyUI 节点界面，负责图像、视频、音频等任务的实际执行基础。
- 支持自定义节点，用户可以根据需要添加新的节点类型，扩展工作流的功能。
- 提供丰富的内置工作流选项，支持一键跑通，与主WebUI共享模型目录。
- 为用户提供稳定的分享工作流平台，相同后端可复用性更高。

## 目录构成

| 路径                                       | 作用                                                                                     |
| ------------------------------------------ | ---------------------------------------------------------------------------------------- |
| `webui.py`                               | 主 WebUI 页面、FastAPI 路由、Gradio 6 事件链和前端入口。                                 |
| `enhanced/`                              | 顶栏、预置包增强、Gallery、SAM3、Pose/Gaussian/LayerForge 桥、VLM、Qwen TTS 等功能模块。 |
| `modules/`                               | 生成任务、配置、模型管理、Canvas 后端、VLM Agent、项目存取、X/Y/Z、时间线等核心逻辑。    |
| `javascript/`                            | 主 WebUI 前端、Infinite Canvas、模型浏览、TagCart、编辑器和状态同步脚本。                |
| `css/`                                   | Gradio 6 页面样式、画布样式、编辑器样式和局部控件修正。                                  |
| `presets/`                               | WebUI 预置包、场景预置、模型依赖、简介页和预占位素材。                                   |
| `workflows/`                             | ComfyUI API 工作流，主 WebUI 预置和场景任务会读取这里。                                  |
| `javascript/canvas_workbench/templates/` | Infinite Canvas 内置模板库。                                                             |
| `comfy/`                                 | 内置 ComfyUI 与自定义节点集合。                                                          |
| `forge_neo/`                             | Forge Neo Gradio 6 迁移代码、API、设置、扩展适配和许可说明。                             |
| `docs/`                                  | VLM 技能、检索用文档。                                                                   |
| `users/`                                 | 本地用户工作区、输出、配置和运行时素材目录。                                             |

## 预置包与模板

预置包是 SimpAI Studio 的主要使用入口。每个预置包描述模型、LoRA、采样参数、分辨率、工作流、输入槽、模型下载信息和简介页。

当前仓库里可以看到这些方向：

- 图片生成：`FooocusSDXL`、`Illustrious`、`Anima`、`Flux1-dev`、`Flux2-Klein`、`Z-imageT`。
- 图片编辑：`QwenEdit+`、`Imagerepair+`、`StyleTransfer+`、`Swap+`、`OneKeyKontext`、`OneKey-Outpaint`。
- 视角与姿态：`QwenMultiAngle`、`QwenGaussian`、`QwenPose`、`Flux2-KleinPose`。
- 视频：`Wan(T2V)`、`Wan(I2V)`、`Wan-Extent`、`Wan-Animate`、`Wan-Remover`、`Wan-Outpaint`、`Wan-SCAIL`、`Wan-TTP`、`LTX2.3`。
- 音频：`Qwen TTS` 画布节点、`Hunyuan-Foley`、`InfiniteTalk`、Timeline 配音混剪模板。
- 增强：`Nvidia-VSR`、`Removebg`、`Relight`、`Tile`、`Eraser`。

更多配置说明见 [presets/readme.md](presets/readme.md) 和 [javascript/canvas_workbench/templates/README.md](javascript/canvas_workbench/templates/README.md)。

常用入口：

- 一键部署用户：以 SimpAI 启动器4.0为准，根据指引创建文件夹，部署完毕选择 WebUI、ComfyUI 或 Forge Neo 相关入口。（Windows）
- Git 克隆安装：从仓库克隆代码，根据本地环境配置。

## 对比旧版

- 更好看的用户界面，更直观的操作流程，清理旧版残留的所有痛点。
- 更流畅的界面，更快的响应速度，更少的资源占用。
- 更好的模型支持，更丰富的玩法。
- 完全按本地化用户管理模式，不再依赖云服务。

## 鸣谢与引用

SimpAI Studio 站在许多开源项目和节点作者的工作之上。这里列出 README 中直接提到或本工程重点集成的项目；完整许可、作者信息和使用限制以各子目录的 `LICENSE` / `README` 以及上游仓库为准。

### 底座项目与模型生态

| 项目                                                                                                                                                 | 贡献                                                                                                   |
| ---------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------ |
| [Fooocus](https://github.com/lllyasviel/Fooocus)                                                                                                        | 早期易用生图体验、SDXL 工作流和部分图像处理思路来源。                                                  |
| [ComfyUI](https://github.com/Comfy-Org/ComfyUI)                                                                                                         | 节点式工作流执行基础和大量模型生态能力。                                                               |
| [sd-webui-forge-classic](https://github.com/Haoming02/sd-webui-forge-classic)                                                                           | Forge Neo 迁移参考项目；本仓库在 `html/forge_neo/NOTICE.md` 记录了 branch、commit 和 AGPL-3.0 说明。 |
| [AUTOMATIC1111 stable-diffusion-webui](https://github.com/AUTOMATIC1111/stable-diffusion-webui)                                                         | WebUI/SDAPI/脚本扩展生态的重要来源。                                                                   |
| [Stability AI Stable Diffusion](https://github.com/Stability-AI/stablediffusion) 与 [Generative Models](https://github.com/Stability-AI/generative-models) | SD1/SDXL 推理代码与模型生态。                                                                          |
| [Black Forest Labs Flux](https://github.com/black-forest-labs/flux) 与 [Flux2](https://github.com/black-forest-labs/flux2)                                 | Flux / Flux2-Klein 路线参考。                                                                          |
| [Qwen Image](https://github.com/QwenLM/Qwen-Image) 与 [Qwen3-TTS](https://github.com/QwenLM/Qwen3-TTS)                                                     | Qwen 图像编辑、视觉理解和 TTS 能力来源。                                                               |
| [Wan 2.2](https://github.com/Wan-Video/Wan2.2) 与 WanVideo 生态                                                                                         | 视频生成、视频编辑、动作迁移、视频扩图等路线来源。                                                     |
| [Hugging Face transformers](https://github.com/huggingface/transformers) 与 [diffusers](https://github.com/huggingface/diffusers)                          | 模型加载、推理组件和通用生态。                                                                         |
| [TAESD](https://github.com/madebyollin/taesd)                                                                                                           | 轻量实时预览编码器。                                                                                   |
| [InvokeAI](https://github.com/invoke-ai/InvokeAI) 与 [chaiNNer](https://github.com/chaiNNer-org/chaiNNer)                                                  | 部分兼容和图像处理参考。                                                                               |

### Forge / WebUI 扩展

| 扩展                                                                                         | 来源或鸣谢                                                                                                                                                                                                                                      |
| -------------------------------------------------------------------------------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| ControlNet / legacy preprocessors                                                            | [lllyasviel/ControlNet](https://github.com/lllyasviel/ControlNet)、相关 annotator 与 Forge 扩展生态。                                                                                                                                              |
| IPAdapter                                                                                    | [cubiq/ComfyUI_IPAdapter_plus](https://github.com/cubiq/ComfyUI_IPAdapter_plus) 以及 IP-Adapter 相关作者。                                                                                                                                         |
| MultiDiffusion / tiled diffusion                                                             | [pkuliyi2015/multidiffusion-upscaler-for-automatic1111](https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111)、[shiimizu/ComfyUI-TiledDiffusion](https://github.com/shiimizu/ComfyUI-TiledDiffusion)、Mixture of Diffusers 思路。 |
| Regional Prompter                                                                            | [hako-mikan/sd-webui-regional-prompter](https://github.com/hako-mikan/sd-webui-regional-prompter)。                                                                                                                                                |
| ADetailer-Neo、Tagcomplete、Qwen Vision Chat、SAM Matting、Trellis2、Storyboard Assistant 等 | 来自 WebUI/Forge 扩展社区，本仓库保留各扩展目录内说明和许可文件。                                                                                                                                                                               |

### ComfyUI 自定义节点

收集节点众多，以下为部分代表（若未罗列节点均受同等致谢）：

| 节点或节点家族                                                                                                                                                                                                                                                                   | 用途                                                                                           |
| -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------- |
| [ComfyUI-Manager](https://github.com/ltdrdata/ComfyUI-Manager)                                                                                                                                                                                                                      | 节点管理与生态入口。                                                                           |
| [ComfyUI-Easy-Use](https://github.com/yolain/ComfyUI-Easy-Use)                                                                                                                                                                                                                      | Easy 系列实用节点、加载器、XYPlot、Fooocus Inpaint 等能力。                                    |
| [ComfyUI-Danbooru-Gallery](https://github.com/Aaalice233/ComfyUI-Danbooru-Gallery)                                                                                                                                                                                                  | Danbooru Gallery、提示词编辑、素材浏览和中文用户工作流辅助。                                   |
| [Comfyui-LayerForge](https://github.com/Azornes/Comfyui-LayerForge)                                                                                                                                                                                                                 | 图层式画布编辑器，SimpAI WebUI 中的 LayerForge 能力参考。                                      |
| [ComfyUI_VNCCS_Utils](https://github.com/AHEKOT/ComfyUI_VNCCS)                                                                                                                                                                                                                      | Pose Studio、视觉相机控制、Qwen Detailer、模型管理等。                                         |
| [ComfyUI-WanVideoWrapper](https://github.com/kijai/ComfyUI-WanVideoWrapper)                                                                                                                                                                                                         | WanVideo 相关视频生成和编辑包装节点。                                                          |
| [ComfyUI-KJNodes](https://github.com/kijai/ComfyUI-KJNodes) 与 [ComfyUI-VideoHelperSuite](https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite)                                                                                                                                     | 视频、批处理、辅助节点和工作流工具。                                                           |
| [ComfyUI-GGUF](https://github.com/city96/ComfyUI-GGUF)                                                                                                                                                                                                                              | GGUF 模型加载与量化模型路线。                                                                  |
| [ComfyUI-Florence2](https://github.com/kijai/ComfyUI-Florence2)、[ComfyUI-WD14-Tagger](https://github.com/pythongosssss/ComfyUI-WD14-Tagger)、[ComfyUI-llama-cpp](https://github.com/lihaoyun6/ComfyUI-llama-cpp)                                                                         | 视觉理解、标签反推、LLM/VLM 本地推理。                                                         |
| [ComfyUI-Qwen-TTS](comfy/custom_nodes/ComfyUI-Qwen-TTS/README_CN.md)                                                                                                                                                                                                                | 基于[Qwen3-TTS](https://github.com/QwenLM/Qwen3-TTS) 的语音合成、音色设计、克隆和多角色对白节点。 |
| [ComfyUI-Easy-Sam3](comfy/custom_nodes/ComfyUI-Easy-Sam3/README_CN.md)                                                                                                                                                                                                              | 基于[SAM3](https://github.com/facebookresearch/sam3) 的图像/视频分割节点。                        |
| [ComfyUI-Impact-Pack](https://github.com/ltdrdata/ComfyUI-Impact-Pack)、[rgthree-comfy](https://github.com/rgthree/rgthree-comfy)、[comfyui_controlnet_aux](https://github.com/Fannovel16/comfyui_controlnet_aux)、[ComfyUI_IPAdapter_plus](https://github.com/cubiq/ComfyUI_IPAdapter_plus) | 检测、细化、ControlNet 预处理、图像参考和节点工作流增强。                                      |

## 许可

仓库根目录保留 GPL-3.0 许可文本。Forge Neo 迁移代码包含来自 `sd-webui-forge-classic` 的 AGPL-3.0 说明，详见 [html/forge_neo/NOTICE.md](html/forge_neo/NOTICE.md)。第三方节点、模型、扩展和权重文件可能有各自许可证或使用限制，分发和商用前请查看对应来源。

## 社区

- B 站 （个人主页）： [冰華子](https://space.bilibili.com/627080)
- QQ 交流群：`1005085136`

如果这个项目帮到了你，欢迎 Star、反馈问题、分享预置包和工作流。