# SimpAI_Studio **Repository Path**: windecay/SimpAI_Studio ## Basic Information - **Project Name**: SimpAI_Studio - **Description**: Web & Comfy - **Primary Language**: Python - **License**: GPL-3.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2026-06-12 - **Last Updated**: 2026-06-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # SimpAI Studio SimpAI Studio 是面向本地创作的 AI 多媒体工作台。项目把面向普通用户的 SimpAI Studio WebUI、ComfyUI、Infinite Canvas 画布玩法和 Forge Neo WebUI后端整合于同一套工程里,覆盖图片生成、图像编辑、视频处理、音频/TTS、3D 姿态、模型管理和方便的更新工具。 - Wiki 入口:[SimpAI.cn](http://SimpAI.cn) - 应用指南:[《SimpAI 创意生图集中营:应用指南全收录》](https://acnmokx5gwds.feishu.cn/wiki/QK3LwOp2oiRRaTkFRhYcO4LonGe) - 用户交流:QQ 交流群 `1005085136` ## 项目定位 SimpAI Studio 的目标是纵深整合,从快速起步的“预置包式创作”到“节点式复杂编排”放在同一个本地环境里,一路探索,步步是惊喜: - SimpAI Studio WebUI 内置了许多通过大量调试验证,无需过多调节即可生成高质量媒体的预置包,工作中一键快速补全,立即生成,使用社区热门Lora对专用场景优化、生成结果快速浏览和再度编辑。 - Infinite Canvas 负责预置包编排、批量任务、素材复用、模板库、时间线编辑素材、X/Y/Z 对比、VLM Agent辅助和复杂工作流展示,是你贴心的工作区域。 - ComfyUI 是细粒度、原子化的图像、视频、音频等任务的节点界面,复杂度高,支持用户自定义节点加入进行进阶探索。 - Forge Neo 迁移至 Gradio 6 前端风格,兼容原后端、SDAPI/ControlNet 兼容接口、扩展运行和独立界面。 ## 能做什么 ### SimpAI Studio (主 WebUI) - 通过预置包快速使用 SDXL、Illustrious / NoobAI、Anima、Flux、Flux2-Klein、Qwen、Wan、LTX、Hunyuan Foley、Z-Image、Nvidia VSR 等热门模型,并不断新增迭代高价值项目。 - 支持文生图、图生图、重绘、扩图、变化、放大、局部增强、换脸、抠图、风格迁移、视频生成、视频编辑、音频驱动视频和 TTS。 - 提供 图像提示Image Prompt、Upscale / 放大与变化Variation、内外重绘Inpaint / Outpaint、增强修图Enhance+、反推提示词Describe Image、元数据Metadata、风格选择器Styles、Tags选择器、通配符助手Wildcards Helper等实用面板。 - 方便的图像浏览器、图片中转站、划像对比、预置包模型缺失提示和一键补全模型。 - 集成 SAM3 图像/视频遮罩、姿势编辑器Pose Studio、高斯泼溅角度编辑器Gaussian Studio、图层编辑器LayerForge、Qwen TTS、VLM/LLM 图片对话和提示词助手,支持LMStudio、Ollama等第三方API接入。 ### SimpAI Infinite Canvas - 在 WebUI 内打开节点画布,可将WebUI的固有预置包作为“超级节点”,辅以各种工具节点,方便快速组合常用工作流程。 - 模板库覆盖入门模板、可运行图片模板、Wan 视频模板、Qwen TTS 音频模板、Timeline 混剪模板和 Result 复用示例。 - 支持保存/读取画布项目、用户模板、运行队列、结果复用、素材浏览、Danbooru画廊、WD14标签器、在线双语翻译、VLM Chat聊天、Canvas Agent 和 X/Y/Z 对比。 - Batch Any 支持图片、文件和文本批次,适合多提示词、多素材、多参数对比批量任务。 - 画布Agent 内置Canvas Skill,根据素材和预置包知识辅助用户选择、编排工作流,还拥有专业的Prompt SKILL,分别对自然语言、Danbooru Tags类型提示词进行优化,生成符合用户意图的优秀提示词。 ### Forge Neo - `forge_neo/` 是从Gradio 4.40迁移到 Gradio 6.9 的 Forge 风格前端用户界面,运行独立于主 WebUI 的进程。 - 提供 `webui-forge-neo.py` 主入口,并实现 SDAPI、ControlNet、Extra Networks、Settings、Extensions、PNG Info、Extras、Checkpoint Merger 等接口和页面。 - 主动适配了 ControlNet、IPAdapter、MultiDiffusion、Regional Prompter、ADetailer-Neo、Qwen Vision Chat、SAM Matting、Trellis2、Tagcomplete 等扩展。 - 为喜欢A1111界面风格的用户提供了新的选择,与主WebUI共享模型目录,不需要另外部署一个Python环境。 ### ComfyUI - 从SimpAI Studio使用的comfyD后端进化而来,保留了所有功能和接口,并且专门优化了资源调度和性能。 - 集成了大量常用节点(多达140+),覆盖了图像、视频、音频等任务的大部分功能。 - 提供 ComfyUI 节点界面,负责图像、视频、音频等任务的实际执行基础。 - 支持自定义节点,用户可以根据需要添加新的节点类型,扩展工作流的功能。 - 提供丰富的内置工作流选项,支持一键跑通,与主WebUI共享模型目录。 - 为用户提供稳定的分享工作流平台,相同后端可复用性更高。 ## 目录构成 | 路径 | 作用 | | ------------------------------------------ | ---------------------------------------------------------------------------------------- | | `webui.py` | 主 WebUI 页面、FastAPI 路由、Gradio 6 事件链和前端入口。 | | `enhanced/` | 顶栏、预置包增强、Gallery、SAM3、Pose/Gaussian/LayerForge 桥、VLM、Qwen TTS 等功能模块。 | | `modules/` | 生成任务、配置、模型管理、Canvas 后端、VLM Agent、项目存取、X/Y/Z、时间线等核心逻辑。 | | `javascript/` | 主 WebUI 前端、Infinite Canvas、模型浏览、TagCart、编辑器和状态同步脚本。 | | `css/` | Gradio 6 页面样式、画布样式、编辑器样式和局部控件修正。 | | `presets/` | WebUI 预置包、场景预置、模型依赖、简介页和预占位素材。 | | `workflows/` | ComfyUI API 工作流,主 WebUI 预置和场景任务会读取这里。 | | `javascript/canvas_workbench/templates/` | Infinite Canvas 内置模板库。 | | `comfy/` | 内置 ComfyUI 与自定义节点集合。 | | `forge_neo/` | Forge Neo Gradio 6 迁移代码、API、设置、扩展适配和许可说明。 | | `docs/` | VLM 技能、检索用文档。 | | `users/` | 本地用户工作区、输出、配置和运行时素材目录。 | ## 预置包与模板 预置包是 SimpAI Studio 的主要使用入口。每个预置包描述模型、LoRA、采样参数、分辨率、工作流、输入槽、模型下载信息和简介页。 当前仓库里可以看到这些方向: - 图片生成:`FooocusSDXL`、`Illustrious`、`Anima`、`Flux1-dev`、`Flux2-Klein`、`Z-imageT`。 - 图片编辑:`QwenEdit+`、`Imagerepair+`、`StyleTransfer+`、`Swap+`、`OneKeyKontext`、`OneKey-Outpaint`。 - 视角与姿态:`QwenMultiAngle`、`QwenGaussian`、`QwenPose`、`Flux2-KleinPose`。 - 视频:`Wan(T2V)`、`Wan(I2V)`、`Wan-Extent`、`Wan-Animate`、`Wan-Remover`、`Wan-Outpaint`、`Wan-SCAIL`、`Wan-TTP`、`LTX2.3`。 - 音频:`Qwen TTS` 画布节点、`Hunyuan-Foley`、`InfiniteTalk`、Timeline 配音混剪模板。 - 增强:`Nvidia-VSR`、`Removebg`、`Relight`、`Tile`、`Eraser`。 更多配置说明见 [presets/readme.md](presets/readme.md) 和 [javascript/canvas_workbench/templates/README.md](javascript/canvas_workbench/templates/README.md)。 常用入口: - 一键部署用户:以 SimpAI 启动器4.0为准,根据指引创建文件夹,部署完毕选择 WebUI、ComfyUI 或 Forge Neo 相关入口。(Windows) - Git 克隆安装:从仓库克隆代码,根据本地环境配置。 ## 对比旧版 - 更好看的用户界面,更直观的操作流程,清理旧版残留的所有痛点。 - 更流畅的界面,更快的响应速度,更少的资源占用。 - 更好的模型支持,更丰富的玩法。 - 完全按本地化用户管理模式,不再依赖云服务。 ## 鸣谢与引用 SimpAI Studio 站在许多开源项目和节点作者的工作之上。这里列出 README 中直接提到或本工程重点集成的项目;完整许可、作者信息和使用限制以各子目录的 `LICENSE` / `README` 以及上游仓库为准。 ### 底座项目与模型生态 | 项目 | 贡献 | | ---------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------ | | [Fooocus](https://github.com/lllyasviel/Fooocus) | 早期易用生图体验、SDXL 工作流和部分图像处理思路来源。 | | [ComfyUI](https://github.com/Comfy-Org/ComfyUI) | 节点式工作流执行基础和大量模型生态能力。 | | [sd-webui-forge-classic](https://github.com/Haoming02/sd-webui-forge-classic) | Forge Neo 迁移参考项目;本仓库在 `html/forge_neo/NOTICE.md` 记录了 branch、commit 和 AGPL-3.0 说明。 | | [AUTOMATIC1111 stable-diffusion-webui](https://github.com/AUTOMATIC1111/stable-diffusion-webui) | WebUI/SDAPI/脚本扩展生态的重要来源。 | | [Stability AI Stable Diffusion](https://github.com/Stability-AI/stablediffusion) 与 [Generative Models](https://github.com/Stability-AI/generative-models) | SD1/SDXL 推理代码与模型生态。 | | [Black Forest Labs Flux](https://github.com/black-forest-labs/flux) 与 [Flux2](https://github.com/black-forest-labs/flux2) | Flux / Flux2-Klein 路线参考。 | | [Qwen Image](https://github.com/QwenLM/Qwen-Image) 与 [Qwen3-TTS](https://github.com/QwenLM/Qwen3-TTS) | Qwen 图像编辑、视觉理解和 TTS 能力来源。 | | [Wan 2.2](https://github.com/Wan-Video/Wan2.2) 与 WanVideo 生态 | 视频生成、视频编辑、动作迁移、视频扩图等路线来源。 | | [Hugging Face transformers](https://github.com/huggingface/transformers) 与 [diffusers](https://github.com/huggingface/diffusers) | 模型加载、推理组件和通用生态。 | | [TAESD](https://github.com/madebyollin/taesd) | 轻量实时预览编码器。 | | [InvokeAI](https://github.com/invoke-ai/InvokeAI) 与 [chaiNNer](https://github.com/chaiNNer-org/chaiNNer) | 部分兼容和图像处理参考。 | ### Forge / WebUI 扩展 | 扩展 | 来源或鸣谢 | | -------------------------------------------------------------------------------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | ControlNet / legacy preprocessors | [lllyasviel/ControlNet](https://github.com/lllyasviel/ControlNet)、相关 annotator 与 Forge 扩展生态。 | | IPAdapter | [cubiq/ComfyUI_IPAdapter_plus](https://github.com/cubiq/ComfyUI_IPAdapter_plus) 以及 IP-Adapter 相关作者。 | | MultiDiffusion / tiled diffusion | [pkuliyi2015/multidiffusion-upscaler-for-automatic1111](https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111)、[shiimizu/ComfyUI-TiledDiffusion](https://github.com/shiimizu/ComfyUI-TiledDiffusion)、Mixture of Diffusers 思路。 | | Regional Prompter | [hako-mikan/sd-webui-regional-prompter](https://github.com/hako-mikan/sd-webui-regional-prompter)。 | | ADetailer-Neo、Tagcomplete、Qwen Vision Chat、SAM Matting、Trellis2、Storyboard Assistant 等 | 来自 WebUI/Forge 扩展社区,本仓库保留各扩展目录内说明和许可文件。 | ### ComfyUI 自定义节点 收集节点众多,以下为部分代表(若未罗列节点均受同等致谢): | 节点或节点家族 | 用途 | | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------- | | [ComfyUI-Manager](https://github.com/ltdrdata/ComfyUI-Manager) | 节点管理与生态入口。 | | [ComfyUI-Easy-Use](https://github.com/yolain/ComfyUI-Easy-Use) | Easy 系列实用节点、加载器、XYPlot、Fooocus Inpaint 等能力。 | | [ComfyUI-Danbooru-Gallery](https://github.com/Aaalice233/ComfyUI-Danbooru-Gallery) | Danbooru Gallery、提示词编辑、素材浏览和中文用户工作流辅助。 | | [Comfyui-LayerForge](https://github.com/Azornes/Comfyui-LayerForge) | 图层式画布编辑器,SimpAI WebUI 中的 LayerForge 能力参考。 | | [ComfyUI_VNCCS_Utils](https://github.com/AHEKOT/ComfyUI_VNCCS) | Pose Studio、视觉相机控制、Qwen Detailer、模型管理等。 | | [ComfyUI-WanVideoWrapper](https://github.com/kijai/ComfyUI-WanVideoWrapper) | WanVideo 相关视频生成和编辑包装节点。 | | [ComfyUI-KJNodes](https://github.com/kijai/ComfyUI-KJNodes) 与 [ComfyUI-VideoHelperSuite](https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite) | 视频、批处理、辅助节点和工作流工具。 | | [ComfyUI-GGUF](https://github.com/city96/ComfyUI-GGUF) | GGUF 模型加载与量化模型路线。 | | [ComfyUI-Florence2](https://github.com/kijai/ComfyUI-Florence2)、[ComfyUI-WD14-Tagger](https://github.com/pythongosssss/ComfyUI-WD14-Tagger)、[ComfyUI-llama-cpp](https://github.com/lihaoyun6/ComfyUI-llama-cpp) | 视觉理解、标签反推、LLM/VLM 本地推理。 | | [ComfyUI-Qwen-TTS](comfy/custom_nodes/ComfyUI-Qwen-TTS/README_CN.md) | 基于[Qwen3-TTS](https://github.com/QwenLM/Qwen3-TTS) 的语音合成、音色设计、克隆和多角色对白节点。 | | [ComfyUI-Easy-Sam3](comfy/custom_nodes/ComfyUI-Easy-Sam3/README_CN.md) | 基于[SAM3](https://github.com/facebookresearch/sam3) 的图像/视频分割节点。 | | [ComfyUI-Impact-Pack](https://github.com/ltdrdata/ComfyUI-Impact-Pack)、[rgthree-comfy](https://github.com/rgthree/rgthree-comfy)、[comfyui_controlnet_aux](https://github.com/Fannovel16/comfyui_controlnet_aux)、[ComfyUI_IPAdapter_plus](https://github.com/cubiq/ComfyUI_IPAdapter_plus) | 检测、细化、ControlNet 预处理、图像参考和节点工作流增强。 | ## 许可 仓库根目录保留 GPL-3.0 许可文本。Forge Neo 迁移代码包含来自 `sd-webui-forge-classic` 的 AGPL-3.0 说明,详见 [html/forge_neo/NOTICE.md](html/forge_neo/NOTICE.md)。第三方节点、模型、扩展和权重文件可能有各自许可证或使用限制,分发和商用前请查看对应来源。 ## 社区 - B 站 (个人主页): [冰華子](https://space.bilibili.com/627080) - QQ 交流群:`1005085136` 如果这个项目帮到了你,欢迎 Star、反馈问题、分享预置包和工作流。