# 深度学习实验课设 **Repository Path**: BASSKILL/RIVE_project ## Basic Information - **Project Name**: 深度学习实验课设 - **Description**: 这是一个用于复现论文 Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing(RIVE / RISEBench 相关思想)的代码骨架。 工程目标:搭建一个“推理(LLM)→ 编辑(图像编辑模型)”的可运行流水线,方便做对比实验与评估。 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-11-18 - **Last Updated**: 2025-11-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: Deep-learning, Image-processing ## README # RIVE 复现工程(Reasoning-Informed Visual Editing) 这是一个用于复现论文 **Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing**(RIVE / RISEBench 相关思想)的代码骨架。 工程目标:**搭建一个“推理(LLM)→ 编辑(图像编辑模型)”的可运行流水线**,方便做对比实验与评估。 --- ## 功能概览 - Reasoning 模块(LLM):Qwen / GPT / Gemini(接口封装) - Editing 模块(Diffusers):Qwen-Image-Edit / Ovis / FLUX / Step1X(接口封装) - Pipeline:把 LLM 输出的 Editing Plan 转成编辑 prompt,驱动编辑模型执行 - Eval:使用 LLM 自动评估编辑质量,生成对比图与报告 - 完整项目结构可扩展,便于加入更多模型与评测指标 --- ## 快速开始(本地测试) ### 1) 克隆并放置工程 把仓库文件放到 `rive_project/`(或直接复制本工程结构)。 ### 2) 安装依赖(建议使用 conda + GPU 环境) ```bash pip install torch torchvision --index-url https://download.pytorch.org/whl/cu118 # 根据显卡/torch 版本调整 pip install diffusers transformers accelerate safetensors pillow matplotlib pyyaml openai google-generative-ai ```