⚡ 快速开始

``` 查看帮助： ```bash python manage.py help ``` | 命令 | 描述 | |------------|------------------------------------------------------------------| | setup | 环境设置与依赖安装 | | update | 从远程仓库拉取最新代码 | | version | 显示当前版本与更新摘要 | | changelog | 显示版本历史（支持 --all / --version X.X.XXXX） | | train | 训练模型（支持量化 / LoRA / RLHF） | | infer | 模型推理（支持 MCP 集成与推测式解码） | | check | 检查 GPU 与依赖项 | | monitor | 系统监控（GPU/CPU/内存） | | download | 下载数据集 | | dataset | 数据集管理与转换 | | cache | 缓存维护（stats / clear-dataset / clear-downloads / clear-all） | | benchmark | 模型评测与基准测试 | | mcp | MCP 工具管理（status / warmup / refresh-cache） | | watermark | 水印检测（文本/文件，支持批量与 JSON 输出） | | help | 显示帮助信息 | ### 快速体验 ```bash # 训练 0.5B 模型 python manage.py train --model_size 0.5B # 推理测试 python manage.py infer --ckpt ckpt/latest.pt --prompt "用简单的话解释机器学习" ``` ### 常用示例 ```bash # 基础操作 python manage.py version python manage.py changelog --all python manage.py changelog --version 1.0.0150 # 数据集管理 python manage.py download --max_samples 50000 # 训练示例 python manage.py train --model_size 0.5B --dataset Chinese2 python manage.py train --model_size 1.5B --dataset Chinese2 --resume_ckpt runs/last.pt --reset_lr python manage.py train --model_size 7B --dataset Chinese2 --force_quant --quant_bits 4 --force_lora python manage.py train --model_size 7B --dataset Chinese2 --rlhf --rlhf_dataset dunimd/human_feedback --rlhf_lr 1e-5 # 推理示例 python manage.py infer --ckpt ckpt/latest.pt --prompt "你好，PiscesL1!" python manage.py infer --ckpt ckpt/model.pt --prompt "Hi" --speculative --draft_model ckpt/draft.pt --spec_gamma 4 # 评测示例 python manage.py benchmark --list python manage.py benchmark --info mmlu python manage.py benchmark --benchmark mmlu --config configs/0.5B.json --seq_len 4096 --model ckpt/model.pt python manage.py benchmark --perf --config configs/0.5B.json --selftest # MCP 工具 python manage.py mcp --mcp_action status python manage.py mcp --mcp_action warmup python manage.py mcp --mcp_action refresh-cache # 缓存管理 python manage.py cache --cache_action stats python manage.py cache --cache_action clear-dataset python manage.py cache --cache_action clear-downloads python manage.py cache --cache_action clear-all ``` ---

📦 数据集

数据集由 `configs/dataset.json` 配置并通过： ```bash python manage.py download ``` - 下载的默认优先来源：ModelScope → HuggingFace（不可访问时自动镜像）。 - 完整列表请见 `configs/dataset.json` ---

❓ 常见问题（FAQ）

- 如何查看可用命令？`python manage.py help` - 如何添加新数据集？编辑 `configs/dataset.json` 并运行 `python manage.py download`。自定义数据集建议 JSONL（text）或 Parquet（input_ids/labels）。 - 显存不足怎么办？用更小模型、降低序列长度，或启用 4 位量化（`--force_quant --quant_bits 4`，通常配合 `--force_lora`）。 - 如何恢复训练？`--resume_ckpt path/to/ckpt.pt`（可选 `--reset_lr`） - 仅用 CPU？可使用 `--device cpu`（性能较慢）。 - 如何进行评测？`python manage.py benchmark ...`，配合 `--config`、`--seq_len`、`--model` 等参数。 ---

🌏 社区与引用

- 欢迎提交 Issues 与 PR！ - Gitee: https://gitee.com/dunimd/piscesl1.git - GitHub: https://github.com/mf2023/piscesl1.git - ModelScope: https://www.modelscope.cn/models/mfchina2024/PiscesL1 ---

## 📄 许可证与开源协议 ### 🏛️ 项目许可证

本项目采用 **Apache License 2.0** 开源协议，详见 [LICENSE](LICENSE) 文件。 ### 📋 依赖包开源协议本项目依赖的开源包及其协议信息如下：

| 📦 包名 | 📜 开源协议 | 📦 包名 | 📜 开源协议 | |:-------|:-----------|:-------|:-----------| | torch | BSD-style | torchvision | BSD-style | | transformers | Apache 2.0 | tokenizers | Apache 2.0 | | datasets | Apache 2.0 | huggingface-hub | Apache 2.0 | | modelscope | Apache 2.0 | opencv-python | MIT | | numpy | BSD 3-Clause | addict | MIT | | accelerate | Apache 2.0 | einops | MIT | | timm | Apache 2.0 | pytorch-lightning | Apache 2.0 | | pillow | HPND | PyMuPDF | AGPL 3.0 | | python-docx | MIT | python-pptx | MIT | | bitsandbytes | MIT | peft | Apache 2.0 | | wheel | MIT | xformers | BSD 3-Clause | | trl | Apache 2.0 | nvidia-ml-py3 | BSD 3-Clause | | fastapi | MIT | uvicorn | BSD 3-Clause | | python-multipart | Apache 2.0 | pydantic | MIT | | pandas | BSD 3-Clause | gradio | Apache 2.0 | | ijson | BSD 3-Clause | pyarrow | Apache 2.0 | | tqdm | MIT | jsonlines | MIT | | streamlit | Apache 2.0 | PyYAML | MIT | | GitPython | BSD 3-Clause | mcp[cli] | MIT | | openai | Apache 2.0 | requests | Apache 2.0 | | beautifulsoup4 | MIT | psutil | BSD 3-Clause | | pytz | MIT | pywin32 | PSF | | duckduckgo-search | MIT | plotly | MIT | | safetensors | Apache 2.0 | torch-directml | MIT | | torch-audio | BSD-style | deepspeed | Apache 2.0 | | mpi4py | BSD 3-Clause | evalscope | Apache 2.0 | | fastmcp | MIT | aiofiles | Apache 2.0 | | pathlib2 | MIT | | |

Ruchbah架构(Reliable Unified Cognitive Hybrid Balanced Adaptive High-performance)

🛠️ 安装与环境

⚡ 快速开始

📦 数据集

❓ 常见问题（FAQ）

🌏 社区与引用