# JittorLLMs **Repository Path**: monkeycc/JittorLLMs ## Basic Information - **Project Name**: JittorLLMs - **Description**: 本库可大幅降低硬件配置要求(减少80%),没有显卡,2G内存就能跑大模型,人人皆可在普通机器上,实现大模型本地部署,计图大模型推理库,具有高性能、配置要求低、中文支持好、可移植等特点 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 2 - **Created**: 2023-10-26 - **Last Updated**: 2024-11-15 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 计图大模型推理库 - 笔记本没有显卡也能跑大模型 本大模型推理库JittorLLMs有以下几个特点: 1. 成本低:相比同类框架,本库可大幅降低硬件配置要求(减少80%),没有显卡,2G内存就能跑大模型,人人皆可在普通机器上,实现大模型本地部署;是目前已知的部署成本最低的大模型库; 2. 支持广:目前支持了大模型包括: [ChatGLM大模型](https://github.com/THUDM/ChatGLM-6B); 鹏程[盘古大模型](https://openi.org.cn/pangu/); BlinkDL的[ChatRWKV](https://github.com/BlinkDL/ChatRWKV); Meta的[LLaMA/LLaMA2大模型](https://github.com/facebookresearch/llama); MOSS大模型; [Atom7B大模型](https://huggingface.co/FlagAlpha/Atom-7B) 后续还将支持更多国内优秀的大模型,统一运行环境配置,降低大模型用户的使用门槛。 3. 可移植:用户不需要修改任何代码,只需要安装Jittor版torch(JTorch),即可实现模型的迁移,以便于适配各类异构计算设备和环境。 4. 速度快:大模型加载速度慢,Jittor框架通过零拷贝技术,大模型加载开销降低40%,同时,通过元算子自动编译优化,计算性能相比同类框架提升20%以上。 Jittor大模型库架构图如下所示。  ## 配置要求 * 内存要求:至少2G,推荐32G * 显存:可选, 推荐16G * 操作系统:支持Windows,Mac,Linux全平台。 * 磁盘空间:至少40GB空闲磁盘空间,用于下载参数和存储交换文件。 * Python版本要求至少`3.8`(Linux的Python版本至少`3.7`)。 磁盘空间不够时,可以通过环境变量`JITTOR_HOME`指定缓存存放路径。 内存或者显存不够,出现进程被杀死的情况,请参考下方,[限制内存消耗的方法](#配置要求低)。 ## 部署方法 可以通过下述指令安装依赖。(注意:此脚本会安装Jittor版torch,推荐用户新建环境运行) ``` # 国内使用 gitlink clone git clone https://gitlink.org.cn/jittor/JittorLLMs.git --depth 1 # github: git clone https://github.com/Jittor/JittorLLMs.git --depth 1 cd JittorLLMs # -i 指定用jittor的源, -I 强制重装Jittor版torch pip install -r requirements.txt -i https://pypi.jittor.org/simple -I ``` 如果出现找不到jittor版本的错误,可能是您使用的镜像还没有更新,使用如下命令更新最新版:`pip install jittor -U -i https://pypi.org/simple` 部署只需一行命令即可: ``` python cli_demo.py [chatglm|pangualpha|llama|chatrwkv|llama2|atom7b] ``` 运行后会自动从服务器上下载模型文件到本地,会占用根目录下一定的硬盘空间。 例如对于盘古α约为 15G。最开始运行的时候会编译一些CUDA算子,这会花费一些时间进行加载。 下图是 [ChatGLM](https://github.com/THUDM/ChatGLM-6B) 的实时对话截图: