# Arise-tools-label_studio
**Repository Path**: figmar/arise-tools-label_studio
## Basic Information
- **Project Name**: Arise-tools-label_studio
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Apache-2.0
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-06-22
- **Last Updated**: 2025-06-23
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
  
[官方网站](https://labelstud.io/) • [文档](https://labelstud.io/guide/) • [加入Slack社区
](https://slack.labelstud.io/?source=github-1)
## 什么是Label Studio?
Label Studio是一款开源的数据标注工具。它允许您通过简单直观的UI标注音频、文本、图像、视频和时间序列等数据类型,并导出为各种模型格式。它可用于准备原始数据或改进现有训练数据,以获得更准确的机器学习模型。
- [试用Label Studio](#试用label-studio)
- [Label Studio的功能特点](#label-studio的功能特点)
- [Label Studio中的数据标注模板](#label-studio中的数据标注模板)
- [使用Label Studio设置机器学习模型](#使用label-studio设置机器学习模型)
- [将Label Studio与现有工具集成](#将label-studio与现有工具集成)

有自定义数据集?您可以自定义Label Studio以满足您的需求。阅读[介绍性博客文章](https://towardsdatascience.com/introducing-label-studio-a-swiss-army-knife-of-data-labeling-140c1be92881)了解更多信息。
## 试用Label Studio
在本地安装Label Studio或将其部署在云实例中。[或者注册我们的Starter Cloud版本免费试用!](https://humansignal.com/platform/starter-cloud/)您可以在[这里](https://labelstud.io/guide/label_studio_compare)了解每个版本的功能差异。
- [使用Docker在本地安装](#使用docker在本地安装)
- [使用Docker Compose运行(Label Studio + Nginx + PostgreSQL)](#使用docker-compose运行)
- [使用pip在本地安装](#使用pip在本地安装)
- [使用poetry在本地安装](#使用poetry在本地安装)
- [使用Anaconda在本地安装](#使用anaconda在本地安装)
- [本地开发安装](#本地开发安装)
- [在云实例中部署](#在云实例中部署)
### 使用Docker在本地安装
官方Label Studio Docker镜像位于[这里](https://hub.docker.com/r/heartexlabs/label-studio),可以通过`docker pull`下载。
在Docker容器中运行Label Studio,并通过`http://localhost:8080`访问。
```bash
docker pull heartexlabs/label-studio:latest
docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest
```
您可以在`./mydata`目录中找到所有生成的资源,包括SQLite3数据库存储`label_studio.sqlite3`和上传的文件。
#### 覆盖默认Docker安装
您可以通过附加新参数来覆盖默认启动命令:
```bash
docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest label-studio --log-level DEBUG
```
#### 使用Docker构建本地镜像
如果您想构建本地镜像,请运行:
```bash
docker build -t heartexlabs/label-studio:latest .
```
### 使用Docker Compose运行
Docker Compose脚本提供了生产就绪的堆栈,包括以下组件:
- Label Studio
- [Nginx](https://www.nginx.com/) - 用于加载各种静态数据(包括上传的音频、图像等)的代理Web服务器
- [PostgreSQL](https://www.postgresql.org/) - 生产就绪的数据库,替代性能较低的SQLite3
要从`http://localhost`开始使用应用程序,请运行以下命令:
```bash
docker-compose up
```
### 使用Docker Compose + MinIO运行
您还可以使用额外的MinIO服务器进行本地S3存储。当您想在本地系统上测试S3存储的行为时,这特别有用。要以这种方式启动Label Studio,您需要运行以下命令:
````bash
# 在Linux上如果您不是docker组的成员,请添加sudo
docker compose -f docker-compose.yml -f docker-compose.minio.yml up -d
````
如果您没有静态IP地址,必须在主机文件中创建一个条目,以便Label Studio和浏览器都能访问MinIO服务器。有关详细说明,请参阅[我们的数据存储指南](docs/source/guide/storedata.md)。
### 使用pip在本地安装
```bash
# 需要Python >=3.8
pip install label-studio
# 在http://localhost:8080启动服务器
label-studio
```
### 使用poetry在本地安装
```bash
### 安装poetry
pip install poetry
### 设置poetry环境
poetry new my-label-studio
cd my-label-studio
poetry add label-studio
### 激活poetry环境
poetry shell
### 在http://localhost:8080启动服务器
label-studio
```
### 使用Anaconda在本地安装
```bash
conda create --name label-studio
conda activate label-studio
conda install psycopg2
pip install label-studio
```
### 本地开发安装
您可以在本地运行最新版本的Label Studio,而无需从pypi安装包。
```bash
# 安装所有包依赖
pip install poetry
poetry install
# 运行数据库迁移
python label_studio/manage.py migrate
python label_studio/manage.py collectstatic
# 在开发模式下启动服务器,地址为http://localhost:8080
python label_studio/manage.py runserver
```
### 在云实例中部署
您可以通过一键部署在Heroku、Microsoft Azure或Google Cloud Platform上部署Label Studio:
[
](https://portal.azure.com/#create/Microsoft.Template/uri/https%3A%2F%2Fraw.githubusercontent.com%2Fhumansignal%2Flabel-studio%2Fdevelop%2Fazuredeploy.json)
[
](https://deploy.cloud.run)
#### 应用前端更改
有关更新前端的信息,请参见[label-studio/web/README.md](https://github.com/HumanSignal/label-studio/blob/develop/web/README.md#installation-instructions)。
#### 在Windows上安装依赖项
要在Windows上运行Label Studio,请从[Gohlke builds](https://www.lfd.uci.edu/~gohlke/pythonlibs)下载并安装以下wheel包,以确保使用正确的Python版本:
- [lxml](https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)
```bash
# 升级pip
pip install -U pip
# 如果您在Win64上运行Python 3.8,请安装从Gohlke下载的包:
pip install lxml‑4.5.0‑cp38‑cp38‑win_amd64.whl
# 安装label studio
pip install label-studio
```
### 运行测试套件
要将测试依赖项添加到本地安装:
```bash
poetry install --with test
```
或者,可以从安装了测试依赖项的Docker容器中运行单元测试:
```bash
make build-testing-image
make docker-testing-shell
```
无论哪种情况,要运行单元测试:
```bash
cd label_studio
# sqlite3
DJANGO_DB=sqlite DJANGO_SETTINGS_MODULE=core.settings.label_studio pytest -vv
# postgres(假设默认postgres用户、数据库、密码。如果没有额外配置,在Docker测试容器中将无法工作)
DJANGO_DB=default DJANGO_SETTINGS_MODULE=core.settings.label_studio pytest -vv
```
## Label Studio的功能特点
https://github.com/user-attachments/assets/525ad5ff-6904-4398-b507-7e8954268d69
- **多用户标注** 注册和登录,创建标注时会与您的账户关联。
- **多个项目** 在一个实例中处理所有数据集。
- **流线型设计** 帮助您专注于任务,而不是如何使用软件。
- **可配置的标签格式** 让您自定义视觉界面以满足特定的标注需求。
- **支持多种数据类型** 包括图像、音频、文本、HTML、时间序列和视频。
- **从文件或云存储导入** 支持Amazon AWS S3、Google Cloud Storage或JSON、CSV、TSV、RAR和ZIP归档文件。