# Arise-tools-label_studio **Repository Path**: figmar/arise-tools-label_studio ## Basic Information - **Project Name**: Arise-tools-label_studio - **Description**: No description available - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-06-22 - **Last Updated**: 2025-06-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ![GitHub](https://img.shields.io/github/license/heartexlabs/label-studio?logo=heartex) ![label-studio:build](https://github.com/HumanSignal/label-studio/workflows/label-studio:build/badge.svg) ![GitHub release](https://img.shields.io/github/v/release/heartexlabs/label-studio?include_prereleases) [官方网站](https://labelstud.io/) • [文档](https://labelstud.io/guide/) • [加入Slack社区 ](https://slack.labelstud.io/?source=github-1) ## 什么是Label Studio? Label Studio是一款开源的数据标注工具。它允许您通过简单直观的UI标注音频、文本、图像、视频和时间序列等数据类型,并导出为各种模型格式。它可用于准备原始数据或改进现有训练数据,以获得更准确的机器学习模型。 - [试用Label Studio](#试用label-studio) - [Label Studio的功能特点](#label-studio的功能特点) - [Label Studio中的数据标注模板](#label-studio中的数据标注模板) - [使用Label Studio设置机器学习模型](#使用label-studio设置机器学习模型) - [将Label Studio与现有工具集成](#将label-studio与现有工具集成) ![Label Studio标注不同类型数据的演示GIF](/images/annotation_examples.gif) 有自定义数据集?您可以自定义Label Studio以满足您的需求。阅读[介绍性博客文章](https://towardsdatascience.com/introducing-label-studio-a-swiss-army-knife-of-data-labeling-140c1be92881)了解更多信息。 ## 试用Label Studio 在本地安装Label Studio或将其部署在云实例中。[或者注册我们的Starter Cloud版本免费试用!](https://humansignal.com/platform/starter-cloud/)您可以在[这里](https://labelstud.io/guide/label_studio_compare)了解每个版本的功能差异。 - [使用Docker在本地安装](#使用docker在本地安装) - [使用Docker Compose运行(Label Studio + Nginx + PostgreSQL)](#使用docker-compose运行) - [使用pip在本地安装](#使用pip在本地安装) - [使用poetry在本地安装](#使用poetry在本地安装) - [使用Anaconda在本地安装](#使用anaconda在本地安装) - [本地开发安装](#本地开发安装) - [在云实例中部署](#在云实例中部署) ### 使用Docker在本地安装 官方Label Studio Docker镜像位于[这里](https://hub.docker.com/r/heartexlabs/label-studio),可以通过`docker pull`下载。 在Docker容器中运行Label Studio,并通过`http://localhost:8080`访问。 ```bash docker pull heartexlabs/label-studio:latest docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest ``` 您可以在`./mydata`目录中找到所有生成的资源,包括SQLite3数据库存储`label_studio.sqlite3`和上传的文件。 #### 覆盖默认Docker安装 您可以通过附加新参数来覆盖默认启动命令: ```bash docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest label-studio --log-level DEBUG ``` #### 使用Docker构建本地镜像 如果您想构建本地镜像,请运行: ```bash docker build -t heartexlabs/label-studio:latest . ``` ### 使用Docker Compose运行 Docker Compose脚本提供了生产就绪的堆栈,包括以下组件: - Label Studio - [Nginx](https://www.nginx.com/) - 用于加载各种静态数据(包括上传的音频、图像等)的代理Web服务器 - [PostgreSQL](https://www.postgresql.org/) - 生产就绪的数据库,替代性能较低的SQLite3 要从`http://localhost`开始使用应用程序,请运行以下命令: ```bash docker-compose up ``` ### 使用Docker Compose + MinIO运行 您还可以使用额外的MinIO服务器进行本地S3存储。当您想在本地系统上测试S3存储的行为时,这特别有用。要以这种方式启动Label Studio,您需要运行以下命令: ````bash # 在Linux上如果您不是docker组的成员,请添加sudo docker compose -f docker-compose.yml -f docker-compose.minio.yml up -d ```` 如果您没有静态IP地址,必须在主机文件中创建一个条目,以便Label Studio和浏览器都能访问MinIO服务器。有关详细说明,请参阅[我们的数据存储指南](docs/source/guide/storedata.md)。 ### 使用pip在本地安装 ```bash # 需要Python >=3.8 pip install label-studio # 在http://localhost:8080启动服务器 label-studio ``` ### 使用poetry在本地安装 ```bash ### 安装poetry pip install poetry ### 设置poetry环境 poetry new my-label-studio cd my-label-studio poetry add label-studio ### 激活poetry环境 poetry shell ### 在http://localhost:8080启动服务器 label-studio ``` ### 使用Anaconda在本地安装 ```bash conda create --name label-studio conda activate label-studio conda install psycopg2 pip install label-studio ``` ### 本地开发安装 您可以在本地运行最新版本的Label Studio,而无需从pypi安装包。 ```bash # 安装所有包依赖 pip install poetry poetry install # 运行数据库迁移 python label_studio/manage.py migrate python label_studio/manage.py collectstatic # 在开发模式下启动服务器,地址为http://localhost:8080 python label_studio/manage.py runserver ``` ### 在云实例中部署 您可以通过一键部署在Heroku、Microsoft Azure或Google Cloud Platform上部署Label Studio: Deploy [](https://portal.azure.com/#create/Microsoft.Template/uri/https%3A%2F%2Fraw.githubusercontent.com%2Fhumansignal%2Flabel-studio%2Fdevelop%2Fazuredeploy.json) [](https://deploy.cloud.run) #### 应用前端更改 有关更新前端的信息,请参见[label-studio/web/README.md](https://github.com/HumanSignal/label-studio/blob/develop/web/README.md#installation-instructions)。 #### 在Windows上安装依赖项 要在Windows上运行Label Studio,请从[Gohlke builds](https://www.lfd.uci.edu/~gohlke/pythonlibs)下载并安装以下wheel包,以确保使用正确的Python版本: - [lxml](https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml) ```bash # 升级pip pip install -U pip # 如果您在Win64上运行Python 3.8,请安装从Gohlke下载的包: pip install lxml‑4.5.0‑cp38‑cp38‑win_amd64.whl # 安装label studio pip install label-studio ``` ### 运行测试套件 要将测试依赖项添加到本地安装: ```bash poetry install --with test ``` 或者,可以从安装了测试依赖项的Docker容器中运行单元测试: ```bash make build-testing-image make docker-testing-shell ``` 无论哪种情况,要运行单元测试: ```bash cd label_studio # sqlite3 DJANGO_DB=sqlite DJANGO_SETTINGS_MODULE=core.settings.label_studio pytest -vv # postgres(假设默认postgres用户、数据库、密码。如果没有额外配置,在Docker测试容器中将无法工作) DJANGO_DB=default DJANGO_SETTINGS_MODULE=core.settings.label_studio pytest -vv ``` ## Label Studio的功能特点 https://github.com/user-attachments/assets/525ad5ff-6904-4398-b507-7e8954268d69 - **多用户标注** 注册和登录,创建标注时会与您的账户关联。 - **多个项目** 在一个实例中处理所有数据集。 - **流线型设计** 帮助您专注于任务,而不是如何使用软件。 - **可配置的标签格式** 让您自定义视觉界面以满足特定的标注需求。 - **支持多种数据类型** 包括图像、音频、文本、HTML、时间序列和视频。 - **从文件或云存储导入** 支持Amazon AWS S3、Google Cloud Storage或JSON、CSV、TSV、RAR和ZIP归档文件。