# transbigdata
**Repository Path**: cqjsc_admin/transbigdata
## Basic Information
- **Project Name**: transbigdata
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: BSD-3-Clause
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-06-24
- **Last Updated**: 2025-06-24
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
[English](README.md) 中文版
# TransBigData 针对交通时空大数据处理的Python包
[](https://transbigdata.readthedocs.io/zh_CN/latest/?badge=latest)
[](https://badge.fury.io/py/transbigdata) [](https://pepy.tech/project/transbigdata)  [](https://space.bilibili.com/3051484) [](https://joss.theoj.org/papers/d1055fe3105dfa2dcff4cb6c7688a79b) [](https://github.com/ni1o1/transbigdata/actions/workflows/tests.yml) [](https://codecov.io/gh/ni1o1/transbigdata) [](https://zenodo.org/badge/latestdoi/419559811) [](https://gitter.im/transbigdata/community?utm_source=badge&utm_medium=badge&utm_campaign=pr-badge)
`TransBigData`是一个为交通时空大数据处理、分析和可视化而开发的Python包。`TransBigData`为处理常见的交通时空大数据(如出租车GPS数据、共享单车数据和公交车GPS数据)提供了快速而简洁的方法。`TransBigData`为交通时空大数据分析的各个阶段提供了多种处理方法,代码简洁、高效、灵活、易用,可以用简洁的代码实现复杂的数据任务。
对于一些特定类型的数据,`TransBigData`还提供了针对特定需求的工具,如从出租车GPS数据中提取出租车行程的起点和终点信息(OD),从公交车GPS数据中识别到离站信息。该包的最新稳定版本可以通过pip安装,完整的文档可以查看:[TransBigData的说明文档](https://transbigdata.readthedocs.io/zh_CN/latest/)
**技术特点**
* 面向交通时空大数据分析不同阶段的处理需求提供不同处理功能。
* 代码简洁、高效、灵活、易用,通过简短的代码即可实现复杂的数据任务。
**主要功能**
目前,`TransBigData`主要提供以下方法:
* **数据质量分析**: 提供快速获取数据集一般信息的方法,包括数据量、时间段和采样间隔。
* **数据预处理**: 提供清洗多种类型的数据错误的方法。
* **数据栅格化**: 提供在研究区域内生成多种类型的地理网格(矩形网格、六角形网格)的方法。提供快速算法将GPS数据映射到生成的网格上。
* **数据聚合集计**: 提供将GPS数据和OD数据聚合到地理多边形的方法。
* **数据可视化**: 内置的可视化功能,利用可视化包keplergl,用简单的代码在Jupyter笔记本上交互式地可视化数据。
* **轨迹数据处理**: 提供处理轨迹数据的方法,包括从GPS点生成轨迹线型,轨迹增密等。
* **地图底图**: 提供在matplotlib上显示Mapbox地图底图的方法。
## 安装
TransBigData仅支持Python版本>=3.6
### 用pypi安装
在安装 `TransBigData`之前,请确保已经安装了可用的geopandas包:https://geopandas.org/index.html
如果你已经安装了geopandas,则直接在命令提示符中运行下面代码即可安装:
pip install -U transbigdata
### 用conda-forge安装
你也可以用conda-forge安装 `TransBigData`,这种方式会自动解决环境依赖,不过国内可能需要更换conda源。运行下面代码即可安装:
conda install -c conda-forge transbigdata
## 可视化示例
### 可视化轨迹(基于keplergl)

### 可视化数据分布(基于keplergl)

### 可视化OD(基于keplergl)

## 使用示例
下面例子展示如何使用 `TransBigData`工具快速处理出租车GPS数据,实现数据栅格化,数据聚合集计与数据可视化:
```python
import transbigdata as tbd
import pandas as pd
#读取出租车GPS数据
data = pd.read_csv('TaxiData-Sample.csv',header = None)
data.columns = ['VehicleNum','time','lon','lat','OpenStatus','Speed']
data
```
VehicleNum | time | lon | lat | OpenStatus | Speed | |
---|---|---|---|---|---|---|
0 | 34745 | 20:27:43 | 113.806847 | 22.623249 | 1 | 27 |
1 | 34745 | 20:24:07 | 113.809898 | 22.627399 | 0 | 0 |
2 | 34745 | 20:24:27 | 113.809898 | 22.627399 | 0 | 0 |
3 | 34745 | 20:22:07 | 113.811348 | 22.628067 | 0 | 0 |
4 | 34745 | 20:10:06 | 113.819885 | 22.647800 | 0 | 54 |
... | ... | ... | ... | ... | ... | ... |
544994 | 28265 | 21:35:13 | 114.321503 | 22.709499 | 0 | 18 |
544995 | 28265 | 09:08:02 | 114.322701 | 22.681700 | 0 | 0 |
544996 | 28265 | 09:14:31 | 114.336700 | 22.690100 | 0 | 0 |
544997 | 28265 | 21:19:12 | 114.352600 | 22.728399 | 0 | 0 |
544998 | 28265 | 19:08:06 | 114.137703 | 22.621700 | 0 | 0 |
544999 rows × 6 columns