# 2022年(第5届)泰迪杯 数据分析技能赛 B题
**Repository Path**: shuiliumu/tipdm_2022_DataAnalysis_QuestionB
## Basic Information
- **Project Name**: 2022年(第5届)泰迪杯 数据分析技能赛 B题
- **Description**: 2022年(第5届)泰迪杯 数据分析技能赛 B题
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2024-10-27
- **Last Updated**: 2024-10-30
## Categories & Tags
**Categories**: Uncategorized
**Tags**: Python, Jupyter-notebook, 数据分析, 泰迪杯, 计算机竞赛
## README
# 2022年(第5届)“泰迪杯” 数据分析技能赛 B题
## 1. 介绍
- 数据分析:银行客户忠诚度分析
- 泰迪杯技能赛B题(全解):个人复盘,重新编写数据分析代码后所得 (18M)
(注意:其中有ipynb文件为解题代码文件,html目录下文件为ipynb文件的html格式,可以直接打开看)
| 泰迪杯技能赛B题(全解)文件说明 | 文件名 |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| 赛事举办方提供的原始文件 | B题:银行客户忠诚度分析赛题数据.pdf |
| Jupyter文件(数据处理程序编写于该文件) | 任务1 数据探索与清洗.ipynb
任务2 产品营销数据可视化分析.ipynb
任务3 客户流失因素可视化分析.ipynb
任务4 特征构建.ipynb
任务5 银行客户长期忠诚度预测建模.ipynb |
| html目录 | 存ipynb文件转html格式的文件 |
| 程序执行生成的文件 | result1_1.xlsx
result1_2.xlsx
result1_3.xlsx
result3(long-customer-test).xlsx
result3.xlsx
result4(long-customer-test).xlsx
result4.xlsx
result5.xlsx |
## 2. 程序运行
程序运行前提:程序运行前要删除 程序执行生成的文件。否则可能报错
原因:比如其中有解压压缩文件的操作,但该目录下已经有相同名的压缩文件了,那么运行解压程序时就会报错
### (1)环境配置
1. python环境
2. 安装相关依赖库
#### 依赖库
```
# 交互式笔记本库
jupyter
# 数据分析库
pandas
# 科学计算工具
numpy
# 数据图像化包
matplotlib
# 数据图像化包
pyecharts
# 机器学习库
scikit-learn
# 机器学习xgboost算法库
xgboost
```
### (2)删除程序执行生成的文件
```shell
# 删除这些文件
- result1_1.xlsx
- result1_2.xlsx
- result1_3.xlsx
- result3(long-customer-test).xlsx
- result3.xlsx
- result4(long-customer-test).xlsx
- result4.xlsx
- result5.xlsx
```
### (3)启动jupyter运行程序
```shell
# cmd 命令窗口
jupyter-notebook # 或 jupyter_notebook 根据jupyter版本而定
```
## 3. 技术要求
1. jupyter-notebook基本使用(即会用jupyter提供的notebook运行代码便可)
2. pandas熟练掌握(关键是DataFrame数据结构的属性,函数,方法要熟悉)
pandas教程地址: https://shuiliumu.flowus.cn/share/ad222f04-f8bb-48bc-87d5-a650b5dbaa72
(注意:个人为参加该比赛自学pandas的笔记)
3. numpy基本使用(会对numpy类型二维数组创建,修改等基本操作便可)
4. matplotlib,echart等会上网查程序并修改便可
###