# huaweicloud-solution-driving-behavior-analysis **Repository Path**: HuaweiCloudDeveloper/huaweicloud-solution-driving-behavior-analysis ## Basic Information - **Project Name**: huaweicloud-solution-driving-behavior-analysis - **Description**: 该解决方案基于华为云数据湖探索 DLI构建,帮助您快速的进行车辆数据管理与分析。 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master-dev - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2023-11-20 - **Last Updated**: 2025-06-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README [TOC] **解决方案介绍** =============== 该解决方案基于华为云数据湖探索 DLI Spark作业构建,通过对驾驶人驾驶行为的分析,帮助您快速的进行车辆数据管理与分析。DLI 是一个强大的大数据处理平台,它可以帮助您轻松地管理和分析车辆数据。通过使用标准 SQL 和 Spark 程序,您可以在云上进行多数据源的联合计算分析,从而挖掘和探索数据价值。适用于以下场景: 1、智能驾驶: 通过分析车辆数据,可以提供有关驾驶行为的深入见解,以改善驾驶体验、提高道路安全,并优化交通流量。 2、自动驾驶: 通过分析车辆数据,可以训练自动驾驶模型,以提高自动驾驶的准确性和效率。 3、安全预警: 通过分析车辆数据,可以预测和识别潜在的安全问题,提前采取措施,防止事故发生。 4、用户行为分析: 通过分析车辆数据,可以了解用户的驾驶习惯和行为,以提供更好的服务和产品。 解决方案实践详情页面:https://www.huaweicloud.com/solution/implementations/driving-behavior-analysis.html **架构图** --------------- ![方案架构](./document/driving-behavior-analysis.png) **架构描述** --------------- 该解决方案会部署如下资源: 1. 创建一台云数据库 RDS for MySQL实例,用于存储统计的驾驶行为数据。 2. 创建数据湖探索 DLI增强型跨源队列,并创建SQL作业,用于分析和处理驾驶行为数据。 3. 创建数据湖探索 DLI跨源认证,用于DLI访问RDS for MySQL同步写入驾驶行为数据。 4. 创建两个对象存储服务 OBS桶,一个用于用户上传驾驶行为数据,另一个用于上传连接RDS的SQL文件。 5. 使用函数工作流 FunctionGraph创建两个函数,一个用于自动创建DLI 数据库表并将用户上传的驾驶行为数据自动写入,另一个用于自动在RDS创建数据表模板。 **组织结构** --------------- ```lua huaweicloud-solution-driving-behavior-analysis ├──driving-behavior-analysis.tf.json -- 资源编排模板 ├── functiongraph ├── driving_behavior_analysis_dli.py -- 函数文件(DLI) ├── driving_behavior_analysis_rds.py -- 函数文件(RDS) ├── driving_behavior_analysis_unzip -- 函数解压文件 ``` **开始使用** --------------- **通过对象存储服务 OBS预测** 1、查看OBS桶。在控制台单击“服务列表”,选择“对象存储服务 OBS”,单击进入OBS页面。该桶将作为用户上传驾驶行为数据文件的存储桶。 图1 OBS桶(DLI) ![查看OBS桶](./document/readme-image-001.png) 2、查看OBS桶。在控制台单击“服务列表”,选择“对象存储服务 OBS”,单击进入OBS页面。该桶将作为用户上传DLI连接RDS数据库SQL文件的存储桶。 图2 OBS桶(RDS) ![查看OBS桶](./document/readme-image-002.png) 3、体验Demo样例。获取Demo数据样例文件,上传至步骤1中的OBS桶中,即可触发函数工作流自动解压文件,创建DLI数据库表并主动写入上传的数据,生成DLI连接RDS的SQL文件并自动在MySQL中创建结果表。(定制化开发请获取开源代码参考代码注释,参照函数工作流FunctionGraph定制化开发修改代码并重新部署,上传驾驶行为数据zip或tar压缩文件至OBS桶即可自动创建DLI数据库表并写入数据。) ``` 须知: 1、本方案仅支持上传压缩包,其他文件会导致本方案不能正常使用。 2、暂不支持OBS上传KMS加密的数据文件。 文件解压 压缩包的类型只支持zip和tar,压缩包文件名及其路径不能含中文。 单个压缩包解压后文件最大不超过200MB。 ``` 图3 上传驾驶行为数据文件压缩包 ![上传驾驶行为数据文件压缩包](./document/readme-image-003.png) 图4 自动解压数据文件至当前目录下 ![上传驾驶行为数据文件压缩包](./document/readme-image-004.png) 4、获取DLI连接RDS的SQL文件。查看步骤2中的OBS桶,依次单击“对象”“下载”下载文件到本地,使用记事本打开,复制文件内容。 图5 查看rds结果桶 ![查看rds结果桶](./document/readme-image-005.png) 图6 使用记事本打开 ![使用记事本打开](./document/readme-image-006.png) 5、创建同步数据表。在控制台单击“服务列表”,选择“数据湖探索 DLI”单击左侧导航栏“SQL编辑器”,代码框上部执行引擎选择“spark”,队列及数据库选择本方案创建的队列及数据库,粘贴步骤5复制的SQL文件内容,选中如图所示的SQL语句,单击“执行”创建与RDS MySQL 同步的数据表。刷新页面,即可查看数据表的创建结果。 图7 创建同步数据表 ![创建同步数据表](./document/readme-image-007.png) 图8 查看执行结果 ![查看执行结果](./document/readme-image-008.png) 6、插入数据。选中如图所示的SQL语句,单击“执行”即可插入数据到event_records表,并同步写入到RDS数据表中。 图9 插入数据 ![插入数据](./document/readme-image-009.png) 7、查看SQL作业执行状态。依次单击左侧导航栏“作业管理”“SQL作业”查看SQL作业的执行状态。(按Demo案例,如果运行时长超过2分钟状态未更新,请刷新页面查看。) 图10 查看SQL作业执行状态 ![查看SQL作业执行状态](./document/readme-image-010.png) 8、进入云数据库RDS控制台,选择本方案创建的RDS实例,单击“登录”跳转至实例管理服务DAS 实例登录界面。 图11 云数据库RDS控制台 ![云数据库RDS控制台](./document/readme-image-011.png) 9、登录实例。输入密码,勾选记住密码,开启定时采集及SQL执行记录,单击“测试连接”登录实例。 图12 登录实例 ![登录实例](./document/readme-image-012.png) 10、查询同步到数据表的数据。单击“SQL查询”,执行如下SQL语句,即可查询到经过speak SQL作业处理与DLI同步的表数据。 图13 进入SQL查询 ![进入SQL查询](./document/readme-image-013.png) 图14 执行SQL查询语句 ![执行SQL查询语句](./document/readme-image-014.png) 11、执行DLI Sprak作业SQL查询执行SQL查询。在控制台单击“服务列表”,选择“数据湖探索 DLI”单击左侧导航栏“SQL编辑器”,代码框上部执行引擎选择“spark”队列及数据库选择本方案创建的队列及数据库,单击“执行”执行以下SQL语句,对所有司机在某段时间的异常告警事件进行统计。更多SQL语法使用请参考[Spark SQL语法概览](https://support.huaweicloud.com/sqlref-spark-dli/dli_08_0219.html)。 图15 执行SQL查询 ![进入SQL查询](./document/readme-image-015.png) ```sql select driverID, carNumber, sum(isRapidlySpeedup) as rapidlySpeedupTimes, sum(isRapidlySlowdown) as rapidlySlowdownTimes, sum(isNeutralSlide) as neutralSlideTimes, sum(neutralSlideTime) as neutralSlideTimeTotal, sum(isOverspeed) as overspeedTimes, sum(overspeedTime) as overspeedTimeTotal, sum(isFatigueDriving) as fatigueDrivingTimes, sum(isHthrottleStop) as hthrottleStopTimes, sum(isOilLeak) as oilLeakTimes from event_records where time >= "2017-01-01 00:00:00" and time <= "2017-02-01 00:00:00" group by driverID, carNumber order by rapidlySpeedupTimes desc, rapidlySlowdownTimes desc, neutralSlideTimes desc, neutralSlideTimeTotal desc, overspeedTimes desc, overspeedTimeTotal desc, fatigueDrivingTimes desc, hthrottleStopTimes desc, oilLeakTimes desc ``` 12、查询结果。在查询结果中,单击 ,实现“结果图形化”。进入图形化界面后“图形类型”选择“柱状图”“X轴”选择“driverID”“Y轴”选择“rapidlySpeedupTimes”“结果数目”选择“10”展示结果如下: 图16 查看结果 ![查看结果](./document/readme-image-016.png) 图17 结果图形化 ![结果图形化](./document/readme-image-017.png) ```sql SQL语句示例: 1、查询某个司机在某个时间段的详细记录: select * from event_records where driverID = "panxian1000005" and time >= "2017-01-01 00:00:00" and time <= "2017-02-01 00:00:00" 2、查看订单信息: select * from order_records where orderNumber = "2017013013584419488" order by time desc 3、根据司机和发车时间信息查询司机的详细行驶特点: select driverID, carNumber, latitude, longitude, siteName, time from detail_records where driverID = "panxian1000005" and time > "2017-01-30 16:00:00" and siteName IS NOT NULL order by time desc ```