# GestureRecognitionWithDA

**Repository Path**: ninetailskim/GestureRecognitionWithDA

## Basic Information

- **Project Name**: GestureRecognitionWithDA
- **Description**: 使用Paddlehub 和 PaddleX完成数据的增广和训练~
- **Primary Language**: Unknown
- **License**: Apache-2.0
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2021-11-17
- **Last Updated**: 2022-06-28

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 使用Paddlehub 和 PaddleX完成数据的增广和训练~   
![](https://ai-studio-static-online.cdn.bcebos.com/000a703cac894fc3a9771c3c3d706ed98b6aded5e7104a2d975826d79de276e9)

大家好,我是只会心疼giegie的桨师，最近因为想做一个手势相关的小游戏，所以看了一下手势识别。但是目前搜到的数据集中，手势识别的背景都是纯色（纯白或是纯绿），一旦在验证的时候背景变得复杂，则准确率会大大降低。   
既然如此......那就来做个数据增广吧，把这些数据集里的手全都抠出来，然后贴到复杂场景里就行了。那把手抠出来......当然优先选择
**Paddlehub**  

## 模型
当然我并没有使用ace2p这种更细粒度的模型，而是使用了deeplabv3p_xception65_humanseg，不因为别的，只是因为我顺手......这个模型用得很熟练哈哈   


## 用到的数据集
手势数据集：aistudio前排手势的数据基本上都用了，因为还有背景数据，用的比较多，一个项目好像只能索引两个数据集，所以我就不引入了，以防不公平，这里把链接贴出来。
[手势识别](https://aistudio.baidu.com/aistudio/datasetdetail/23668)    
[手势](https://aistudio.baidu.com/aistudio/datasetdetail/17826)   
[gesture](https://aistudio.baidu.com/aistudio/datasetdetail/54002)   
[手势](https://aistudio.baidu.com/aistudio/datasetdetail/39037)   
[手势_石头剪头布](https://aistudio.baidu.com/aistudio/datasetdetail/41985)   
背景数据集，我直接使用的我本地的图，只有上次从ADE2K里挑出来的segsky分割出的数据了。   
[segsky](https://aistudio.baidu.com/aistudio/datasetdetail/66125)

## 任务
由于我的任务只需要检测到“5”的手势，所以这里是一个简单的2分类，区分“5”及其他   
**增广前的“5”**        
![](https://ai-studio-static-online.cdn.bcebos.com/57c5a249aab144a3987e86794bd96d9501e6b32cbd134e60a1273979fb5b6460)       
**增广后的“5”**        
![](https://ai-studio-static-online.cdn.bcebos.com/ff7ab750d023473594cfa917414425c5686f667d991f49a781f3c2819af27b56)      
**增广前的“其他”**        
![](https://ai-studio-static-online.cdn.bcebos.com/559b0061f1354e8e946c4397f36a60428b072e55053b4b5198b8450dd02fc663)      
**增广后的“其他”**     
![](https://ai-studio-static-online.cdn.bcebos.com/29fc9f825c2145e4a90a4fc3a6f180db7e34e7ccfe884d1c847e80f381dc4d5c)      
一方面为手势增加了背景，另一方面让数据变得更多了       
经过筛选，5的数据原本979张，增广后2988张       


```python
import paddlehub as hub
import cv2
import numpy as np
import glob
import os
import random
import argparse

class segUtils():
    def __init__(self):
        super().__init__()
        self.module = hub.Module(name="deeplabv3p_xception65_humanseg")

    def doseg(self, frame):
        res = self.module.segmentation(images=[frame], use_gpu=True)
        return res[0]['data']

def randomCrop(frame, h, w):
    bh, bw = frame.shape[:2]
    if bw - w > 0 and bh - h > 0:
        randx = random.randint(0, bw - w)
        randy = random.randint(0, bh - h)

        return frame[randy:randy + h,randx:randx + w]
    else:
        return cv2.resize(frame, (w, h))


def main(args):

    backlist = glob.glob(os.path.join(args.backdir, "*.jpg"))
    handlist = glob.glob(os.path.join(args.handdir, "*.png")) + glob.glob(os.path.join(args.handdir, "*.jpg"))
    print("back image: ", len(backlist))
    print("hand image: ", len(handlist))
    save_dir = args.savedir

    if not os.path.exists(save_dir):
        os.makedirs(save_dir)
        SU = segUtils()

        for handpath in handlist:
            img = cv2.imread(handpath)
            basename = os.path.basename(handpath)
            filename, ext = os.path.splitext(basename)
            mask = SU.doseg(img)
            mask[mask <= 1] = 0
            mask[mask > 1] = 1
            
            mask = np.repeat(mask[:,:,np.newaxis], 3, axis=2)
            h,w = img.shape[:2]
            for i in range(2):
                rback = cv2.imread(backlist[random.randint(0, len(backlist)-1)])
                crop = randomCrop(rback, h, w)
                res = mask * img + (1 - mask) * crop
                newname = filename + str(i) + ext
                cv2.imwrite(os.path.join(save_dir,newname), res.astype(np.uint8))

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument("--backdir", type=str, required=True)
    parser.add_argument("--handdir", type=str, required=True)
    parser.add_argument("--savedir", type=str, required=True)
    args = parser.parse_args()
    main(args)

```

## 训练
至于训练，当然是直接paddleX啦，直接用GUI版本的快速验证自己的想法啦，快速的选择分类模型，开始吧~
选择的MobileNetV3_small_ssld这个模型，batchsize32，训练了30个epoch，太过简单，就不写流程了。
![](https://ai-studio-static-online.cdn.bcebos.com/94bba78cd75b4ebf9ba6d410ce3b3a3b7a87abdbcc2148449f280f317358d09e)
![](https://ai-studio-static-online.cdn.bcebos.com/52fdcc66975840fc9ccfe20fb732168680fd97526db5471fa81acd7f884db7d4)
## 测试
一些测试结果图，效果完全OK哈哈哈   
![](https://ai-studio-static-online.cdn.bcebos.com/b95996db6dd64e1cb91c3921f3aea78042df284b76ce4e6d84523535c7972cd5)
![](https://ai-studio-static-online.cdn.bcebos.com/54697d04f95c4c7a8936512fedaaac81992503b7a3fa48358f83dbc919a97891)
![](https://ai-studio-static-online.cdn.bcebos.com/86237cdc838a4853bcaefa5551b7639f3424e941b44e400aab89ed544e4b0804)
![](https://ai-studio-static-online.cdn.bcebos.com/fa4162e0db314f0d8f680f1a3b09e7f66999fc8889bb4537affde8f49078417c)
![](https://ai-studio-static-online.cdn.bcebos.com/0af8fdb96c8d47c9ad89d22db88ac96e02fb864926a74055a060642aae0281ca)   
本地开着摄像头视频做了一些测试，效果还不错，但是忘了保存视频了，之后补上。   


```python
# 验证 上传一张test.jpg的图片进行测试吧
!python predict.py
```

## 小结:
项目使用Paddlehub来做数据增广,然后使用PaddleX来快速的训练模型验证效果.
其实这个实践只用了几个小时,主要花的时间是在挑数据,有很多增广后的数据不可用,这个和分割的模型有关系,人工筛选了一遍,但我觉得还是值得的(谁让你不用ace2p呢,这不活该吗?别骂了别骂了~)
PaddleX真好用,希望支持更多的模型吧,简直我这种懒人福音.
我是不想做趣味项目的桨师,下次再见.

# 个人简介

> 百度飞桨开发者技术专家 PPDE

> 百度飞桨官方帮帮团、答疑团成员

> 国立清华大学18届硕士

> 以前不懂事，现在只想搞钱～欢迎一起搞哈哈哈

我在AI Studio上获得至尊等级，点亮9个徽章，来互关呀！！！<br>
[https://aistudio.baidu.com/aistudio/personalcenter/thirdview/311006]( https://aistudio.baidu.com/aistudio/personalcenter/thirdview/311006)

B站ID： 玖尾妖熊

### 其他趣味项目：  
#### [熊猫头表情生成器[Wechaty+Paddlehub]](https://aistudio.baidu.com/aistudio/projectdetail/1869462)
#### [如何变身超级赛亚人(一)--帅气的发型](https://aistudio.baidu.com/aistudio/projectdetail/1180050)
#### [【AI创造营】是极客就坚持一百秒？](https://aistudio.baidu.com/aistudio/projectdetail/1609763)    
#### [在Aistudio，每个人都可以是影流之主[飞桨PaddleSeg]](https://aistudio.baidu.com/aistudio/projectdetail/1173812)       
#### [愣着干嘛？快来使用DQN划船啊](https://aistudio.baidu.com/aistudio/projectdetail/621831)    
#### [利用PaddleSeg偷天换日～](https://aistudio.baidu.com/aistudio/projectdetail/1403330)