# NDmachinelearning **Repository Path**: anjiang2020_admin/ndmachinelearning ## Basic Information - **Project Name**: NDmachinelearning - **Description**: 资料同步 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2021-07-07 - **Last Updated**: 2021-08-11 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # NDmachinelearning #### 介绍 资料同步 #### 所需安装软件 ``` 需要的软件: miniconda3 安装办法参考:https://www.jianshu.com/p/91365f343585/ 然后再miniconda3内,再接着安装一下软件包: Package Version ---------------------- ------------------- antiorm 1.2.1 beautifulsoup4 4.9.3 brotlipy 0.7.0 bs4 0.0.1 certifi 2020.6.20 cffi 1.14.3 chardet 3.0.4 click 8.0.1 conda 4.9.2 conda-package-handling 1.7.2 cryptography 3.2.1 cycler 0.10.0 Cython 0.29.22 db 0.1.1 decorator 4.4.2 dlib 19.21.1 easydict 1.9 einops 0.3.0 Flask 2.0.1 idna 2.10 imageio 2.9.0 imgaug 0.4.0 imutils 0.5.4 itsdangerous 2.0.1 Jinja2 3.0.1 joblib 1.0.1 kiwisolver 1.3.1 lmdb 1.2.1 MarkupSafe 2.0.1 matplotlib 3.3.4 msgpack 1.0.2 networkx 2.5.1 numpy 1.20.1 opencv-python 4.5.1.48 pandas 1.2.2 Pillow 8.1.0 pip 20.2.4 progressbar 2.5 protobuf 3.15.6 pycosat 0.6.3 pycparser 2.20 pyOpenSSL 19.1.0 pyparsing 2.4.7 PySocks 1.7.1 python-dateutil 2.8.1 pytz 2021.1 PyWavelets 1.1.1 PyYAML 5.4.1 requests 2.24.0 ruamel-yaml 0.15.87 scikit-image 0.18.1 scikit-learn 0.24.1 scipy 1.6.1 selenium 3.141.0 setuptools 50.3.1.post20201107 Shapely 1.7.1 six 1.15.0 sklearn 0.0 soupsieve 2.2 tensorboardX 2.1 threadpoolctl 2.1.0 tifffile 2021.4.8 torch 1.8.1 torchtext 0.9.1 torchvision 0.8.2 tqdm 4.51.0 typing-extensions 3.7.4.3 urllib3 1.25.11 Werkzeug 2.0.1 wheel 0.35.1 notebook 5.7.10 ``` #### 使用说明 后续更新课程资料 #### 第三章课后作业: ![输入图片说明](http://www.imlarger.com:8090/fileop/media/img/IMG_0912.jpg "在这里输入图片标题") ``` 1 【必做】以我们上课使用的10个考勤数据为训练数据集,使用KNN方法对其进行二分类,并给出训练集上的Accuracy. 要求:可以用sklearn库,也可以根据原理写,也可以使用老师给的代码来改。 参考:https://gitee.com/anjiang2020_admin/ndmachinelearning/blob/master/code_20210718/KNN/KNN.ipynb 提交:你的二分类代码,跑出accuracy的截图。 2 【选做】以我们上课使用的10个考勤数据为训练数据集,使用Logistic regression方法对其进行分类, 并给出训练集上的Accuracy,绘制ROC曲线,并给出AUC. 要求:最好按照原理写。 参考:https://gitee.com/anjiang2020_admin/ndmachinelearning/blob/master/code_20210718/logisticRegression逻辑斯特回归分类模型/LogisticRegression.ipynb 3 【选做】以我们上课使用的10个考勤数据为训练数据集,使用ID3决策树的方法对其进行二分类, 并给出训练集上的Accuracy,模型对正例的召回率和精确率,并给出一个合适的阈值。 要求:最好按照原理写。 参考:https://gitee.com/anjiang2020_admin/ndmachinelearning/blob/master/code_20210718/DescisonTree/DecisionTreeClassifier.ipynb 4 【选做】以我们上课使用的10个考勤数据为训练数据集,使用GBDT方法对其进行二分类, 并给出训练集上的Accuracy,模型对正例的召回率和精确率,然后给出对二分类其最有价值的两个特征。 要求:最好按照原理写。 按照原理写的参考:https://gitee.com/anjiang2020_admin/ndmachinelearning/tree/master/code_20210725/gbdt/GBDT_Simple_Tutorial/ 使用库的参考:https://gitee.com/anjiang2020_admin/ndmachinelearning/blob/master/code_20210725/xgbdt/TextClassification/GBDT.py ``` #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)