diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/0C09D597F7C1E5D700D26AE9B94BFE3B.JPG" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/0C09D597F7C1E5D700D26AE9B94BFE3B.JPG" new file mode 100644 index 0000000000000000000000000000000000000000..5e674c3bb856416144a71330a7e4ff08ba082320 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/0C09D597F7C1E5D700D26AE9B94BFE3B.JPG" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/A2F4187A3416573D65CBC6E2A549D98B.JPG" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/A2F4187A3416573D65CBC6E2A549D98B.JPG" new file mode 100644 index 0000000000000000000000000000000000000000..0208c362f4afcee7e4b57ea667c7464a61bb9bc0 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/A2F4187A3416573D65CBC6E2A549D98B.JPG" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\345\217\257\350\247\206\345\214\226\346\225\260\346\215\256\351\233\206\346\270\205\346\264\227\344\273\243\347\240\201.py" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\345\217\257\350\247\206\345\214\226\346\225\260\346\215\256\351\233\206\346\270\205\346\264\227\344\273\243\347\240\201.py" new file mode 100644 index 0000000000000000000000000000000000000000..453df22503b10a9d05c443b9beb57b0f4e5db37e --- /dev/null +++ "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\345\217\257\350\247\206\345\214\226\346\225\260\346\215\256\351\233\206\346\270\205\346\264\227\344\273\243\347\240\201.py" @@ -0,0 +1,105 @@ +# -*- coding: utf-8 -*- +""" +Spyder Editor + +This is a temporary script file. +""" +import numpy as np +import pandas as pd +from pandas import DataFrame + +# 读取Excel文件 +data = pd.read_excel('C:/Users/章正康/Desktop/大数据分析与应用/RFM/PYTHON-RFM实战数据.xlsx') +data +data1=cleaned_data = data[data['订单状态'] != '付款以后用户退款成功,交易自动关闭'] +data1 +data1.to_excel('成功交易的订单.xlsx', index=False) + + +# 华东地区: +shanghai_data = data1[data1['省份'] == '上海'] +# 导出清洗后的数据为Excel文件 +shanghai_data .to_excel('上海_dataset.xlsx', index=False) + +shandong_data = data1[data1['省份'] == '山东省'] +# 导出清洗后的数据为Excel文件 +shandong_data .to_excel('山东_dataset.xlsx', index=False) + +anhui_data = data1[data1['省份'] == '安徽省'] +# 导出清洗后的数据为Excel文件 +anhui_data .to_excel('安徽_dataset.xlsx', index=False) + +zhejiang_data = data1[data1['省份'] == '浙江省'] +# 导出清洗后的数据为Excel文件 +zhejiang_data .to_excel('浙江_dataset.xlsx', index=False) + +jiangsu_data = data1[data1['省份'] == '江苏省'] +# 导出清洗后的数据为Excel文件 +jiangsu_data .to_excel('江苏_dataset.xlsx', index=False) + +fujian_data = data1[data1['省份'] == '福建省'] +# 导出清洗后的数据为Excel文件 +fujian_data .to_excel('福建_dataset.xlsx', index=False) + +# 华北地区: +# 清洗数据,只保留"省份"为"北京市"的行 +beijing_data = data[data['省份'] == '北京'] +# 导出清洗后的数据为Excel文件 +beijing_data.to_excel('北京_dataset.xlsx', index=False) + +# 清洗数据,只保留"省份"为"河北省"的行 +hebei_data = data[data['省份'] == '河北省'] +# 导出清洗后的数据为Excel文件 +hebei_data.to_excel('河北_dataset.xlsx', index=False) + +# 清洗数据,只保留"省份"为"山西省"的行 +shanxi_data = data[data['省份'] == '山西省'] +# 导出清洗后的数据为Excel文件 +shanxi_data.to_excel('山西_dataset.xlsx', index=False) + +# 清洗数据,只保留"省份"为"内蒙古自治区"的行 +neimenggu_data = data[data['省份'] == '内蒙古自治区'] +# 导出清洗后的数据为Excel文件 +neimenggu_data.to_excel('内蒙古_dataset.xlsx', index=False) + + + + +# 合并数据 +huadong_data = pd.concat([shandong_data, hebei_data, shanxi_data, zhejiang_data, fujian_data, shanghai_data]) + +# 导出合并后的数据为Excel文件 +huadong_data.to_excel('华东数据集.xlsx', index=False) + +huabei_data = pd.concat([beijing_data, hebei_data, anhui_data, neimenggu_data]) + +# 导出合并后的数据为Excel文件 +huabei_data.to_excel('华北数据集.xlsx', index=False) + + +sum_amount_shanghai = shanghai_data['实付金额'].sum() +sum_amount_shandong = shandong_data['实付金额'].sum() +sum_amount_jiangsu = jiangsu_data['实付金额'].sum() +sum_amount_anhui = anhui_data['实付金额'].sum() +sum_amount_zhejiang = zhejiang_data['实付金额'].sum() +sum_amount_fujian = fujian_data['实付金额'].sum() +sum_amount_beijing = beijing_data['实付金额'].sum() +sum_amount_hebei = hebei_data['实付金额'].sum() +sum_amount_shanxi = shanxi_data['实付金额'].sum() +sum_amount_neimenggu = neimenggu_data['实付金额'].sum() +sum_amount_huadong = huadong_data['实付金额'].sum() +sum_amount_huabei = huabei_data['实付金额'].sum() + + +print("上海的实付金额之和为:", sum_amount_shanghai) +print("山东省的实付金额之和为:", sum_amount_shandong) +print("江苏省的实付金额之和为:", sum_amount_jiangsu) +print("安徽省的实付金额之和为:", sum_amount_anhui) +print("浙江省的实付金额之和为:", sum_amount_zhejiang) +print("福建省的实付金额之和为:", sum_amount_fujian) +print("北京市的实付金额之和为:", sum_amount_beijing) +print("河北省的实付金额之和为:", sum_amount_hebei) +print("山西省的实付金额之和为:", sum_amount_shanxi) +print("内蒙古自治区的实付金额之和为:", sum_amount_neimenggu) +print("华东的实付金额之和为:", sum_amount_huadong) +print("华北的实付金额之和为:", sum_amount_huabei) diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/PYTHON-RFM\345\256\236\346\210\230\346\225\260\346\215\256.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/PYTHON-RFM\345\256\236\346\210\230\346\225\260\346\215\256.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..a95576f43dead82da811782fdd0a20bfc630325f Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/PYTHON-RFM\345\256\236\346\210\230\346\225\260\346\215\256.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\206\205\350\222\231\345\217\244_dataset.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\206\205\350\222\231\345\217\244_dataset.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..12df7bd6c1e0a3d61c0dc0a6a77f3418727b6e87 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\206\205\350\222\231\345\217\244_dataset.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\214\227\344\272\254_dataset.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\214\227\344\272\254_dataset.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..525c5ecd9475f7c4c698f93040484610382e86cd Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\214\227\344\272\254_dataset.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\215\216\344\270\234\346\225\260\346\215\256\351\233\206.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\215\216\344\270\234\346\225\260\346\215\256\351\233\206.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..9a724715c78cabf09bd68fcfa4af9a1dd800a811 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\215\216\344\270\234\346\225\260\346\215\256\351\233\206.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\215\216\345\214\227\346\225\260\346\215\256\351\233\206.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\215\216\345\214\227\346\225\260\346\215\256\351\233\206.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..0653878a27ca9ce71967a25f0ccfa92da9ef9f8d Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\215\216\345\214\227\346\225\260\346\215\256\351\233\206.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\256\211\345\276\275_dataset.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\256\211\345\276\275_dataset.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..e5f1e1213cbe682226cc95403fae935cf02a3a31 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\256\211\345\276\275_dataset.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\261\261\344\270\234_dataset.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\261\261\344\270\234_dataset.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..ad773a43b5540d505d9df6e3f49063890366396c Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\345\261\261\344\270\234_dataset.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\346\210\220\345\212\237\344\272\244\346\230\223\347\232\204\350\256\242\345\215\225.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\346\210\220\345\212\237\344\272\244\346\230\223\347\232\204\350\256\242\345\215\225.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..cf9aa378f3518768bda6f0d54077a4ea4a8a8d17 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\346\210\220\345\212\237\344\272\244\346\230\223\347\232\204\350\256\242\345\215\225.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\346\261\237\350\213\217_dataset.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\346\261\237\350\213\217_dataset.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..088b2c8763e41fbf3eb4e2b3d741287c197f51b0 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\346\261\237\350\213\217_dataset.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\346\262\263\345\214\227_dataset.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\346\262\263\345\214\227_dataset.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..8d12755dee96fda8657046ed39d767f4fb9909aa Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\346\262\263\345\214\227_dataset.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\347\246\217\345\273\272_dataset.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\347\246\217\345\273\272_dataset.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..2634a01e4a055c688e220255095bcb9fed048bf2 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\346\225\260\346\215\256\351\233\206/\347\246\217\345\273\272_dataset.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\351\241\271\347\233\256\350\257\264\346\230\216.doc" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\351\241\271\347\233\256\350\257\264\346\230\216.doc" new file mode 100644 index 0000000000000000000000000000000000000000..79d61612acf54945372a89c65a4fba18e2760154 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/cs210202/\351\241\271\347\233\256\350\257\264\346\230\216.doc" differ