diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/.keep" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/.keep" new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\344\273\243\347\240\201/.keep" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\344\273\243\347\240\201/.keep" new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\344\273\243\347\240\201/data-process.py" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\344\273\243\347\240\201/data-process.py" new file mode 100644 index 0000000000000000000000000000000000000000..3360f9badd598db37b6d8d14145dded2c450ecfa --- /dev/null +++ "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\344\273\243\347\240\201/data-process.py" @@ -0,0 +1,64 @@ +#!/usr/bin/env python +# coding: utf-8 + +# In[2]: + + +import pandas as pd +import numpy as np +import matplotlib.pyplot as plt +import matplotlib as mpl +from IPython.display import Image +import time +import warnings +warnings.filterwarnings('ignore') +#%matplotlib inline +mpl.rcParams['font.sans-serif']=['SimHei'] #设置字体样式以正常显示中文标签 +mpl.rcParams['axes.unicode_minus']=False #设置正常显示字符 + + +# In[5]: + + +# 1.商品销售排行榜 +df = pd.read_csv(r'C:\Users\lanxi\pyProject\KaiYuan\day_cosmetic.csv',encoding="ansi") +data = df.groupby('商品编号')['金额'].sum() +data = data.to_frame() +data.to_csv('data1.csv', encoding='ansi') + + +# In[7]: + + +# 3.总销售额 +df = pd.read_csv(r'C:\Users\lanxi\pyProject\KaiYuan\day_cosmetic.csv',encoding="ansi") +data = df.groupby('商品编号')['金额', '订购数量'].sum() +data.to_csv('data3.csv', encoding='ansi') + + +# In[11]: + + +# 6.统计客户的性别比例 +df = pd.read_csv(r'C:\Users\lanxi\pyProject\KaiYuan\user_loss.csv',encoding="ansi") +data = df['SEX'].value_counts() +data.to_frame() +data.to_csv('data6.csv', encoding='ansi') + + +# In[13]: + + +# 7. 统计客户的年龄区间 +df = pd.read_csv(r'C:\Users\lanxi\pyProject\KaiYuan\user_loss.csv',encoding="ansi") +bins = [0, 18, 25, 35, 45, 55, 65, float('inf')] +data = pd.cut(df['AGE'], bins=bins, right=False).value_counts(sort=False) +data.to_frame() +data.to_csv('data7.csv', encoding='ansi') + + +# In[ ]: + + + + diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\344\273\243\347\240\201/open_test.py" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\344\273\243\347\240\201/open_test.py" new file mode 100644 index 0000000000000000000000000000000000000000..75fae84f8b282dfce5fcdf45698a91aebb0cdd09 --- /dev/null +++ "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\344\273\243\347\240\201/open_test.py" @@ -0,0 +1,29 @@ +# -*- coding: utf-8 -*- +""" +Created on Wed Nov 15 19:25:03 2023 + +@author: li +""" + +import pandas as pd +import numpy as np +from pandas import read_csv +import matplotlib.pyplot as plt +import matplotlib as mpl +from IPython.display import Image +import time +import warnings +warnings.filterwarnings('ignore') +#%matplotlib inline +mpl.rcParams['font.sans-serif']=['SimHei'] #设置字体样式以正常显示中文标签 +mpl.rcParams['axes.unicode_minus']=False #设置正常显示字符 +df = read_csv('D:/Desktop/working/数据科学与大数据分析/day_cosmetic1.csv',encoding="gb18030") +a2=df.groupby('所在省份')['金额'].sum() #地域分布 +a2.to_excel(r"Data1.xlsx",index=True,header=True) + +a4 = df.groupby(by=['月份'],as_index=False)['订购数量'].agg('count') #订单趋势 +a4.to_excel(r"Data2.xlsx",index=True,header=True) + +a5=df.loc[df['所在省份']=='江苏'].groupby('所在地市')['订购数量'].sum() #购买量最大的省份的各市销量排行 +a5.to_excel(r"Data3.xlsx",index=True,header=True) + diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\345\275\225\345\261\217/.keep" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\345\275\225\345\261\217/.keep" new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\345\275\225\345\261\217/202311181739.mp4" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\345\275\225\345\261\217/202311181739.mp4" new file mode 100644 index 0000000000000000000000000000000000000000..f40cd8008c915f789102c8a1730721b29ffa45e1 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\345\275\225\345\261\217/202311181739.mp4" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/.keep" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/.keep" new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/Data2.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/Data2.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..0835c418b57d93d93d14ec17fddfe251986dfd28 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/Data2.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/Data4.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/Data4.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..24961b7ae5ea26671b37cbb7631d6059ca1066d5 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/Data4.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/Data5.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/Data5.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..f028e72a4088b8821af4215afa9b6d3ea4e0f40a Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/Data5.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data1.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data1.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..84110c7aa67c7bbcb6d573c36002f657b6ab492e Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data1.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data3.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data3.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..66989334f323cdd1e31c8dd7b6779ce7f114b770 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data3.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data6.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data6.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..41088ea8994f5047dffcfe243dfeadc626acf2b4 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data6.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data7.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data7.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..76e06317fc390211915eeb2cc12e4f0739435cab Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\346\225\260\346\215\256/data7.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\350\257\264\346\230\216.docx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\350\257\264\346\230\216.docx" new file mode 100644 index 0000000000000000000000000000000000000000..125902725448ccd249d944383a11875a6aba3a46 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2101012/\351\241\271\347\233\256\350\257\264\346\230\216.docx" differ