diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/.keep" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/.keep" new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\344\272\272\346\254\241\347\273\237\350\256\241.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\344\272\272\346\254\241\347\273\237\350\256\241.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..1d2f369f1726d9ee546ab34217cacfe36b0169f6 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\344\272\272\346\254\241\347\273\237\350\256\241.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\346\200\273\345\234\272\346\254\241.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\346\200\273\345\234\272\346\254\241.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..00125dd9131616a940b2ddb0098eac6306346826 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\346\200\273\345\234\272\346\254\241.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\347\232\204\346\200\273\347\245\250\346\210\277.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\347\232\204\346\200\273\347\245\250\346\210\277.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..37716dd74dcd53578af21759080845647cf21baa Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\347\232\204\346\200\273\347\245\250\346\210\277.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\347\245\250\346\210\277\346\200\273\350\256\241.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\347\245\250\346\210\277\346\200\273\350\256\241.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..92a5e34bab1726b43f872c0480b26df87356ae70 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1-10.7\347\245\250\346\210\277\346\200\273\350\256\241.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\344\272\272\346\254\241.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\344\272\272\346\254\241.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..f73271d987e8a659a2e04abfe55427cac3236626 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\344\272\272\346\254\241.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\345\234\272\346\254\241.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\345\234\272\346\254\241.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..5c8b17e20187b865290e5c0f2ec5f69a512f747c Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\345\234\272\346\254\241.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\345\275\261\351\231\242\347\245\250\346\210\277.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\345\275\261\351\231\242\347\245\250\346\210\277.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..709bba3225b0ba57a98fad939bee821f23c2e9f0 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\345\275\261\351\231\242\347\245\250\346\210\277.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\347\232\204\347\245\250\346\210\277\346\216\222\345\220\215.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\347\232\204\347\245\250\346\210\277\346\216\222\345\220\215.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..4857fc5a31f44193e7901962dd585d92c87060e1 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\347\232\204\347\245\250\346\210\277\346\216\222\345\220\215.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\347\245\250\346\210\277.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\347\245\250\346\210\277.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..172f3527b6b04a122862a0954459c0e800238ccf Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10.1\347\245\250\346\210\277.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10\346\234\210\346\200\273\345\234\272\346\254\241.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10\346\234\210\346\200\273\345\234\272\346\254\241.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..26a5102f9e9a830e5341e8aea921a62d1fbd643c Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10\346\234\210\346\200\273\345\234\272\346\254\241.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10\346\234\210\346\200\273\347\245\250\346\210\277.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10\346\234\210\346\200\273\347\245\250\346\210\277.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..db89974e3b14c8662b3abad6937100ca61d8c365 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10\346\234\210\346\200\273\347\245\250\346\210\277.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10\346\234\210\346\200\273\350\247\202\345\275\261\344\272\272\346\254\241.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10\346\234\210\346\200\273\350\247\202\345\275\261\344\272\272\346\254\241.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..ce4313d4a8a04949de82f1e7ebd1d7c635c19220 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/10\346\234\210\346\200\273\350\247\202\345\275\261\344\272\272\346\254\241.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\345\237\216\345\270\202\347\245\250\346\210\277\346\216\222\345\220\215.xlsx" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\345\237\216\345\270\202\347\245\250\346\210\277\346\216\222\345\220\215.xlsx" new file mode 100644 index 0000000000000000000000000000000000000000..076d9878de4446512e0e69c1cc4ea89dce6c8387 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\345\237\216\345\270\202\347\245\250\346\210\277\346\216\222\345\220\215.xlsx" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\345\260\217\347\273\204\345\210\206\345\267\245.txt" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\345\260\217\347\273\204\345\210\206\345\267\245.txt" new file mode 100644 index 0000000000000000000000000000000000000000..b80e6687d0b8241d2c40984034fac6ba98d14143 --- /dev/null +++ "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\345\260\217\347\273\204\345\210\206\345\267\245.txt" @@ -0,0 +1,4 @@ +刘正阳:项目说明 +刘俊宇,田毛团:数据集,数据整理 +孙康:截图 +贺灵杰:代码 diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\351\241\271\347\233\256\344\273\243\347\240\201.txt" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\351\241\271\347\233\256\344\273\243\347\240\201.txt" new file mode 100644 index 0000000000000000000000000000000000000000..8e519210cc0d0f7b901850594230ee7fdbe35735 --- /dev/null +++ "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\351\241\271\347\233\256\344\273\243\347\240\201.txt" @@ -0,0 +1,62 @@ +import numpy as np +import pandas as pd +import os + +#读取Excel文件 +df = pd.read_excel('D:/Program Files/Lenovo/FusionEngine/开源项目代码.xlsx') + +# 去除重复值 +df.drop_duplicates(inplace=True) + +#使用0填充缺失值 +df.fillna(0, inplace=True) + +# 使用Z-Score方法处理异常值 +z_scores = (df - df.mean()) / df.std() +df = df[(z_scores.abs() < 3).all(axis=1)] + +# 将'日期'列转换为月份 +df['日期'] = pd.to_datetime(df['日期']).dt.month + +#计算'当日人次'和'当日票房'的累计和 +df['月度总观影人数'] = df['当日人次'].cumsum() +df['月度总票房'] = df['当日票房'].cumsum() + +#创建文件夹 +folders = ['月度总场次', '日期票房人次', '场次当日票房', '当日人次', '月度总观影人数', '月度总票房', '城市'] +for folder in folders: + if not os.path.exists(folder): + os.makedirs(folder) + +#检查缺失值 +missing_values = df.isnull().sum() +print("每个字段的缺失值:") +print(missing_values) + +#检查异常值 +outliers = (df - df.mean()) / df.std() +outliers = outliers.abs() > 3 # 以3个标准差为阈值判断异常值 +print("每个字段的异常值:") +print(outliers) + +#保存数据到文件 +for index, row in df.iterrows(): + for folder in folders: + if folder == '月度总场次': + save_path = os.path.join("D:/Program Files/Lenovo/FusionEngine/月度总场次", f'{row["月度总场次"]}.txt') + elif folder == '日期票房人次': + save_path = os.path.join("D:/Program Files/Lenovo/FusionEngine/月度总场次", f'{row["日期"]}-{row["票房人次"]}.txt') + elif folder == '场次当日票房': + save_path = os.path.join("D:/Program Files/Lenovo/FusionEngine/月度总场次", f'{row["场次"]}-{row["当日票房"]}.txt') + elif folder == '当日人次': + save_path = os.path.join("D:/Program Files/Lenovo/FusionEngine/月度总场次", f'{row["日期"]}-{row["当日人次"]}.txt') + elif folder == '月度总观影人数': + save_path = os.path.join("D:/Program Files/Lenovo/FusionEngine/月度总观影人数", f'{row["月度总观影人数"]}.txt') + elif folder == '月度总票房': + save_path = os.path.join("D:/Program Files/Lenovo/FusionEngine/月度总票房", f'{row["月度总票房"]}.txt') + elif folder == '城市': + save_path = os.path.join("D:/Program Files/Lenovo/FusionEngine/城市", f'{row["城市"]}.txt') + with open(save_path, 'w', encoding='utf-8') as f: + f.write(str(row)) + + diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\351\241\271\347\233\256\346\210\252\345\233\276.png" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\351\241\271\347\233\256\346\210\252\345\233\276.png" new file mode 100644 index 0000000000000000000000000000000000000000..5acd974aea8972ea562700767f842c7f35684e13 Binary files /dev/null and "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\351\241\271\347\233\256\346\210\252\345\233\276.png" differ diff --git "a/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\351\241\271\347\233\256\350\257\264\346\230\216.txt" "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\351\241\271\347\233\256\350\257\264\346\230\216.txt" new file mode 100644 index 0000000000000000000000000000000000000000..616182b7832f045fc0ac7e870f2336278932d87b --- /dev/null +++ "b/03-\350\257\276\347\250\213\345\256\236\351\252\214/CS2102009\345\217\257\350\247\206\345\214\226\345\244\247\345\261\217/\351\241\271\347\233\256\350\257\264\346\230\216.txt" @@ -0,0 +1,27 @@ +项目说明:中国电影票房数据可视化 + +项目背景: +中国电影市场快速增长,成为全球最大的电影市场之一,电影票房数据的分析和可视化对电影产业的发展和决策具有重要意义。本项目旨在收集、分析和可视化中国电影票房数据,以便深入了解电影市场的发展趋势,制定有效的市场策略。 + +项目目标: +收集中国电影票房数据,包括电影类型、上映时间、票房收入等信息,并进行数据清洗和整合。 +利用数据分析工具对票房数据进行统计分析,挖掘电影市场的发展特点和规律。 +通过数据可视化技术,将分析结果呈现为直观的图表、地图等形式,以便决策者和公众更好地理解电影市场的现状和未来趋势。 + +项目实施步骤: +数据收集:通过公开渠道获取中国电影票房数据,包括各电影的上映时间、类型、票房收入等信息。 +数据清洗和整合:对获取的数据进行清洗和整理,剔除错误数据和缺失值,将不同数据源的信息进行整合。 +数据分析:利用数据分析工具进行票房数据的统计分析,包括不同类型电影的票房收入对比、不同时间段的票房变化趋势等。 +数据可视化:运用可视化工具(如Tableau、Power BI等)将分析结果呈现为直观的图表、地图等形式,以便观众更好地理解电影市场的现状和未来趋势。 + +项目成果: +生成包括图表、地图等在内的多种可视化呈现形式,展现中国电影票房数据的分析结果。 +形成数据分析报告,总结电影市场的发展趋势,并提出对策建议。 + +项目所需资源: +电影票房数据来源渠道、数据分析工具、可视化工具、数据分析人员等。 + +项目风险和挑战: +数据质量可能影响分析结果的准确性和可靠性。 +市场变化和政策调整可能对分析结果产生影响。 +不同数据源的数据格式可能存在差异,导致数据整合困难。 \ No newline at end of file diff --git "a/\351\241\271\347\233\256\344\273\243\347\240\201.py" "b/\351\241\271\347\233\256\344\273\243\347\240\201.py" new file mode 100644 index 0000000000000000000000000000000000000000..e3c43825f913c2a9c62e669ba0b812d99ab76dad Binary files /dev/null and "b/\351\241\271\347\233\256\344\273\243\347\240\201.py" differ