# exp1 **Repository Path**: sunNAU/exp1 ## Basic Information - **Project Name**: exp1 - **Description**: 大数据理论与技术基础-实验课1(k-means) - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2022-03-25 - **Last Updated**: 2024-03-25 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # exp1 ## 介绍 大数据理论与技术基础-实验课1(k-means) ## 实验目的 1. 掌握python编程环境配置,能够根据需要使用conda管理虚拟环境; 2. 掌握k-means算法,能够编程实现算法功能。 ## 实验内容 1. 配置python编程环境(不限操作系统); 2. 在环境exp1下编程实现k-means算法; 3. 基于MNIST 优化k-means算法(选做*)。 ## 实验要求 1. 配置python编程环境(不限操作系统) - 使用3.8版本python建立虚拟环境exp1; - 在exp1环境中至少安装有matplotlib和numpy两个依赖包。 2. 在环境exp1下编程实现k-means算法 - 使用IRIS数据集,完善k-means-iris.py实现功能; - 输出兰德指数随迭代次数变化曲线图; - IRIS数据集样本中包含四个属性信息,任取两维,分析聚类性能,画出数据点聚类示意图,标注对应的兰德指数。(可多次运行,取较好一次) 3. 基于MNIST 优化k-means算法(选做*) - 使用MNIST手写数字数据集,完善k-means-mnist.py实现功能; - 画出准确度指标和兰德指数随迭代次数变化曲线图; - 从聚类中心初始化、聚类中心更新方式等角度优化k-means算法迭代速度(任意角度选其一)。 ## 结果提交 1. 提交实验报告(统一命名为:学号_姓名.docx) 2. 提交源代码(删掉数据集与demo文件); 3. 代码文件夹命名为学号,且与实验报告位于同一级。