# Integrated_learning_to_optimize_KNN

**Repository Path**: ling-yuan-cccc/integrated_learning_to_optimize_knn

## Basic Information

- **Project Name**: Integrated_learning_to_optimize_KNN
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 1
- **Created**: 2024-11-02
- **Last Updated**: 2024-11-09

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 项目描述
本项目是一个机器学习模型训练和评估流程，旨在比较多种分类器的性能。项目使用Python语言编写，集成了多个流行的机器学习库，包括NumPy、scikit-learn、FAISS、XGBoost等，以实现和比较不同的分类模型。

# 运行效果
![alt text](3.png) 
![alt text](4.png)
![alt text](image.png)
# 功能
- 本项目实现了以下功能：
- 数据加载和预处理，包括L2归一化。
- 数据集划分为训练集和测试集。
- 训练和评估多种分类器，包括逻辑回归、随机森林、支持向量机（SVM）、硬投票分类器、软投票分类器、Bagging分类器、AdaBoost分类器、梯度提升分类器和XGBoost分类器。
- 记录和比较各分类器的训练时间、预测时间和准确率。
- 保存表现最佳的模型到文件。

# 依赖
本项目依赖以下库：
- numpy
- faiss
- sklearn
- logging
- pickle

# 使用
1. 安装依赖库
```bash
pip install numpy scikit-learn faiss pickle
```
2. 运行训练脚本
```bash
python train_ensumble.py
```

3. 查看训练结果
- 训练完成后，程序会输出每个模型的性能比较表格，并保存最佳模型到best_model.pkl文件中。

# 注意
- 本项目使用Python 3.x版本进行开发和测试。
- 确保在运行脚本前，已经正确安装了所有依赖库。
- 本项目中的createXY函数用于加载和预处理数据，该函数需要根据实际情况进行实现。
- 本项目中的模型参数可能需要根据具体数据集进行调整以获得最佳性能。

## 个人信息
- 学号: 202252320304
- 年级: 22
- 专业: 智能科学与技术
- 班级: 三班