# python-ml-learning
**Repository Path**: wangyiSelf/python-ml-learning
## Basic Information
- **Project Name**: python-ml-learning
- **Description**: No description available
- **Primary Language**: Python
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-07-23
- **Last Updated**: 2025-07-23
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# Python与机器学习学习路径 - Java工程师转型指南
> 作者:Java高级工程师转型ML
> 目标:**6个月系统性掌握工业级机器学习能力**
> 特点:
> - 从Java视角对比学习Python/ML
> - 强调工程化落地(模型部署、性能优化)
> - 聚焦工作场景(推荐系统、异常检测等)
---
## 📚 学习路径与具体目标
### 阶段1:Python核心(2周)
| 目录 | 学习目标 | Java对比参考 |
|----------------|--------------------------------------------------------------------------|-----------------------------|
| 基本语法 | ✅ 掌握列表推导式/生成器表达式
✅ 理解动态类型与GC机制 | `ArrayList` vs Python List |
| 函数与模块 | ✅ 熟练使用装饰器
✅ 理解`__init__.py`模块化设计 | Java注解 vs Python装饰器 |
| 面向对象 | ✅ 掌握多继承与MRO
✅ 理解`@property`等高级特性 | Java接口 vs Python ABC |
### 阶段2:数学基础(3周)
| 目录 | 关键知识点 | ML应用场景 |
|----------------|--------------------------------------------------------------------------|-----------------------------|
| 线性代数 | 🔹 矩阵分解(SVD/PCA)
🔹 张量运算(3维+) | 推荐系统协同过滤 |
| 概率统计 | 🔹 贝叶斯定理
🔹 假设检验(P值) | A/B测试评估模型效果 |
| 优化方法 | 🔹 梯度下降变种(Adam/RMSProp)
🔹 约束优化(Lagrangian) | 超参数调优 |
### 阶段3:机器学习(8周)
| 目录 | 工程重点 | 代码实践 |
|----------------|--------------------------------------------------------------------------|-----------------------------|
| 特征工程 | 🔧 分箱/WOE编码
🔧 时间序列特征生成 | `sklearn-pipeline`实战 |
| 模型评估 | 🔧 跨验证策略(时间序列分割)
🔧 业务指标对齐(如召回率@K) | 自定义scorer实现 |
| 模型部署 | 🔧 ONNX格式转换
🔧 Java调用Python模型(JPype) | SpringBoot集成PyTorch模型 |
### 阶段4:深度学习(可选,4周)
| 项目 | 关键技术栈 | 工业级技巧 |
|----------------|--------------------------------------------------------------------------|-----------------------------|
| 推荐系统 | 🔨 双塔模型
🔨 负采样优化 | 千万级数据分片训练 |
| 异常检测 | 🔨 LSTM-AutoEncoder
🔨 在线学习更新 | Prometheus监控集成 |
---
## 🛠️ 工程化专项
```java
// Java工程师特别关注:
1. 模型服务化:SpringBoot + TensorFlow Serving
2. 性能优化:JNI加速数值计算(对比Jython)
3. 监控体系:通过Micrometer暴露模型指标