# python-ml-learning **Repository Path**: wangyiSelf/python-ml-learning ## Basic Information - **Project Name**: python-ml-learning - **Description**: No description available - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-07-23 - **Last Updated**: 2025-07-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Python与机器学习学习路径 - Java工程师转型指南 > 作者:Java高级工程师转型ML > 目标:**6个月系统性掌握工业级机器学习能力** > 特点: > - 从Java视角对比学习Python/ML > - 强调工程化落地(模型部署、性能优化) > - 聚焦工作场景(推荐系统、异常检测等) --- ## 📚 学习路径与具体目标 ### 阶段1:Python核心(2周) | 目录 | 学习目标 | Java对比参考 | |----------------|--------------------------------------------------------------------------|-----------------------------| | 基本语法 | ✅ 掌握列表推导式/生成器表达式
✅ 理解动态类型与GC机制 | `ArrayList` vs Python List | | 函数与模块 | ✅ 熟练使用装饰器
✅ 理解`__init__.py`模块化设计 | Java注解 vs Python装饰器 | | 面向对象 | ✅ 掌握多继承与MRO
✅ 理解`@property`等高级特性 | Java接口 vs Python ABC | ### 阶段2:数学基础(3周) | 目录 | 关键知识点 | ML应用场景 | |----------------|--------------------------------------------------------------------------|-----------------------------| | 线性代数 | 🔹 矩阵分解(SVD/PCA)
🔹 张量运算(3维+) | 推荐系统协同过滤 | | 概率统计 | 🔹 贝叶斯定理
🔹 假设检验(P值) | A/B测试评估模型效果 | | 优化方法 | 🔹 梯度下降变种(Adam/RMSProp)
🔹 约束优化(Lagrangian) | 超参数调优 | ### 阶段3:机器学习(8周) | 目录 | 工程重点 | 代码实践 | |----------------|--------------------------------------------------------------------------|-----------------------------| | 特征工程 | 🔧 分箱/WOE编码
🔧 时间序列特征生成 | `sklearn-pipeline`实战 | | 模型评估 | 🔧 跨验证策略(时间序列分割)
🔧 业务指标对齐(如召回率@K) | 自定义scorer实现 | | 模型部署 | 🔧 ONNX格式转换
🔧 Java调用Python模型(JPype) | SpringBoot集成PyTorch模型 | ### 阶段4:深度学习(可选,4周) | 项目 | 关键技术栈 | 工业级技巧 | |----------------|--------------------------------------------------------------------------|-----------------------------| | 推荐系统 | 🔨 双塔模型
🔨 负采样优化 | 千万级数据分片训练 | | 异常检测 | 🔨 LSTM-AutoEncoder
🔨 在线学习更新 | Prometheus监控集成 | --- ## 🛠️ 工程化专项 ```java // Java工程师特别关注: 1. 模型服务化:SpringBoot + TensorFlow Serving 2. 性能优化:JNI加速数值计算(对比Jython) 3. 监控体系:通过Micrometer暴露模型指标