# DataCraftsman **Repository Path**: yangpBigData/data-craftsman ## Basic Information - **Project Name**: DataCraftsman - **Description**: 个人技术成长作品集|6年大数据与安全领域实践沉淀|合规编码|工程师能力全景展示 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-02-03 - **Last Updated**: 2026-02-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # DataCraftsman(数据工匠)✨ > 个人技术成长作品集|合规编码实践|数据工程师能力全景展示 > *Code with Compliance, Grow with Confidence* [![技术栈](https://img.shields.io/badge/技术栈-Python%20%7C%20Java%20%7C%20Spark%20%7C%20Flink-blue)](docs/03-技术成长路线图.md) [![合规实践](https://img.shields.io/badge/合规-《数据安全法》落地-green)](docs/01-数据安全合规实践指南.md) [![LICENSE](https://img.shields.io/badge/LICENSE-MIT-orange)](LICENSE) [![Gitee Pages](https://img.shields.io/badge/Gitee-Pages-brightgreen)](https://your-username.gitee.io/datacraftsman) ## 🌱 项目初心 本项目是作者6年数据工程领域的技术沉淀与成长记录,聚焦: - ✅ **技术深度**:从基础语法到湖仓架构的完整实践 - ✅ **工程素养**:企业级文档规范、代码注释、架构设计 - ✅ **行业责任**:将《数据安全法》《个人信息保护法》融入技术实践 - ✅ **持续成长**:每个模块含个人复盘与改进方向 ## 🗺️ 能力全景图 ```mermaid flowchart LR subgraph "🧱 核心能力" A[编程基础] --> B[语言核心
Python/Java] B --> C[大数据处理
Spark/Flink] end subgraph "🔒 安全与合规" C --> D[安全编码
脱敏/加密/防注入] C --> E[湖仓架构
Delta Lake/Iceberg] D --> F[合规实践
《数安法》《个保法》落地] E --> F end subgraph "🌱 成长与成果" F --> G[作品集案例] G --> H[技术复盘] H --> I[持续进化] end classDef core fill:#e6f7ff,stroke:#1890ff,stroke-width:2px classDef security fill:#fff7e6,stroke:#fa8c16,stroke-width:2px classDef growth fill:#f6ffed,stroke:#52c41a,stroke-width:2px class A,B,C core class D,E,F security class G,H,I growth ``` ## 📂 核心模块 | 模块 | 说明 | 亮点 | |------|------|------| | `python/` | Python全栈实践 | 含PEP8规范+安全编码模板+合规注释 | | `java/` | Java企业级实践 | OWASP安全编码示例+设计模式应用 | | `data_lakehouse/` | 湖仓一体架构 | Delta Lake/Iceberg实战+治理方案 | | `portfolio_cases/` | 作品集核心案例 | 完整项目文档+技术复盘+架构图 | | `docs/` | 技术沉淀文档 | 合规指南+成长路线图+面试指南 | | `tools/` | 工程效率工具 | 数据分类分级工具+代码合规检查器 | ## 🌟 作品集亮点 ### 🔒 合规编码深度实践 - 每段敏感操作代码含法律依据注释(《数据安全法》第21条、《个保法》第51条) - 脱敏工具严格遵循《GB/T 35273-2020》《JR/T 0197-2020》等行业标准 - 所有示例数据均为脱敏模拟数据,无真实个人信息 ### 📚 企业级文档规范 - 需求背景 → 技术方案 → 架构设计 → 交付物清单 → 个人复盘 - 完整呈现工程师思考全过程,非单纯代码堆砌 - 文档结构可直接用于企业项目交付参考 ### 💡 成长型技术叙事 - 每个项目含`reflection.md`:记录技术收获、不足与改进方向 - `docs/03-技术成长路线图.md`:清晰展示能力进化路径 - 体现“技术+责任”双维度成长 ## 📌 如何使用本作品集 | 使用场景 | 推荐路径 | 价值点 | |----------|----------|--------| | **技术面试** | `portfolio_cases/` → `docs/04-面试作品集使用指南.md` | 展示技术深度+工程素养+合规意识 | | **能力提升** | `docs/03-技术成长路线图.md` → 对应代码模块 | 系统化查漏补缺 | | **同行交流** | 提交Issue分享见解 | 促进技术成长(非商业合作) | | **文档参考** | `docs/02-项目文档规范.md` | 学习企业级文档标准 | ## 🌍 在线访问 - **文档站**:[https://your-username.gitee.io/datacraftsman](https://your-username.gitee.io/datacraftsman) (启用Gitee Pages后,`docs/`目录自动转为静态网站) - **架构图集**:[docs/architecture_diagrams/](docs/architecture_diagrams/) - **案例详情**:[portfolio_cases/case_security_log_analysis/](portfolio_cases/case_security_log_analysis/) ## 🤝 参与共建 本项目为**个人技术成长记录**,欢迎通过以下方式交流: - 💡 提交Issue:分享技术见解或建议(请标注【技术交流】) - 📝 提交PR:修正文档笔误或补充学习资源(需符合项目定位) - ⭐ 点亮Star:鼓励持续更新(您的支持是我前进的动力) > **重要声明**: > 1. 本项目所有内容仅用于技术学习与交流 > 2. 代码示例中的法律条款注释仅供参考,具体合规要求请以最新法规为准 > 3. 严禁将本项目用于任何商业用途或冒充原创作品 > 4. 感谢开源社区,致敬每一位认真写代码的工程师 🙏 ## 📜 开源许可 本项目采用 [MIT 许可证](LICENSE) - 欢迎学习、交流、改进 --- > © 2026 南辞. 个人技术成长作品集,持续更新中... > *让代码有温度,让技术有责任* 🌱