# DataCraftsman
**Repository Path**: yangpBigData/data-craftsman
## Basic Information
- **Project Name**: DataCraftsman
- **Description**: 个人技术成长作品集|6年大数据与安全领域实践沉淀|合规编码|工程师能力全景展示
- **Primary Language**: Unknown
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-02-03
- **Last Updated**: 2026-02-03
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# DataCraftsman(数据工匠)✨
> 个人技术成长作品集|合规编码实践|数据工程师能力全景展示
> *Code with Compliance, Grow with Confidence*
[](docs/03-技术成长路线图.md)
[](docs/01-数据安全合规实践指南.md)
[](LICENSE)
[](https://your-username.gitee.io/datacraftsman)
## 🌱 项目初心
本项目是作者6年数据工程领域的技术沉淀与成长记录,聚焦:
- ✅ **技术深度**:从基础语法到湖仓架构的完整实践
- ✅ **工程素养**:企业级文档规范、代码注释、架构设计
- ✅ **行业责任**:将《数据安全法》《个人信息保护法》融入技术实践
- ✅ **持续成长**:每个模块含个人复盘与改进方向
## 🗺️ 能力全景图
```mermaid
flowchart LR
subgraph "🧱 核心能力"
A[编程基础] --> B[语言核心
Python/Java]
B --> C[大数据处理
Spark/Flink]
end
subgraph "🔒 安全与合规"
C --> D[安全编码
脱敏/加密/防注入]
C --> E[湖仓架构
Delta Lake/Iceberg]
D --> F[合规实践
《数安法》《个保法》落地]
E --> F
end
subgraph "🌱 成长与成果"
F --> G[作品集案例]
G --> H[技术复盘]
H --> I[持续进化]
end
classDef core fill:#e6f7ff,stroke:#1890ff,stroke-width:2px
classDef security fill:#fff7e6,stroke:#fa8c16,stroke-width:2px
classDef growth fill:#f6ffed,stroke:#52c41a,stroke-width:2px
class A,B,C core
class D,E,F security
class G,H,I growth
```
## 📂 核心模块
| 模块 | 说明 | 亮点 |
|------|------|------|
| `python/` | Python全栈实践 | 含PEP8规范+安全编码模板+合规注释 |
| `java/` | Java企业级实践 | OWASP安全编码示例+设计模式应用 |
| `data_lakehouse/` | 湖仓一体架构 | Delta Lake/Iceberg实战+治理方案 |
| `portfolio_cases/` | 作品集核心案例 | 完整项目文档+技术复盘+架构图 |
| `docs/` | 技术沉淀文档 | 合规指南+成长路线图+面试指南 |
| `tools/` | 工程效率工具 | 数据分类分级工具+代码合规检查器 |
## 🌟 作品集亮点
### 🔒 合规编码深度实践
- 每段敏感操作代码含法律依据注释(《数据安全法》第21条、《个保法》第51条)
- 脱敏工具严格遵循《GB/T 35273-2020》《JR/T 0197-2020》等行业标准
- 所有示例数据均为脱敏模拟数据,无真实个人信息
### 📚 企业级文档规范
- 需求背景 → 技术方案 → 架构设计 → 交付物清单 → 个人复盘
- 完整呈现工程师思考全过程,非单纯代码堆砌
- 文档结构可直接用于企业项目交付参考
### 💡 成长型技术叙事
- 每个项目含`reflection.md`:记录技术收获、不足与改进方向
- `docs/03-技术成长路线图.md`:清晰展示能力进化路径
- 体现“技术+责任”双维度成长
## 📌 如何使用本作品集
| 使用场景 | 推荐路径 | 价值点 |
|----------|----------|--------|
| **技术面试** | `portfolio_cases/` → `docs/04-面试作品集使用指南.md` | 展示技术深度+工程素养+合规意识 |
| **能力提升** | `docs/03-技术成长路线图.md` → 对应代码模块 | 系统化查漏补缺 |
| **同行交流** | 提交Issue分享见解 | 促进技术成长(非商业合作) |
| **文档参考** | `docs/02-项目文档规范.md` | 学习企业级文档标准 |
## 🌍 在线访问
- **文档站**:[https://your-username.gitee.io/datacraftsman](https://your-username.gitee.io/datacraftsman)
(启用Gitee Pages后,`docs/`目录自动转为静态网站)
- **架构图集**:[docs/architecture_diagrams/](docs/architecture_diagrams/)
- **案例详情**:[portfolio_cases/case_security_log_analysis/](portfolio_cases/case_security_log_analysis/)
## 🤝 参与共建
本项目为**个人技术成长记录**,欢迎通过以下方式交流:
- 💡 提交Issue:分享技术见解或建议(请标注【技术交流】)
- 📝 提交PR:修正文档笔误或补充学习资源(需符合项目定位)
- ⭐ 点亮Star:鼓励持续更新(您的支持是我前进的动力)
> **重要声明**:
> 1. 本项目所有内容仅用于技术学习与交流
> 2. 代码示例中的法律条款注释仅供参考,具体合规要求请以最新法规为准
> 3. 严禁将本项目用于任何商业用途或冒充原创作品
> 4. 感谢开源社区,致敬每一位认真写代码的工程师 🙏
## 📜 开源许可
本项目采用 [MIT 许可证](LICENSE) - 欢迎学习、交流、改进
---
> © 2026 南辞. 个人技术成长作品集,持续更新中...
> *让代码有温度,让技术有责任* 🌱