# benchmark **Repository Path**: chen-junfa/benchmark ## Basic Information - **Project Name**: benchmark - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-06-16 - **Last Updated**: 2026-06-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Physio Manifest 本工程将 EEG 与 PPG 原始公开数据集转换为统一、可追溯、可审计的 `manifest.jsonl`。 当前阶段不生成自然语言 QA,也不重采样或归一化原始信号。 ## 数据流 ```text 原始数据 -> 数据集适配器 -> 任务视图样本 -> 试运行或全量 manifest -> 结构与模板校验 -> stats.json/stats.md -> sample_check.md ``` 原始标注事实由解析器读取;切窗、类别映射、阈值分类、质量判断等非真值结果由 `generation/rules/` 中的普通规则函数生成,并将规则版本写入 manifest。尚未确认的规则只在 代码内使用 `TODO` 标记,生成结果仍按当前规则正常处理。 ## 支持的数据集 - CHB-MIT - Siena Scalp EEG - BIDMC-PPG - PPG-DaLiA - Pulse-Transit-Time-PPG ## 安装 Python 版本要求为 3.12 或更高。 ```bash # 用户安装 python -m pip install . # 开发安装 python3.12 -m venv .venv . .venv/bin/activate python -m pip install -e ".[dev]" ``` 开发安装会注册正式命令行入口,并安装 Ruff 与 Pyright。项目不依赖 `PYTHONPATH`、 `sys.path` 注入或直接执行源码文件。 ## 快速使用 ```bash physio-manifest list physio-manifest inspect --dataset chbmit physio-manifest build --dataset chbmit --limit 1000 --registry /absolute/path/to/QA模板.xlsx physio-manifest-check deliverables/chbmit/pilot_manifest.jsonl --registry /absolute/path/to/QA模板.xlsx physio-manifest-stats deliverables/chbmit/pilot_manifest.jsonl ``` 默认路径位于 `src/physio_manifest/config.py`,命令行可通过 `--root` 覆盖。 完整命令语义、输出文件和推荐操作顺序见 [使用指南](docs/usage.md)。 ## 开发验证 ```bash ruff check src tests pyright src tests python -m unittest discover -s tests -v ``` 开发约定见 [开发指南](docs/development.md),模块职责和依赖方向见 [架构说明](docs/architecture.md)。 ## 目录说明 - `src/physio_manifest/parsing/`:解析原始事实。 - `src/physio_manifest/generation/`:生成统一 manifest 样本。 - `src/physio_manifest/statistics/`:流式统计 manifest。 - `src/physio_manifest/checking/`:校验并生成人工检查清单。 - `src/physio_manifest/models/`:跨阶段共享数据结构。 - `src/physio_manifest/workflows/`:编排四阶段流程。 - `src/physio_manifest/cli/`:安装后生成的正式命令行入口。 - `tests/`:核心契约与规则测试。 - `docs/`:数据集和映射说明。 - `deliverables/`:生成的 manifest 与报告。 解析器和生成器中的五个数据集模块均为平级关系。原始标注事实与派生规则严格分离。