# text2sql-benchmark-quality-eval **Repository Path**: hwjjjjjjj/text2sql-benchmark-quality-eval ## Basic Information - **Project Name**: text2sql-benchmark-quality-eval - **Description**: 获取数据库的相关指标统计信息 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2024-01-04 - **Last Updated**: 2024-01-09 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # text2sql-benchmark-quality-eval #### 介绍 计算text2sql的benchmark的质量指标。 ⚠️当前的评估代码是为每个数据集单独定制的,并且没有现成的端到端解决方案。这些代码主要是核心功能,未来需要定义一个统一的数据结构和接口,再基于现有的核心代码开发出一个完整的端到端数据集质量评估工具。 #### 文件说明 - `compute_SQL_complexity_funcs`: 包含了计算SQL语法树深度、宽度以及SQL函数/运算符分布的代码 - `compute_SQL_skeleton_keyword`: 包含了计算SQL骨架和关键字分布的代码 - `compute_database_dimensions`: 包含了统计数据库平均表数量和平均字段数量的代码 - `compute_table_relevancy`: 包含了根据外键计算表关联度的代码 - `compute_table_similarity`: 包含了计算表相似度的代码 #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)