From d24af4b01321ee422a8d948fa023f0c2f98677a7 Mon Sep 17 00:00:00 2001 From: taoying <2474671424@qq.com> Date: Wed, 16 Apr 2025 20:08:17 +0800 Subject: [PATCH] =?UTF-8?q?=E4=BF=AE=E6=94=B9=E5=90=91=E9=87=8F=E7=B4=A2?= =?UTF-8?q?=E5=BC=95=E7=95=8C=E9=9D=A2=E7=9A=84=E9=94=99=E8=AF=AF=E6=8F=8F?= =?UTF-8?q?=E8=BF=B0?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../zh/docs/DataVec/testtool_annbenchmark.md | 20 +++++++++---------- ...21\351\207\217\347\264\242\345\274\225.md" | 4 ++-- .../zh/docs/DataVec/testtool_annbenchmark.md | 20 +++++++++---------- ...21\351\207\217\347\264\242\345\274\225.md" | 4 ++-- 4 files changed, 24 insertions(+), 24 deletions(-) diff --git a/content/docs-lite/zh/docs/DataVec/testtool_annbenchmark.md b/content/docs-lite/zh/docs/DataVec/testtool_annbenchmark.md index 3c1d828e0..d5f1315a3 100644 --- a/content/docs-lite/zh/docs/DataVec/testtool_annbenchmark.md +++ b/content/docs-lite/zh/docs/DataVec/testtool_annbenchmark.md @@ -31,7 +31,7 @@ ## 2. 测试流程 ### 数据库配置 -容器内的配置文件路径: +容器内的配置文件路径(注意数据库参数修改后需要`重启容器`才能生效): ``` /var/lib/opengauss/data/postgresql.conf ``` @@ -61,17 +61,17 @@ export ANN_BENCHMARKS_OG_PORT=YourPort module: ann_benchmarks.algorithms.openGauss name: openGauss-hnsw run_groups: - M-16: - arg_groups: [{M: 16, efConstruction: 200}] - args: {} - query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] - M-24: - arg_groups: [{M: 24, efConstruction: 200}] - args: {} - query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] + M-16: + arg_groups: [{M: 16, efConstruction: 200, concurrents: 80}] + args: {} + query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] + M-24: + arg_groups: [{M: 24, efConstruction: 200, concurrents: 80}] + args: {} + query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] ``` - name: 近似搜索算法名 -- run_groups: 索引构建和索引查询参数设置,这里的arg_groups设置的是hnsw索引构建参数m和efconstruction,query_args则是hnsw索引查询参数ef_search。 +- run_groups: 索引构建和索引查询参数设置,这里的arg_groups设置的是hnsw索引构建参数m和efconstruction,concurrents为并发线程数,推荐值为cpu核数,query_args则是hnsw索引查询参数ef_search。 ### 执行测试 修改`go_opgs.sh`中的启动命令 diff --git "a/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" "b/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" index 8ee11b8f9..c5b22607b 100644 --- "a/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" +++ "b/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" @@ -78,7 +78,7 @@ sparsevec_l1_ops | L1距离 ``` openGauss=# CREATE INDEX ON items USING hnsw (embedding vector_l2_ops) WITH (m = 16, ef_construction = 64); ``` -提高 `ef_construction` 和`m`可以提供更好的召回率,但会增加索引构建和插入速度。 +提高 `ef_construction` 和`m`可以提供更好的召回率,但会增加索引构建和插入时长。 ### 查询选项 - `ef_search` - 查询时的动态候选集大小(默认为40),详情请参考[DataVec向量引擎参数](../DatabaseReference/DataVec向量引擎参数.md)。 @@ -154,7 +154,7 @@ bit_hamming_ops | 汉明距离 sparsevec不支持IVFFLAT索引 ### 索引选项 -- `lists` - 倒排表(单元格)聚类聚类中心数量(默认为100),设置范围1~32768 +- `lists` - 倒排表(单元格)聚类中心数量(默认为100),设置范围1~32768 **示例6:** 使用L2距离计算创建IVFFlat索引并设置lists = 200。 ``` diff --git a/content/zh/docs/DataVec/testtool_annbenchmark.md b/content/zh/docs/DataVec/testtool_annbenchmark.md index b272d901f..0e0366d57 100644 --- a/content/zh/docs/DataVec/testtool_annbenchmark.md +++ b/content/zh/docs/DataVec/testtool_annbenchmark.md @@ -31,7 +31,7 @@ ## 2. 测试流程 ### 数据库配置 -容器内的配置文件路径: +容器内的配置文件路径(注意数据库参数修改后需要`重启容器`才能生效): ``` /var/lib/opengauss/data/postgresql.conf ``` @@ -61,17 +61,17 @@ export ANN_BENCHMARKS_OG_PORT=YourPort module: ann_benchmarks.algorithms.openGauss name: openGauss-hnsw run_groups: - M-16: - arg_groups: [{M: 16, efConstruction: 200}] - args: {} - query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] - M-24: - arg_groups: [{M: 24, efConstruction: 200}] - args: {} - query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] + M-16: + arg_groups: [{M: 16, efConstruction: 200, concurrents: 80}] + args: {} + query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] + M-24: + arg_groups: [{M: 24, efConstruction: 200, concurrents: 80}] + args: {} + query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] ``` - name: 近似搜索算法名 -- run_groups: 索引构建和索引查询参数设置,这里的arg_groups设置的是hnsw索引构建参数m和efconstruction,query_args则是hnsw索引查询参数ef_search。 +- run_groups: 索引构建和索引查询参数设置,这里的arg_groups设置的是hnsw索引构建参数m和efconstruction,concurrents为并发线程数,推荐值为cpu核数,query_args则是hnsw索引查询参数ef_search。 ### 执行测试 修改`go_opgs.sh`中的启动命令 diff --git "a/content/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" "b/content/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" index 64ddfeedc..c74d46ca8 100644 --- "a/content/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" +++ "b/content/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" @@ -78,7 +78,7 @@ sparsevec_l1_ops | L1距离 ``` openGauss=# CREATE INDEX ON items USING hnsw (embedding vector_l2_ops) WITH (m = 16, ef_construction = 64); ``` -提高 `ef_construction` 和`m`可以提供更好的召回率,但会增加索引构建和插入速度。 +提高 `ef_construction` 和`m`可以提供更好的召回率,但会增加索引构建和插入时长。 ### 查询选项 - `ef_search` - 查询时的动态候选集大小(默认为40),详情请参考[DataVec向量引擎参数](../DatabaseReference/DataVec向量引擎参数.md)。 @@ -154,7 +154,7 @@ bit_hamming_ops | 汉明距离 sparsevec不支持IVFFLAT索引 ### 索引选项 -- `lists` - 倒排表(单元格)聚类聚类中心数量(默认为100),设置范围1~32768 +- `lists` - 倒排表(单元格)聚类中心数量(默认为100),设置范围1~32768 **示例6:** 使用L2距离计算创建IVFFlat索引并设置lists = 200。 ``` -- Gitee