diff --git a/content/docs-lite/zh/docs/DataVec/testtool_annbenchmark.md b/content/docs-lite/zh/docs/DataVec/testtool_annbenchmark.md index 3c1d828e00e51cd10ec0c85334653aeabd816598..d5f1315a3ab534c644527478a10c6c4f8e953936 100644 --- a/content/docs-lite/zh/docs/DataVec/testtool_annbenchmark.md +++ b/content/docs-lite/zh/docs/DataVec/testtool_annbenchmark.md @@ -31,7 +31,7 @@ ## 2. 测试流程 ### 数据库配置 -容器内的配置文件路径: +容器内的配置文件路径(注意数据库参数修改后需要`重启容器`才能生效): ``` /var/lib/opengauss/data/postgresql.conf ``` @@ -61,17 +61,17 @@ export ANN_BENCHMARKS_OG_PORT=YourPort module: ann_benchmarks.algorithms.openGauss name: openGauss-hnsw run_groups: - M-16: - arg_groups: [{M: 16, efConstruction: 200}] - args: {} - query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] - M-24: - arg_groups: [{M: 24, efConstruction: 200}] - args: {} - query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] + M-16: + arg_groups: [{M: 16, efConstruction: 200, concurrents: 80}] + args: {} + query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] + M-24: + arg_groups: [{M: 24, efConstruction: 200, concurrents: 80}] + args: {} + query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] ``` - name: 近似搜索算法名 -- run_groups: 索引构建和索引查询参数设置,这里的arg_groups设置的是hnsw索引构建参数m和efconstruction,query_args则是hnsw索引查询参数ef_search。 +- run_groups: 索引构建和索引查询参数设置,这里的arg_groups设置的是hnsw索引构建参数m和efconstruction,concurrents为并发线程数,推荐值为cpu核数,query_args则是hnsw索引查询参数ef_search。 ### 执行测试 修改`go_opgs.sh`中的启动命令 diff --git "a/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" "b/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" index 8ee11b8f9d24a7d522da69e41ac80b9144daf20e..c5b22607be08384dcc7fca45aa3a109c779ae7b1 100644 --- "a/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" +++ "b/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" @@ -78,7 +78,7 @@ sparsevec_l1_ops | L1距离 ``` openGauss=# CREATE INDEX ON items USING hnsw (embedding vector_l2_ops) WITH (m = 16, ef_construction = 64); ``` -提高 `ef_construction` 和`m`可以提供更好的召回率,但会增加索引构建和插入速度。 +提高 `ef_construction` 和`m`可以提供更好的召回率,但会增加索引构建和插入时长。 ### 查询选项 - `ef_search` - 查询时的动态候选集大小(默认为40),详情请参考[DataVec向量引擎参数](../DatabaseReference/DataVec向量引擎参数.md)。 @@ -154,7 +154,7 @@ bit_hamming_ops | 汉明距离 sparsevec不支持IVFFLAT索引 ### 索引选项 -- `lists` - 倒排表(单元格)聚类聚类中心数量(默认为100),设置范围1~32768 +- `lists` - 倒排表(单元格)聚类中心数量(默认为100),设置范围1~32768 **示例6:** 使用L2距离计算创建IVFFlat索引并设置lists = 200。 ``` diff --git a/content/zh/docs/DataVec/testtool_annbenchmark.md b/content/zh/docs/DataVec/testtool_annbenchmark.md index 1a91b4d25f080810108e7355e31d7716194b88c0..8ff40dd7172ffd360ddf356339abbbce2e03e015 100644 --- a/content/zh/docs/DataVec/testtool_annbenchmark.md +++ b/content/zh/docs/DataVec/testtool_annbenchmark.md @@ -31,7 +31,7 @@ ## 2. 测试流程 ### 数据库配置 -容器内的配置文件路径: +容器内的配置文件路径(注意数据库参数修改后需要`重启容器`才能生效): ``` /var/lib/opengauss/data/postgresql.conf ``` @@ -61,17 +61,17 @@ export ANN_BENCHMARKS_OG_PORT=YourPort module: ann_benchmarks.algorithms.openGauss name: openGauss-hnsw run_groups: - M-16: - arg_groups: [{M: 16, efConstruction: 200}] - args: {} - query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] - M-24: - arg_groups: [{M: 24, efConstruction: 200}] - args: {} - query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] + M-16: + arg_groups: [{M: 16, efConstruction: 200, concurrents: 80}] + args: {} + query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] + M-24: + arg_groups: [{M: 24, efConstruction: 200, concurrents: 80}] + args: {} + query_args: [[10, 20, 40, 80, 120, 200, 400, 800]] ``` - name: 近似搜索算法名 -- run_groups: 索引构建和索引查询参数设置,这里的arg_groups设置的是hnsw索引构建参数m和efconstruction,query_args则是hnsw索引查询参数ef_search。 +- run_groups: 索引构建和索引查询参数设置,这里的arg_groups设置的是hnsw索引构建参数m和efconstruction,concurrents为并发线程数,推荐值为cpu核数,query_args则是hnsw索引查询参数ef_search。 ### 执行测试 修改`go_opgs.sh`中的启动命令 diff --git "a/content/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" "b/content/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" index 64ddfeedcdf71518dd1e8aed0e3dbf60b60a642b..c74d46ca8a989e3fe080b0c1efe1b4c90bebec57 100644 --- "a/content/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" +++ "b/content/zh/docs/SQLReference/\345\220\221\351\207\217\347\264\242\345\274\225.md" @@ -78,7 +78,7 @@ sparsevec_l1_ops | L1距离 ``` openGauss=# CREATE INDEX ON items USING hnsw (embedding vector_l2_ops) WITH (m = 16, ef_construction = 64); ``` -提高 `ef_construction` 和`m`可以提供更好的召回率,但会增加索引构建和插入速度。 +提高 `ef_construction` 和`m`可以提供更好的召回率,但会增加索引构建和插入时长。 ### 查询选项 - `ef_search` - 查询时的动态候选集大小(默认为40),详情请参考[DataVec向量引擎参数](../DatabaseReference/DataVec向量引擎参数.md)。 @@ -154,7 +154,7 @@ bit_hamming_ops | 汉明距离 sparsevec不支持IVFFLAT索引 ### 索引选项 -- `lists` - 倒排表(单元格)聚类聚类中心数量(默认为100),设置范围1~32768 +- `lists` - 倒排表(单元格)聚类中心数量(默认为100),设置范围1~32768 **示例6:** 使用L2距离计算创建IVFFlat索引并设置lists = 200。 ```