From 64b7761b617a356bd62bbcff5419daf276691f62 Mon Sep 17 00:00:00 2001 From: jemappellehc Date: Sat, 29 Mar 2025 10:59:40 +0800 Subject: [PATCH] =?UTF-8?q?=E4=BF=AE=E5=A4=8D=E5=90=91=E9=87=8F=E6=95=B0?= =?UTF-8?q?=E6=8D=AE=E5=BA=93=E9=94=99=E5=88=AB=E5=AD=97&=E6=98=BE?= =?UTF-8?q?=E7=A4=BA=E6=8A=A5=E9=94=99?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- content/docs-lite/zh/docs/DataVec/DataVec-Overview.md | 2 +- content/docs-lite/zh/docs/DataVec/DataVec-architecture.md | 2 +- ...\207\217\346\225\260\346\215\256\347\261\273\345\236\213.md" | 2 +- content/docs-lite/zh/menu/index.md | 2 +- content/zh/docs/DataVec/DataVec-Overview.md | 2 +- content/zh/docs/DataVec/DataVec-architecture.md | 2 +- ...\207\217\346\225\260\346\215\256\347\261\273\345\236\213.md" | 2 +- content/zh/menu/index.md | 2 +- 8 files changed, 8 insertions(+), 8 deletions(-) diff --git a/content/docs-lite/zh/docs/DataVec/DataVec-Overview.md b/content/docs-lite/zh/docs/DataVec/DataVec-Overview.md index a365f130a..5a38642e6 100644 --- a/content/docs-lite/zh/docs/DataVec/DataVec-Overview.md +++ b/content/docs-lite/zh/docs/DataVec/DataVec-Overview.md @@ -10,7 +10,7 @@ DataVec向量数据库可通过[容器镜像安装](../InstallationGuide/容器 DataVec能够无缝对接自研大模型。通过嵌入技术将非结构化数据(如文本、图像等)转换为向量数据,DataVec为之提供存储和检索能力。嵌入是一种将非结构化数据映射到向量空间的技术,使得相似文本、图像在向量空间中的距离相近,从而提高检索的准确性和效率。 -此外,DataVec还支持鲲鹏指令集加速,实现毫秒级响应。鲲鹏指令集是华为自主研发的一套高性能计算指令集,能够显著提升数据处理和计算的效率。通过利用鲲鹏指令集,DataVec可以在处理大规模向量数据时,提供更快的想用速度和更高的处理能力。 +此外,DataVec还支持鲲鹏指令集加速,实现毫秒级响应。鲲鹏指令集是华为自主研发的一套高性能计算指令集,能够显著提升数据处理和计算的效率。通过利用鲲鹏指令集,DataVec可以在处理大规模向量数据时,提供更快的响应速度和更高的处理能力。 在实际应用中,DataVec可以广泛应用于各种需要高效向量检索的场景。例如,在推荐系统中,DataVec可以根据用户的历史行为和偏好,快速找到与用户兴趣相似的内容,从而提供个性化的推荐。在图像检索中,DataVec可以通过图像特征向量,快速找到与查询图像相似的图片。在自然语言处理(NLP)中,DataVec可以通过文本嵌入,快速找到与查询文本语义相似的文档。 diff --git a/content/docs-lite/zh/docs/DataVec/DataVec-architecture.md b/content/docs-lite/zh/docs/DataVec/DataVec-architecture.md index 7de6956b8..4457221a0 100644 --- a/content/docs-lite/zh/docs/DataVec/DataVec-architecture.md +++ b/content/docs-lite/zh/docs/DataVec/DataVec-architecture.md @@ -55,7 +55,7 @@ openGauss DataVec 深度结合鲲鹏硬件,通过量化压缩算法、Rerank #### 向量指令集加速 -具体来说,鲲鹏指令集包括一系列优化的指令,如NENO指令和内联汇编,这些指令能够加速向量运算、数据预取和流水线处理。通过利用鲲鹏处理器的硬件加速特性和优化的指令集,ANN算法能够在处理大规模数据集时显著提高性能和效率。 +具体来说,鲲鹏指令集包括一系列优化的指令,如NEON指令和内联汇编,这些指令能够加速向量运算、数据预取和流水线处理。通过利用鲲鹏处理器的硬件加速特性和优化的指令集,ANN算法能够在处理大规模数据集时显著提高性能和效率。 ## 标量向量混合查询 DataVec还能够同时处理标量数据(如数值、类别)和向量数据(如文本、音视频)。这种混合查询的支持使得用户可以在同一个查询中结合不同类型的数据,从而实现更复杂和精细的分析。 diff --git "a/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\346\225\260\346\215\256\347\261\273\345\236\213.md" "b/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\346\225\260\346\215\256\347\261\273\345\236\213.md" index fe0f52570..abc515282 100644 --- "a/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\346\225\260\346\215\256\347\261\273\345\236\213.md" +++ "b/content/docs-lite/zh/docs/SQLReference/\345\220\221\351\207\217\346\225\260\346\215\256\347\261\273\345\236\213.md" @@ -22,7 +22,7 @@ sparsevec[(d)] | (8 * 非零元素数 + 16)字节| 1~1,000,000,000
最大非 ## Vector 每个vector占用 `4 * 维度 + 8` 字节的储存空间。 -每个元素都是单精度浮点数,有效小数位约为并且所有的元素都是有限的:(不能为 `NaN`,`Infinity` 或者 `-Infinity`)。 +每个元素都是单精度浮点数,并且所有的元素都是有限的:(不能为 `NaN`,`Infinity` 或者 `-Infinity`)。 vector的最大维度为 `16,000`。 ### 格式 diff --git a/content/docs-lite/zh/menu/index.md b/content/docs-lite/zh/menu/index.md index b9771406e..dac9328f0 100644 --- a/content/docs-lite/zh/menu/index.md +++ b/content/docs-lite/zh/menu/index.md @@ -647,7 +647,7 @@ headless: true - [教程案例指导]({{< relref "./docs/DataVec/DataVec-tutorials.md" >}}) - [打破AI黑盒,拥抱开源力量:基于openGauss+DeepSeek的本地知识库,打造你的专属AI助手!]({{< relref "./docs/DataVec/openGauss-RAG实践.md" >}}) - [openGauss Datavec + Dify,快速搭建你的智能助手平台]({{< relref "./docs/DataVec/openGauss-Dify.md" >}}) - - [Spring Boot集成openGauss DataVec实现向量化检索]({{< relref "./docs/DataVec/openGauss-Springboot.md" >}} + - [Spring Boot集成openGauss DataVec实现向量化检索]({{< relref "./docs/DataVec/openGauss-Springboot.md" >}}) - [安全加固指南]({{< relref "./docs/SecHarden/secHarden.md" >}}) - [数据库加固概述]({{< relref "./docs/SecHarden/数据库加固概述.md" >}}) - [安全配置规范基线]({{< relref "./docs/SecHarden/安全配置规范基线.md" >}}) diff --git a/content/zh/docs/DataVec/DataVec-Overview.md b/content/zh/docs/DataVec/DataVec-Overview.md index 9cf43cdd8..dc3e4071e 100644 --- a/content/zh/docs/DataVec/DataVec-Overview.md +++ b/content/zh/docs/DataVec/DataVec-Overview.md @@ -10,7 +10,7 @@ DataVec向量数据库可通过[容器镜像安装](../../../docs-lite/zh/docs/I DataVec能够无缝对接自研大模型。通过嵌入技术将非结构化数据(如文本、图像等)转换为向量数据,DataVec为之提供存储和检索能力。嵌入是一种将非结构化数据映射到向量空间的技术,使得相似文本、图像在向量空间中的距离相近,从而提高检索的准确性和效率。 -此外,DataVec还支持鲲鹏指令集加速,实现毫秒级响应。鲲鹏指令集是华为自主研发的一套高性能计算指令集,能够显著提升数据处理和计算的效率。通过利用鲲鹏指令集,DataVec可以在处理大规模向量数据时,提供更快的想用速度和更高的处理能力。 +此外,DataVec还支持鲲鹏指令集加速,实现毫秒级响应。鲲鹏指令集是华为自主研发的一套高性能计算指令集,能够显著提升数据处理和计算的效率。通过利用鲲鹏指令集,DataVec可以在处理大规模向量数据时,提供更快的响应速度和更高的处理能力。 在实际应用中,DataVec可以广泛应用于各种需要高效向量检索的场景。例如,在推荐系统中,DataVec可以根据用户的历史行为和偏好,快速找到与用户兴趣相似的内容,从而提供个性化的推荐。在图像检索中,DataVec可以通过图像特征向量,快速找到与查询图像相似的图片。在自然语言处理(NLP)中,DataVec可以通过文本嵌入,快速找到与查询文本语义相似的文档。 diff --git a/content/zh/docs/DataVec/DataVec-architecture.md b/content/zh/docs/DataVec/DataVec-architecture.md index a1f81ca8c..5004943c7 100644 --- a/content/zh/docs/DataVec/DataVec-architecture.md +++ b/content/zh/docs/DataVec/DataVec-architecture.md @@ -55,7 +55,7 @@ openGauss DataVec 深度结合鲲鹏硬件,通过量化压缩算法、Rerank ### 向量指令集加速 -具体来说,鲲鹏指令集包括一系列优化的指令,如NENO指令和内联汇编,这些指令能够加速向量运算、数据预取和流水线处理。通过利用鲲鹏处理器的硬件加速特性和优化的指令集,ANN算法能够在处理大规模数据集时显著提高性能和效率。 +具体来说,鲲鹏指令集包括一系列优化的指令,如NEON指令和内联汇编,这些指令能够加速向量运算、数据预取和流水线处理。通过利用鲲鹏处理器的硬件加速特性和优化的指令集,ANN算法能够在处理大规模数据集时显著提高性能和效率。 ## 标量向量混合查询 DataVec还能够同时处理标量数据(如数值、类别)和向量数据(如文本、音视频)。这种混合查询的支持使得用户可以在同一个查询中结合不同类型的数据,从而实现更复杂和精细的分析。 diff --git "a/content/zh/docs/SQLReference/\345\220\221\351\207\217\346\225\260\346\215\256\347\261\273\345\236\213.md" "b/content/zh/docs/SQLReference/\345\220\221\351\207\217\346\225\260\346\215\256\347\261\273\345\236\213.md" index 6a0754a28..50c91345f 100644 --- "a/content/zh/docs/SQLReference/\345\220\221\351\207\217\346\225\260\346\215\256\347\261\273\345\236\213.md" +++ "b/content/zh/docs/SQLReference/\345\220\221\351\207\217\346\225\260\346\215\256\347\261\273\345\236\213.md" @@ -22,7 +22,7 @@ sparsevec[(d)] | (8 * 非零元素数 + 16)字节| 1~1,000,000,000
最大非 ## Vector 每个vector占用 `4 * 维度 + 8` 字节的储存空间。 -每个元素都是单精度浮点数,有效小数位约为并且所有的元素都是有限的:(不能为 `NaN`,`Infinity` 或者 `-Infinity`)。 +每个元素都是单精度浮点数,并且所有的元素都是有限的:(不能为 `NaN`,`Infinity` 或者 `-Infinity`)。 vector的最大维度为 `16,000`。 ### 格式 diff --git a/content/zh/menu/index.md b/content/zh/menu/index.md index 93b07e910..6a77d5be7 100644 --- a/content/zh/menu/index.md +++ b/content/zh/menu/index.md @@ -932,7 +932,7 @@ headless: true - [教程案例指导]({{< relref "./docs/DataVec/DataVec-tutorials.md" >}}) - [打破AI黑盒,拥抱开源力量:基于openGauss+DeepSeek的本地知识库,打造你的专属AI助手!]({{< relref "./docs/DataVec/openGauss-RAG实践.md" >}}) - [openGauss Datavec + Dify,快速搭建你的智能助手平台]({{< relref "./docs/DataVec/openGauss-Dify.md" >}}) - - [Spring Boot集成openGauss DataVec实现向量化检索]({{< relref "./docs/DataVec/openGauss-Springboot.md" >}} + - [Spring Boot集成openGauss DataVec实现向量化检索]({{< relref "./docs/DataVec/openGauss-Springboot.md" >}}) - [AI特性指南]({{< relref "./docs/AIFeatureGuide/AI特性.md" >}}) - [AI4DB: 数据库自治运维]({{< relref "./docs/AIFeatureGuide/AI4DB-数据库自治运维.md" >}}) - [DBMind模式说明]({{< relref "./docs/AIFeatureGuide/DBMind模式说明.md" >}}) -- Gitee