diff --git a/docs/user_manual.md b/docs/user_manual.md index 3c54e680c7f188873af726180bd677c09ab3e44f..8350eaf6dc1fdbb3e986b4f2cabc12afc44d36b2 100644 --- a/docs/user_manual.md +++ b/docs/user_manual.md @@ -51,9 +51,9 @@ Oct 10 12:58:51 mfeng bash[3217754]: + sed -i 's/^FIRST_INIT_DONE=0/FIRST_INIT_D 建议Safari 版本15.6.1 ,Chrome 版本109.0.5414.119,Microsoft Edge 版本110.0.1587.50等以上 ### 操作步骤 打开本地PC机的浏览器,在地址栏输入http://部署服务器的ip(例如:[http://172.22.3.238](http://172.22.3.238)),按“Enter”。 -:::info -**说明:** HTTP默认端口为80,请确认防火墙已开通80端口。 -::: + +> **说明:** HTTP默认端口为80,请确认防火墙已开通80端口。 + 打开登陆界面,如图所示。默认的用户名密码:admin/123456。 ![截屏2023-02-06 18.03.01.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/84856280/1675677791282-a8cf9751-7083-403f-ac00-0447eb770a88.png#clientId=u64550777-cb45-4&from=drop&id=u93a0bb5c&name=%E6%88%AA%E5%B1%8F2023-02-06%2018.03.01.png&originHeight=915&originWidth=1918&originalType=binary&ratio=1&rotation=0&showTitle=false&size=113232&status=done&style=none&taskId=uca37021d-a671-4597-9482-f73d144096e&title=) #### 修改密码 @@ -61,11 +61,10 @@ Oct 10 12:58:51 mfeng bash[3217754]: + sed -i 's/^FIRST_INIT_DONE=0/FIRST_INIT_D 点击账户密码修改,输入用户名、原始密码和新密码并确认。点击修改密码,密码修改完成。 参数说明如下表所示。 -| **参数** | **说明** | -| --- | --- | -| 密码 | 设置登陆用户密码需要满足以下要求: -SysOM 2.1版本之前没要求。 -SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字母、数字、特殊字符三种及以上 | +| **参数** | **说明** | +| -------- | --------------------------------------------------------------------------------------------------------------------------------------------------------- | +| 密码 | 设置登陆用户密码需要满足以下要求:
SysOM 2.1版本之前没要求。
SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字母、数字、特殊字符三种及以上 | + ## 主机管理 ### 概述 @@ -75,10 +74,11 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字 1. 进入“主机管理”菜单,下拉菜单中选择点击”集群列表“进入“集群管理”页面。 2. 点击“新建集群”打开新建集群弹出框,输入以下参数。 -| **参数** | **说明** | -| --- | --- | + +| **参数** | **说明** | +| -------- | ------------------------------------------------------- | | 集群名称 | 设置集群名称需要满足以下要求:集群名称长度应小于128字节 | -| 备注信息 | 输入集群的备注信息。 | +| 备注信息 | 输入集群的备注信息。 | 3. 点击“确认”,完成集群创建。 4. 点击“批量导入”弹出“批量导入”弹出框,点击“模板下载”将模板下载到本地,填入步骤2中的参数并保存文件。点击“单击上传”,选中保存的文件,点击“确认”完成集群批量导入。 @@ -87,9 +87,10 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字 1. 在集群列表中找到想要删除的集群,点击“操作”列的“删除”弹出确认删除提示框,点击“OK”即可将该集群信息删除。 2. 批量删除集群,选中需要删除的集群的复选框,或者选中“集群名称”前的复选框选中所有集群。点击列表右上角的“批量删除”,完成集群的批量删除。 -:::info -**说明:** 包含主机的集群不允许被删除,若想删除则需要将主机删除或移出集群。 -::: + +> **说明:** 包含主机的集群不允许被删除,若想删除则需要将主机删除或移出集群。 + + ### 导出集群 #### 操作步骤 选中需要导出的集群的复选框,或者选中“集群名称”前的复选框选中所有集群。点击列表右上角的“导出数据”,完成集群数据的导出。 @@ -100,22 +101,23 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字 1. 进入“主机管理”菜单,下拉菜单中选择点击”主机列表“进入“主机管理”页面。 2. 单击“新建主机”打开新建主机弹出框,输入以下参数。 -| **参数** | **说明** | -| --- | --- | -| 选择集群 | 选择已创建集群。 | + +| **参数** | **说明** | +| -------- | -------------------------------------------------------------------------------- | +| 选择集群 | 选择已创建集群。 | | 主机名称 | 主机名称为该主机在SysOM平台上的名称,需要满足以下要求:主机名称长度应小于100字节 | -| 用户名称 | 输入被管理主机的用户的名称。 | -| 用户密码 | 输入被管理主机的用户的密码。 | -| IP地址 | 输入被管理主机的IP地址。 -说明: -被管理主机与部署SysOM工具的环境需要保持可联通状态。 | -| 端口 | 输入被管理主机的SSH协议端口。 | -| 备注信息 | 输入备注信息。 | +| 用户名称 | 输入被管理主机的用户的名称。 | +| 用户密码 | 输入被管理主机的用户的密码。 | +| IP地址 | 输入被管理主机的IP地址。 | +| 端口 | 输入被管理主机的SSH协议端口。 | +| 备注信息 | 输入备注信息。 | + +> **说明:** 被管理主机与部署SysOM工具的环境需要保持可联通状态。 3. 点击“确认”,完成主机导入。 -:::info -**说明:** 当主机列表中“主机状态”为“运行中”时,主机导入成功;若为“异常”或“离线”,则导入失败。请检查主机信息、网络连通性及主机状态。 -::: + +> **说明:** 当主机列表中“主机状态”为“运行中”时,主机导入成功;若为“异常”或“离线”,则导入失败。请检查主机信息、网络连通性及主机状态。 + 4. 点击“批量导入”弹出“批量导入”弹出框,点击“模板下载”将模板下载到本地,填入步骤2中的参数并保存文件。点击“单击上传”,选中保存的文件,点击“确认”完成主机批量导入。 @@ -131,9 +133,9 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字 ### 编辑主机 #### 操作步骤 在主机列表中找到想要删除的主机,点击“操作”列的“编辑”弹出编辑主机框,修改相应主机信息,点击“确认”即可完成主机信息的编辑。 -:::info -**说明:** 目前仅支持“选择集群”和“备注信息”的编辑。 -::: + +> **说明:** 目前仅支持“选择集群”和“备注信息”的编辑。 + ### 访问主机 #### 前提条件 被访问的主机的“主机状态”为“运行中”。 @@ -145,8 +147,8 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字 平台支持操作迁移的操作系统列表如下。 | **源操作系统** | **目的操作系统** | -| --- | --- | -| CentOS 7.6 | Anolis OS 8 | +| -------------- | ---------------- | +| CentOS 7.6 | Anolis OS 8 | ### 开始迁移评估 #### 前提条件 @@ -161,31 +163,36 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/28856758/1677137690351-5e340c1c-1c30-43e4-a6a6-5c9db7807250.png#clientId=u1ca12cdf-d0b7-4&from=paste&height=303&id=u9aea09ab&name=image.png&originHeight=606&originWidth=3538&originalType=binary&ratio=2&rotation=0&showTitle=false&size=422124&status=done&style=none&taskId=u12d560b8-7350-430c-b0ec-debfc10ad0d&title=&width=1769) 2. 填写评估所需的信息,参数说明如下。 -| **参数** | **说明** | -| --- | --- | -| 选择机器 | 选择需要被评估的机器,可多选。 | -| 迁移版本 | 选择机器迁移的目的操作系统版本。 | -| Repo配置 | 用于配置迁移评估的仓库 (其中仓库代指 yum 源软件仓库),此处可选择使用公网地址的默认地址或内网地址。在评估阶段,SysOM 会自动分析仓库的软件包和基础库,将其与本地环境做比对并得出一封评估报告。 - -说明: -- 若选择公网地址,则 SysOM 会尝试从社区源 ([https://mirrors.openanolis.cn/)](https://mirrors.openanolis.cn/)) 取回数据,届时请确保主机可以访问公网; -- 若选择内网地址,则需要在内网搭建软件仓库,具体搭建方法可以参考社区知识库中的帮助信息([https://openanolis.cn/sig/migration/doc/447499505912234337](https://openanolis.cn/sig/migration/doc/447499505912234337))。 - | -| 选择评估 | 勾选本次评估的具体内容,其中风险评估为必选项,系统评估,硬件评估,应用评估为可选项。 -说明: -勾选应用评估之后,请在弹出框中输入需要评估的应用列表,用英文逗号分隔,支持模糊搜索,具体可评估的应用列表请在被评估主机上执行 rpm -qa 进行查看。 | + +| **参数** | **说明** | +| -------- | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | +| 选择机器 | 选择需要被评估的机器,可多选。 | +| 迁移版本 | 选择机器迁移的目的操作系统版本。 | +| Repo配置 | 用于配置迁移评估的仓库 (其中仓库代指 yum 源软件仓库),此处可选择使用公网地址的默认地址或内网地址。在评估阶段,SysOM 会自动分析仓库的软件包和基础库,将其与本地环境做比对并得出一封评估报告。 | +| 选择评估 | 勾选本次评估的具体内容,其中风险评估为必选项,系统评估,硬件评估,应用评估为可选项。 | + +> **说明:**
+> +> Repo配置: +> - 若选择公网地址,则 SysOM 会尝试从社区源 ([https://mirrors.openanolis.cn/)](https://mirrors.openanolis.cn/)) 取回数据,届时请确保主机可以访问公网; +> - 若选择内网地址,则需要在内网搭建软件仓库,具体搭建方法可以参考社区知识库中的帮助信息([https://openanolis.cn/sig/migration/doc/447499505912234337](https://openanolis.cn/sig/migration/doc/447499505912234337))。 +> +> 选择评估: +> - 勾选应用评估之后,请在弹出框中输入需要评估的应用列表,用英文逗号分隔,支持模糊搜索,具体可评估的应用列表请在被评估主机上执行 rpm -qa 进行查看。 3. 点击“开始评估”,生成一条评估记录,可通过“评估进度”列查看主机迁移评估的进度。“评估进度”和“评估说明”的说明如下。 -| **参数** | **数值** | **说明** | -| --- | --- | --- | -| 评估进度 | <100% | 代表当前正在进行评估。 | -| | 100% | 代表评估已完成。 | -| 评估状态 | 评估中 | 代表当前正在进行评估。 | -| | 评估停止 | 代表正在评估中的主机在“操作”中被执行了“停止”操作,评估未完成。 | -| | 评估失败 | 代表评估失败。 -说明: -根据勾选评估内容依次执行评估,入遇到某个评估失败,则当前整个评估任务失败,评估失败原因可通过鼠标悬浮在“评估失败”状态上查看。 | -| | 评估完成 | 代表评估已完成。 | + +| **参数** | **数值** | **说明** | +| -------- | -------- | -------------------------------------------------------------- | +| 评估进度 | <100% | 代表当前正在进行评估。 | +| | 100% | 代表评估已完成。 | +| 评估状态 | 评估中 | 代表当前正在进行评估。 | +| | 评估停止 | 代表正在评估中的主机在“操作”中被执行了“停止”操作,评估未完成。 | +| | 评估失败 | 代表评估失败。 | +| | 评估完成 | 代表评估已完成。 | + +> **说明:** +> 根据勾选评估内容依次执行评估,入遇到某个评估失败,则当前整个评估任务失败,评估失败原因可通过鼠标悬浮在“评估失败”状态上查看。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/28856758/1677140769711-2e6550c8-72e8-4637-89cb-7fbbc1066a9d.png#clientId=u1ca12cdf-d0b7-4&from=paste&height=280&id=u60dd292c&name=image.png&originHeight=560&originWidth=3506&originalType=binary&ratio=2&rotation=0&showTitle=false&size=434599&status=done&style=none&taskId=u24c91f6a-097f-4281-97cf-a7524abd459&title=&width=1753) ### 停止评估 @@ -202,48 +209,49 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字 1. 在评估记录列表中找到想要查看的主机,点击“操作”列的“查看报告”跳转到评估报告详情页面,点击不同的评估项可切换到不同的报告内容,即使未评估完成或者评估失败,也可以查看某一项已经评估完成的内容。 2. 报告说明如下表。 -| **评估报告** | **参数** | **说明** | -| --- | --- | --- | -| 风险评估 | 风险项 | 迁移过程中可能出现的风险问题 | -| | 风险 | 风险等级 | -| | 建议操作 | 可按照该操作处理当前风险 | -| | 评估结果 | 如果不存在阻塞迁移的风险,则评估通过,如果存在阻塞迁移的风险,则需要用户手动介入处理风险。 | + +| **评估报告** | **参数** | **说明** | +| ------------ | -------- | ------------------------------------------------------------------------------------------ | +| 风险评估 | 风险项 | 迁移过程中可能出现的风险问题 | +| | 风险 | 风险等级 | +| | 建议操作 | 可按照该操作处理当前风险 | +| | 评估结果 | 如果不存在阻塞迁移的风险,则评估通过,如果存在阻塞迁移的风险,则需要用户手动介入处理风险。 | ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/28856758/1677139282459-008aac50-ca9f-40a9-9401-c501cbb0e5ca.png#clientId=u1ca12cdf-d0b7-4&from=paste&height=867&id=uf2905d1b&name=image.png&originHeight=1734&originWidth=2614&originalType=binary&ratio=2&rotation=0&showTitle=false&size=1101676&status=done&style=none&taskId=uce88f901-a0e3-41d4-baac-535fcefe0bd&title=&width=1307) -| **评估报告** | **参数** | **说明** | -| --- | --- | --- | -| 系统评估 | 环境变量 | 展示系统环境变量及其评估结果 | -| | 系统服务 | 展示系统服务状态及其评估结果 | -| | 系统命令 | 展示系统命令列表及其评估结果 | -| | 内核模块 | 展示内核模块列表及其评估结果 | -| | 系统调用 | 展示系统调用列表及其评估结果 | -| | 内核启动参数 | 展示内核启动参数及其评估结果 | -| | 内核动态配置 | 展示内核动态参数及其评估结果 | -| | 内核静态配置 | 展示内核静态参数及其评估结果 | -| | KABI | 展示KABI接口列表及其评估结果 | +| **评估报告** | **参数** | **说明** | +| ------------ | ------------ | ---------------------------- | +| 系统评估 | 环境变量 | 展示系统环境变量及其评估结果 | +| | 系统服务 | 展示系统服务状态及其评估结果 | +| | 系统命令 | 展示系统命令列表及其评估结果 | +| | 内核模块 | 展示内核模块列表及其评估结果 | +| | 系统调用 | 展示系统调用列表及其评估结果 | +| | 内核启动参数 | 展示内核启动参数及其评估结果 | +| | 内核动态配置 | 展示内核动态参数及其评估结果 | +| | 内核静态配置 | 展示内核静态参数及其评估结果 | +| | KABI | 展示KABI接口列表及其评估结果 | ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/28856758/1677140462324-a21f13e2-4d0b-4252-a27f-ef537a40a90f.png#clientId=u1ca12cdf-d0b7-4&from=paste&height=870&id=ubea93b01&name=image.png&originHeight=1740&originWidth=2600&originalType=binary&ratio=2&rotation=0&showTitle=false&size=947414&status=done&style=none&taskId=uab889829-1730-405a-9db3-f2b3f3f5694&title=&width=1300) -| **评估报告** | **参数** | **说明** | -| --- | --- | --- | -| 硬件评估 | 整机信息 | 被评估主机的一些基本物理硬件信息 | -| | 设备名称 | 主机包含的板卡的设备名称 | -| | bdf、vid、did、svid、sdid | 板卡硬件各类ID信息 | -| | 驱动评估结果 | 基于驱动信息评估的结果,支持表示存在支持该板卡的驱动 | -| | ancert验证结果 | 基于社区ancert硬件兼容性工具验证的结果,通过表示经过测试验证支持该板卡 | -| | 操作 | 点击可跳转到龙蜥兼容适配网站进行自主验证 | +| **评估报告** | **参数** | **说明** | +| ------------ | ------------------------- | ---------------------------------------------------------------------- | +| 硬件评估 | 整机信息 | 被评估主机的一些基本物理硬件信息 | +| | 设备名称 | 主机包含的板卡的设备名称 | +| | bdf、vid、did、svid、sdid | 板卡硬件各类ID信息 | +| | 驱动评估结果 | 基于驱动信息评估的结果,支持表示存在支持该板卡的驱动 | +| | ancert验证结果 | 基于社区ancert硬件兼容性工具验证的结果,通过表示经过测试验证支持该板卡 | +| | 操作 | 点击可跳转到龙蜥兼容适配网站进行自主验证 | ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/28856758/1677140199006-0c82bc58-8ba5-44d1-89f4-9b6a675881ab.png#clientId=u1ca12cdf-d0b7-4&from=paste&height=848&id=ue103cf41&name=image.png&originHeight=1696&originWidth=2602&originalType=binary&ratio=2&rotation=0&showTitle=false&size=985062&status=done&style=none&taskId=ub3915af4-ff7f-4122-b502-cb615cb569d&title=&width=1301) -| **评估报告** | **参数** | **说明** | -| --- | --- | --- | -| 应用评估 | 应用列表 | 被评估应用的列表 | -| | 操作 | 点击详细可跳转到该应用具体的评估内容 | -| | 依赖评估结果 | 展示应用最终评估结果 | -| | 应用依赖评估 | 展示当前应用依赖的lib库、系统命令及其评估结果 | -| | ABI评估报告 | 展示应用依赖的lib库ABI接口及其评估结果 | -| | CLI评估报告 | 展示应用依赖的CLI接口及其评估结果 | +| **评估报告** | **参数** | **说明** | +| ------------ | ------------ | --------------------------------------------- | +| 应用评估 | 应用列表 | 被评估应用的列表 | +| | 操作 | 点击详细可跳转到该应用具体的评估内容 | +| | 依赖评估结果 | 展示应用最终评估结果 | +| | 应用依赖评估 | 展示当前应用依赖的lib库、系统命令及其评估结果 | +| | ABI评估报告 | 展示应用依赖的lib库ABI接口及其评估结果 | +| | CLI评估报告 | 展示应用依赖的CLI接口及其评估结果 | ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/28856758/1677141002003-4f1522d5-7aba-495d-bb81-c4446f95e04e.png#clientId=u1ca12cdf-d0b7-4&from=paste&height=869&id=ud61a8f0b&name=image.png&originHeight=1738&originWidth=2596&originalType=binary&ratio=2&rotation=0&showTitle=false&size=847372&status=done&style=none&taskId=u5c81c641-7555-47c7-ab0d-b826dd743ac&title=&width=1298) ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/28856758/1677141073667-5441f06d-a82d-47d7-98dc-a8e6ee022b90.png#clientId=u1ca12cdf-d0b7-4&from=paste&height=896&id=u27d8f4a0&name=image.png&originHeight=1792&originWidth=2614&originalType=binary&ratio=2&rotation=0&showTitle=false&size=1133265&status=done&style=none&taskId=u5f9a19b8-e631-4d60-b79c-ee19057a1fb&title=&width=1307) @@ -257,32 +265,35 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字 1. 进入“操作系统迁移”菜单,下拉菜单中选择点击”迁移实施“进入“迁移实施”页面。 2. 菜单机器列表中可查看所有主机及状态,点击左上角可切换集群,找到需要迁移的主机,在操作列点击“...”弹出下拉菜单。点击“迁移配置”弹出迁移配置框。参数说明如下。 -| **参数** | **说明** | -| --- | --- | -| 选择机器 | 显示所选机器。 | -| 迁移版本 | 选择机器迁移的目的操作系统版本。 | -| 选择内核 | 选择内核,目前仅支持迁移至ANCK内核。 | -| Repo配置 | 用于配置迁移实施的仓库 (其中仓库代指 yum 源软件仓库),此处可选择使用公网地址的默认地址或内网地址。在迁移实施阶段,SysOM 会自动从仓库中下载所需的软件包,用以替换当前系统的基础软件体系。 - -说明: -- 若选择公网地址,则 SysOM 会尝试从社区源 ([https://mirrors.openanolis.cn/)](https://mirrors.openanolis.cn/))取回数据,届时请确保主机可以访问公网; -- 若选择内网地址,则需要在内网搭建软件仓库,具体搭建方法可以参考社区知识库中的帮助信息([https://openanolis.cn/sig/migration/doc/447499505912234337](https://openanolis.cn/sig/migration/doc/447499505912234337))。 - | -| 备份配置 | 选择是否在迁移前进行备份,若不需要备份选择“不备份”,需要则选择“NFS备份”并填入NFS服务的IP地址、输入NFS的目录名称及该主机无需备份的目录名称。 | + +| **参数** | **说明** | +| -------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | +| 选择机器 | 显示所选机器。 | +| 迁移版本 | 选择机器迁移的目的操作系统版本。 | +| 选择内核 | 选择内核,目前仅支持迁移至ANCK内核。 | +| Repo配置 | 用于配置迁移实施的仓库 (其中仓库代指 yum 源软件仓库),此处可选择使用公网地址的默认地址或内网地址。在迁移实施阶段,SysOM 会自动从仓库中下载所需的软件包,用以替换当前系统的基础软件体系。 | +| 备份配置 | 选择是否在迁移前进行备份,若不需要备份选择“不备份”,需要则选择“NFS备份”并填入NFS服务的IP地址、输入NFS的目录名称及该主机无需备份的目录名称。 | + +> **说明:**
+> +> Repo配置 +> - 若选择公网地址,则 SysOM 会尝试从社区源 ([https://mirrors.openanolis.cn/)](https://mirrors.openanolis.cn/))取回数据,届时请确保主机可以访问公网; +> - 若选择内网地址,则需要在内网搭建软件仓库,具体搭建方法可以参考社区知识库中的帮助信息([https://openanolis.cn/sig/migration/doc/447499505912234337](https://openanolis.cn/sig/migration/doc/447499505912234337))。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/28856758/1677144084945-d49151d9-6d29-4309-b9fd-4a9e7230bef0.png#clientId=u1ca12cdf-d0b7-4&from=paste&height=660&id=u4ace76d5&name=image.png&originHeight=1320&originWidth=1928&originalType=binary&ratio=2&rotation=0&showTitle=false&size=515079&status=done&style=none&taskId=u7ef0a5ba-15e8-4efb-be2a-798dd794d5d&title=&width=964) -3. 点击“确定”,主机“迁移状态”变为“就绪中”。根据下表的步骤操作,当迁移状态为“就绪中”时,表示本次操作已完成,可以点击操作列“...”进行下一步操作,直至迁移完成,如果迁移状态为“失败”,失败原因可通过鼠标悬浮在迁移状态上查看。迁移中的所有操作步骤及说明如下。 -| **步骤** | **说明** | -| --- | --- | -| 迁移配置 | 配置迁移主机的迁移参数,详情参考步骤2。 | -| 系统备份 | 根据步骤2中的备份选择,如果选择NFS备份,则该步骤会对迁移主机进行备份。 | -| 环境准备 | 对迁移主机下发迁移工具,并安装部署。 | -| 风险评估 | 使用迁移工具进行风险评估,评估当前机器迁移的风险。 | -| 迁移实施 | 使用迁移工具进行迁移实施,将当前机器迁移到指定版本。 | -| 重启机器 | 迁移实施完成后,需要重启机器进行系统切换,重启之后才算本次迁移完成。 | +1. 点击“确定”,主机“迁移状态”变为“就绪中”。根据下表的步骤操作,当迁移状态为“就绪中”时,表示本次操作已完成,可以点击操作列“...”进行下一步操作,直至迁移完成,如果迁移状态为“失败”,失败原因可通过鼠标悬浮在迁移状态上查看。迁移中的所有操作步骤及说明如下。 + +| **步骤** | **说明** | +| -------- | ------------------------------------------------------------------------------------------------------ | +| 迁移配置 | 配置迁移主机的迁移参数,详情参考步骤2。 | +| 系统备份 | 根据步骤2中的备份选择,如果选择NFS备份,则该步骤会对迁移主机进行备份。 | +| 环境准备 | 对迁移主机下发迁移工具,并安装部署。 | +| 风险评估 | 使用迁移工具进行风险评估,评估当前机器迁移的风险。 | +| 迁移实施 | 使用迁移工具进行迁移实施,将当前机器迁移到指定版本。 | +| 重启机器 | 迁移实施完成后,需要重启机器进行系统切换,重启之后才算本次迁移完成。 | | 系统还原 | 如果原系统进行了备份,那么可以在当前机器的任意状态进行系统还原,即使已经完成迁移,也可以进行系统还原。 | -| 重置状态 | 如果发现配置错误或者想修改配置,则可以使用重置状态,重置当前主机的迁移状态。 | +| 重置状态 | 如果发现配置错误或者想修改配置,则可以使用重置状态,重置当前主机的迁移状态。 | ### 批量迁移实施 #### 操作步骤 @@ -314,23 +325,25 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字 1. 进入“监控中心”菜单,下拉菜单中选择点击”迁移监控“进入“迁移监控”页面。 2. 在左侧“机器列表”中点击需要查看的主机,右侧的监控面板,就会显示该主机的迁移监控各个指标。指标项简要说明: -| **指标栏** | 指标项 | **说明** | -| --- | --- | --- | -| 资源总额 | 原始/当前内核版本 | 指标项主要展示主机的一些主要资源的总体情况,包括:内核版本,内存总量,大页内存总量,磁盘空间,磁盘个数,网卡数量,启用的网卡数量等。 - -原始值:代表主机执行操作系统迁移前的情况。如果没有执行过操作系统迁移,那原始的值都为空(No data) -当前值:代表主机当前的资源情况 | -| | 原始/当前内存可用总量 | | -| | 原始/当前大页内存总量 | | -| | 原始/当前磁盘可用空间总量 | | -| | 原始/当前磁盘个数 | | -| | 原始/当前网卡数量 | | -| | 原始/当前启用网卡数量 | | -| 资源监控 | CPU | CPU个数,CPU当前的利用率,CPU两日的利用率,以及CPU利用率两日的波动情况。 | -| | Memory | Memory使用率,以及内存使用率波动情况 | -| | Disk | 磁盘空间总额,使用率,磁盘的IOPS | -| | Network | 网络流量监控,网络流量的波动情况 | -| | System Load | 系统负载值,以及系统负载的波动情况 | + +| **指标栏** | 指标项 | **说明** | +| ---------- | ------------------------- | ------------------------------------------------------------------------------------------------------------------------------------ | +| 资源总额 | 原始/当前内核版本 | 指标项主要展示主机的一些主要资源的总体情况,包括:内核版本,内存总量,大页内存总量,磁盘空间,磁盘个数,网卡数量,启用的网卡数量等。 | +| | 原始/当前内存可用总量 | | +| | 原始/当前大页内存总量 | | +| | 原始/当前磁盘可用空间总量 | | +| | 原始/当前磁盘个数 | | +| | 原始/当前网卡数量 | | +| | 原始/当前启用网卡数量 | | +| 资源监控 | CPU | CPU个数,CPU当前的利用率,CPU两日的利用率,以及CPU利用率两日的波动情况。 | +| | Memory | Memory使用率,以及内存使用率波动情况 | +| | Disk | 磁盘空间总额,使用率,磁盘的IOPS | +| | Network | 网络流量监控,网络流量的波动情况 | +| | System Load | 系统负载值,以及系统负载的波动情况 | + +> 原始值:代表主机执行操作系统迁移前的情况。如果没有执行过操作系统迁移,那原始的值都为空(No data) +> +> 当前值:代表主机当前的资源情况 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/260640/1676947587774-a7738ddd-4745-426d-aa52-aaf69ae64c91.png#clientId=uff2e0d99-6f01-4&from=paste&height=383&id=u94887f63&name=image.png&originHeight=626&originWidth=1247&originalType=binary&ratio=2&rotation=0&showTitle=false&size=119110&status=done&style=none&taskId=u2603d45f-242d-416b-b54c-bbec669f56c&title=&width=762) ### 系统监控 @@ -343,26 +356,21 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字 指标项简要说明(指标项太多,这里不会全列出来): -| **指标栏** | 指标项 | **说明** | -| --- | --- | --- | -| Quick CPU/Mem/Disk | CPU Busy | Quick CPU/Mem/Disk:主要是展示一个整机的大体资源使用情况,以及CPU/Mem/Disk等资源的总额情况。 -CPU Busy:整机的CPU使用率 -Sys Load:整机的负载 -RAM Used:整机的内存使用率 -Root FS Used:根文件系统使用率 -CPU cores:CPU个数 -Uptime:机器运行时长 | -| | Sys Load | | -| | RAM Used | | -| | Swap Used | | -| | Root FS Used | | -| | CPU cores | | -| | Uptime | | -| Basic CPU / Mem / Net / Disk | CPU Basic | CPU几种状态的占用率情况(System,User,IOwait,IRQS,idle,Other) | -| | Memory Basic | Memory使用率基本情况(Total,Used,Cache,free,swap) | -| | Network Traffic Basic | 网络流量收发情况 | -| | Disk Space Used Basic | 磁盘使用率情况 | -| 其它 | 省略 | 其它的监控指标主要是根据CPU/Mem/Net/Disk一个个深入展开的具体的指标项。 | +| **指标栏** | 指标项 | **说明** | +| ----------------------------------------------------------------------------------------------- | --------------------- | ---------------------------------------------------------------------- | +| Quick CPU/Mem/Disk
(主要展示一个整机的大体资源使用情况,以及CPU/Mem/Disk等资源的总额情况。) | CPU Busy | CPU Busy:整机的CPU使用率 | +| | Sys Load | 整机的负载 | +| | RAM Used | 整机的内存使用率 | +| | Swap Used | | +| | Root FS Used | 根文件系统使用率 | +| | CPU cores | CPU个数 | +| | Uptime | 机器运行时长 | +| Basic CPU / Mem / Net / Disk | CPU Basic | CPU几种状态的占用率情况(System,User,IOwait,IRQS,idle,Other) | +| | Memory Basic | Memory使用率基本情况(Total,Used,Cache,free,swap) | +| | Network Traffic Basic | 网络流量收发情况 | +| | Disk Space Used Basic | 磁盘使用率情况 | +| 其它 | 省略 | 其它的监控指标主要是根据CPU/Mem/Net/Disk一个个深入展开的具体的指标项。 | + ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/260640/1676947044123-058f35f3-50a7-4894-88a2-3527fc06b4f1.png#clientId=u097c80c9-81cf-4&from=paste&height=605&id=ubc3b4707&name=image.png&originHeight=1210&originWidth=2830&originalType=binary&ratio=2&rotation=0&showTitle=false&size=2365563&status=done&style=none&taskId=uf3c4ae15-bbb9-43fd-ab26-30fc5204beb&title=&width=1415) ## 宕机中心 @@ -379,19 +387,19 @@ Uptime:机器运行时长 | 指标说明: -| **指标栏** | 指标项 | **说明** | -| --- | --- | --- | -| 核心指标 | 最近30天的宕机 | 最近30天的宕机总数 | -| | 最近7天宕机总数 | 最近7天宕机总数 | -| | 月宕机率 | 一个月内宕机的主机数 / 主机列表机器数 | -| | 日宕机率(后续修正为“最近7天宕机率”) | 最近7天的宕机的主机数 / 主机列表机器数 | -| 宕机列表 | 主机名称 | 发生宕机的主机名称 | -| | IP | 发生宕机的主机IP | -| | 宕机时间 | 发生宕机的时间 | -| | 内核版本 | 发生宕机的主机的内核版本 | -| | Vmcore | 是否有vmcore产生 | -| | 解决方案 | 是否有对应的解决方案 | -| | 宕机详情 | 跳转查看宕机的详细信息 | +| **指标栏** | 指标项 | **说明** | +| ---------- | ------------------------------------- | -------------------------------------- | +| 核心指标 | 最近30天的宕机 | 最近30天的宕机总数 | +| | 最近7天宕机总数 | 最近7天宕机总数 | +| | 月宕机率 | 一个月内宕机的主机数 / 主机列表机器数 | +| | 日宕机率(后续修正为“最近7天宕机率”) | 最近7天的宕机的主机数 / 主机列表机器数 | +| 宕机列表 | 主机名称 | 发生宕机的主机名称 | +| | IP | 发生宕机的主机IP | +| | 宕机时间 | 发生宕机的时间 | +| | 内核版本 | 发生宕机的主机的内核版本 | +| | Vmcore | 是否有vmcore产生 | +| | 解决方案 | 是否有对应的解决方案 | +| | 宕机详情 | 跳转查看宕机的详细信息 | ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/260640/1677135469600-b0b59788-37b0-4cc6-8162-1611b2505ea0.png#clientId=u9bab3d2c-0e11-4&from=paste&height=318&id=ua4c89388&name=image.png&originHeight=1208&originWidth=2818&originalType=binary&ratio=2&rotation=0&showTitle=false&size=1615561&status=done&style=none&taskId=ue7480e9c-8434-41dd-83e9-e032fc10a25&title=&width=742) @@ -450,26 +458,24 @@ CPU长时间在内核态执行,导致用户态进程长期得不到调度, ##### 2. 功能描述 记录调度抖动发生的时间点、发生的次数、和抖动的具体数值,可以帮助用户更好的定位调度抖动的根因。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | -| 诊断时间 | 持续诊断时长(时间单位:s) | 默认为 20s | -| 诊断阈值 | 延迟的阈值(时间单位:ms),超过这个阈值的延迟样本将会被记录,低于阈值的延迟样本将会被忽略 | 默认为 20ms | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | ------------------------------------------------------------------------------------------ | ------------ | +| 实例IP | 目标Node节点的IP | 必填 | +| 诊断时间 | 持续诊断时长(时间单位:s) | 默认为 20s | +| 诊断阈值 | 延迟的阈值(时间单位:ms),超过这个阈值的延迟样本将会被记录,低于阈值的延迟样本将会被忽略 | 默认为 20ms | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677132668406-40082593-48f8-412d-8f3a-3167abd3fe7b.png#clientId=udea570a5-e4cf-4&from=paste&height=945&id=uc4e69a94&name=image.png&originHeight=1890&originWidth=3802&originalType=binary&ratio=2&rotation=0&showTitle=false&size=595484&status=done&style=none&taskId=uefd45ea4-edb9-419e-8109-fc2c3f6a0f5&title=&width=1901) -**事件总览:**目前有3类事件:调度延迟、sys延迟和irq延迟。不同的事件由具体的告警与否(及颜色)来分辨。蓝色表示有告警事件发生,绿色表示正常。 +**事件总览:** 目前有3类事件:调度延迟、sys延迟和irq延迟。不同的事件由具体的告警与否(及颜色)来分辨。蓝色表示有告警事件发生,绿色表示正常。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677138731310-13f56604-a4e8-41eb-ae2b-194117e30bf2.png#clientId=u9cf628e7-b5c5-4&from=paste&height=231&id=uf6edb7a1&name=image.png&originHeight=462&originWidth=2102&originalType=binary&ratio=2&rotation=0&showTitle=false&size=43041&status=done&style=none&taskId=u71070adc-701c-4d4e-934b-17ff9de8730&title=&width=1051) -**抖动时间线图:**记录了调度抖动发生的时间点、发生的次数、和抖动的具体数值。 +**抖动时间线图:** 记录了调度抖动发生的时间点、发生的次数、和抖动的具体数值。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677138739739-7dbaa9ef-6f26-4695-8f83-6cd4ef3e04cf.png#clientId=u9cf628e7-b5c5-4&from=paste&height=398&id=ud1a07ad3&name=image.png&originHeight=796&originWidth=2690&originalType=binary&ratio=2&rotation=0&showTitle=false&size=87591&status=done&style=none&taskId=uf8f20f42-d0aa-4b73-8fde-e76ae54acaa&title=&width=1345) -**调度抖动详情:**将调具体的度抖动事件以table的方式展示出来,下面是表中各列指标说明。 +**调度抖动详情:** 将调具体的度抖动事件以table的方式展示出来,下面是表中各列指标说明。 + +| date | class | latency | cpu | current | stamp | extern | +| ------------------------------ | --------------------------------------------------------------- | ------------------------ | ----------------------- | ------------------------- | ---------------------------------- | ----------------------------------------------------------------------------------------------------------------------------- | +| 表示调度抖动告警事件发生的日期 | 表示具体的调度抖动事件类型。目前有调度延迟、sys延迟和irq延迟3类 | 具体的抖动延迟值,单位ms | 调度抖动告警发生的cpu号 | 受干扰的当前任务名字和pid | 发生调度抖动告警时的机器上的时间戳 | 额外信息。不同的class有不同的额外信息:
调度延迟:nr_running 表示cpu队列上的排队的任务数量,prev表示当前cpu上前一个任务 | -| date | class | latency | cpu | current | stamp | extern | -| --- | --- | --- | --- | --- | --- | --- | -| 表示调度抖动告警事件发生的日期 | 表示具体的调度抖动事件类型。目前有调度延迟、sys延迟和irq延迟3类 | 具体的抖动延迟值,单位ms | 调度抖动告警发生的cpu号 | 受干扰的当前任务名字和pid | 发生调度抖动告警时的机器上的时间戳 | 额外信息。不同的class有不同的额外信息: -调度延迟:nr_running 表示cpu队列上的排队的任务数量,prev表示当前cpu上前一个任务 -sys延迟:发生调度抖动告警时的上下文堆栈 -irq延迟:发生调度抖动告警时的上下文堆栈 | ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677132864111-201fcc24-7dfe-4473-8f7b-dcd2571c13d3.png#clientId=udea570a5-e4cf-4&from=paste&height=793&id=u65c78130&name=image.png&originHeight=1586&originWidth=3764&originalType=binary&ratio=2&rotation=0&showTitle=false&size=828612&status=done&style=none&taskId=u6d73bb66-2e3a-48b1-8108-5e710bcfd59&title=&width=1882) ##### 5. 离线导入 @@ -483,17 +489,17 @@ irq延迟:发生调度抖动告警时的上下文堆栈 | ##### 2. 功能描述 SysOM 负载分析诊断功能主要分析系统负载情况,进程分布及对系统的影响。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | ---------------- | ------------ | +| 实例IP | 目标Node节点的IP | 必填 | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677127796784-e831ddd6-da5e-49cf-8c9f-4cd296367dc8.png#clientId=ue682e09a-300a-4&from=paste&height=823&id=ub219d906&name=image.png&originHeight=1646&originWidth=3040&originalType=binary&ratio=2&rotation=0&showTitle=false&size=641715&status=done&style=none&taskId=ub183ae63-3ad1-41b6-ad0b-812f0399e26&title=&width=1520) -**事件总览:**显示当前系统负载,并诊断负载是否对系统sys utils、硬中断、软中断、io有影响。 +**事件总览:** 显示当前系统负载,并诊断负载是否对系统sys utils、硬中断、软中断、io有影响。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677127819058-ec41e152-83ea-4df3-8a68-d60ec2a03645.png#clientId=ue682e09a-300a-4&from=paste&height=204&id=u64f7ce5f&name=image.png&originHeight=408&originWidth=2986&originalType=binary&ratio=2&rotation=0&showTitle=false&size=125401&status=done&style=none&taskId=u87b83c07-3109-4830-b0a0-ef0a1654f36&title=&width=1493) -**进程分布:**诊断当前系统R和D状态的分布情况和导致系统负载高的贡献度。 +**进程分布:** 诊断当前系统R和D状态的分布情况和导致系统负载高的贡献度。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677127870190-debd0772-4c89-4e28-bc5d-bacc764db3af.png#clientId=ue682e09a-300a-4&from=paste&height=318&id=uad6374bb&name=image.png&originHeight=636&originWidth=2994&originalType=binary&ratio=2&rotation=0&showTitle=false&size=215779&status=done&style=none&taskId=u4167986f-dccf-4c2b-8b89-558a2032f44&title=&width=1497) -**调度火焰图:**显示系统调度火焰图,可直接查询导致负载高的热点函数。 +**调度火焰图:** 显示系统调度火焰图,可直接查询导致负载高的热点函数。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677127903528-6adb580f-27b5-4572-b152-89c9da74bfdc.png#clientId=ue682e09a-300a-4&from=paste&height=356&id=u6298def1&name=image.png&originHeight=712&originWidth=2990&originalType=binary&ratio=2&rotation=0&showTitle=false&size=286016&status=done&style=none&taskId=ubf75427c-59df-42ec-8c9a-b6e1f762550&title=&width=1495) ##### 5. 离线导入 使用方式同调度抖动诊断 @@ -502,10 +508,10 @@ SysOM 负载分析诊断功能主要分析系统负载情况,进程分布及 ##### 2.功能描述 profile系统的热点应用(占用cpu多的任务),对热点应用给出性能分析,统计应用的用户态与内核态的热点栈占比,最终展示系统top 10的热点应用排布。 ##### 3.诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | -| 时间 | 诊断时长 | 选填,默认5min | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | ---------------- | -------------- | +| 实例IP | 目标Node节点的IP | 必填 | +| 时间 | 诊断时长 | 选填,默认5min | ##### 4.在线诊断 参数输入 @@ -531,26 +537,26 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO ##### 2. 功能描述 记录存储设备的历史IO延迟水位,并且统计每分钟访问 IO 延迟偏离历史水位的次数,用于快速定位导致 IO 延迟偏高的位置。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | -| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | -| 时间阈值 | 保留IO延迟大于设定时间阈值的IO(时间单位:ms) | 必填,默认为 1000ms | -| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | ---------------------------------------------- | ---------------------------- | +| 实例IP | 目标Node节点的IP | 必填 | +| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | +| 时间阈值 | 保留IO延迟大于设定时间阈值的IO(时间单位:ms) | 必填,默认为 1000ms | +| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677134356775-c1ac3cd7-63e8-40a5-baf5-497137406cd3.png#clientId=udea570a5-e4cf-4&from=paste&height=892&id=u9b8b11c0&name=image.png&originHeight=1784&originWidth=3758&originalType=binary&ratio=2&rotation=0&showTitle=false&size=651860&status=done&style=none&taskId=u6c99969e-bd2b-40de-a8dc-4af364e52ed&title=&width=1879)**iolantency 总览:** 表示在一个诊断周期内,捕捉到的超时IO的个数,个数为0时,check result的状态为normal,字体显示绿色,表示当前无异常的慢IO,个数不为0时,check result的状态为abnormal,字体显示红色,表示当前存在超出阈值的慢IO;_注意:阈值在发起诊断的时候可以指定,不指定情况下,默认为1000ms,_在诊断结果最右侧支持磁盘的checklist选择展示不同磁盘的数据,切换数据展示。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677134439288-b5272556-37d9-43c8-895b-b86abebf963d.png#clientId=udea570a5-e4cf-4&from=paste&height=69&id=ubbf5fc0f&name=image.png&originHeight=137&originWidth=1500&originalType=binary&ratio=2&rotation=0&showTitle=false&size=106126&status=done&style=none&taskId=ua7dec00d-f6ee-492d-8a25-d7708dad113&title=&width=750) -**整体 IO 时延分布:**这部分展示IO整体在OS以及磁盘各个存储链路上的延迟分布,每个框图中的指标解读为: +**整体 IO 时延分布:** 这部分展示IO整体在OS以及磁盘各个存储链路上的延迟分布,每个框图中的指标解读为: - 左上角为链路名,分别表示IO在经过此路径的延迟损耗,其中主要包括OS、Disk两部分,又根据IO的生命周期,进一步将OS中细分为block、driver、complete三部分(分别表示内核通用块层、驱动、IO完成后回收三部分) - 右上角表示在此链路耗时占整体耗时的百分比 - 中间的max_us、avg_us、min_us则分别表示IO在此路径上的最大延迟、平均延迟、最小延迟,单位us。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677134489224-0976eb85-a3ed-4e12-a7cc-ad1769fe84b0.png#clientId=udea570a5-e4cf-4&from=paste&height=112&id=u7e07642c&name=image.png&originHeight=223&originWidth=1499&originalType=binary&ratio=2&rotation=0&showTitle=false&size=169868&status=done&style=none&taskId=u288467a1-4305-4c91-a437-4f081eb1aa5&title=&width=749.5) -**单 IO 时延 metrics 展示:**该部分将捕捉到的每一个超时IO,通过时序数据曲线的方式展示出来,X轴为时间日期,Y轴为延迟(单位us),图中有5条曲线,分别表示每个IO的total delay、block delay、driver delay、disk delay、complete delay,可以看出这个是更细粒度的针对每一个IO在存储各链路上的延迟分布。 +**单 IO 时延 metrics 展示:** 该部分将捕捉到的每一个超时IO,通过时序数据曲线的方式展示出来,X轴为时间日期,Y轴为延迟(单位us),图中有5条曲线,分别表示每个IO的total delay、block delay、driver delay、disk delay、complete delay,可以看出这个是更细粒度的针对每一个IO在存储各链路上的延迟分布。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677134537042-2c169564-224e-491a-84c8-43481488fc85.png#clientId=udea570a5-e4cf-4&from=paste&height=112&id=u60be37f1&name=image.png&originHeight=223&originWidth=1500&originalType=binary&ratio=2&rotation=0&showTitle=false&size=183726&status=done&style=none&taskId=u7a746161-5078-4096-a72e-1d5452289cc&title=&width=750) -**Top 10 IO 详情:**这部分展示了IO总延迟大小排在前TOP10的IO的更多细节 +**Top 10 IO 详情:** 这部分展示了IO总延迟大小排在前TOP10的IO的更多细节 - `time`:表示检测到此超时IO的时间日期,精确到ms; - `abnormal`:表示此IO延迟消耗最大的原因,以“延迟最大的路径(此路径耗时:IO整体耗时 单位)”形式展示; @@ -576,11 +582,11 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO ##### 2. 功能描述 此功能主要分析系统中的IO流量归属。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | -| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 15s | -| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | ---------------------------------- | ---------------------------- | +| 实例IP | 目标Node节点的IP | 必填 | +| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 15s | +| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677138825146-ae5e7247-2ab3-44d0-b44b-3ed58d3dbcae.png#clientId=u9cf628e7-b5c5-4&from=paste&height=944&id=ud8785c8b&name=image.png&originHeight=1888&originWidth=3806&originalType=binary&ratio=2&rotation=0&showTitle=false&size=703440&status=done&style=none&taskId=u60e0d68f-8e58-4d83-ab2c-953362e7660&title=&width=1903) @@ -588,7 +594,7 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677138868602-f7335677-dd14-433c-83fa-4e29ae2a96d6.png#clientId=u9cf628e7-b5c5-4&from=paste&height=74&id=u4db10619&name=image.png&originHeight=148&originWidth=1500&originalType=binary&ratio=2&rotation=0&showTitle=false&size=135486&status=done&style=none&taskId=uc8dcb969-06db-4f6e-9ca0-cf4fd14a852&title=&width=750) 在诊断结果最右侧支持磁盘的checklist选择展示不同磁盘的数据,注意切换的是即将介绍的**磁盘IO流量分析、进程IO流量分析、进程IO块大小分析**这三部分的数据展示: ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677138882702-eb477d27-05aa-418a-b2f0-9fe3d2969bae.png#clientId=u9cf628e7-b5c5-4&from=paste&height=35&id=ubf16c8d4&name=image.png&originHeight=69&originWidth=218&originalType=binary&ratio=2&rotation=0&showTitle=false&size=11242&status=done&style=none&taskId=u912b215a-f316-4037-8a7e-ce30f5c5eb8&title=&width=109) -**磁盘 IO 流量分析:**该部分展示诊断期间,统计到的磁盘IO流量,支持通过磁盘的checklist选择展示不同磁盘的数据,主要字段: +**磁盘 IO 流量分析:** 该部分展示诊断期间,统计到的磁盘IO流量,支持通过磁盘的checklist选择展示不同磁盘的数据,主要字段: - `diskname`:磁盘/分区名称 - `r_rqm`:诊断期间合并读操作的次数 @@ -601,7 +607,7 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO - `util%`:该硬盘设备的繁忙比率 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677138934013-67f9aebd-fac7-4c97-b184-2e8b22e5ae69.png#clientId=u9cf628e7-b5c5-4&from=paste&height=73&id=u032310db&name=image.png&originHeight=146&originWidth=1500&originalType=binary&ratio=2&rotation=0&showTitle=false&size=117258&status=done&style=none&taskId=u91c717a3-12c2-4b1e-b8e0-e87ed24f73c&title=&width=750) -**进程 IO 流量分析:**该部分展示诊断期间,进程级别IO流量,支持通过磁盘的checklist选择展示不同磁盘的数据,主要字段: +**进程 IO 流量分析:** 该部分展示诊断期间,进程级别IO流量,支持通过磁盘的checklist选择展示不同磁盘的数据,主要字段: - `comm` : 进程名 - **tgid:pid** : 进程id信息 @@ -615,7 +621,7 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO 其中尤其注意到,该功能支持kworker刷脏的IO溯源能力,所以可以看到在kworker进程下面存在子项,展开可以看到实际产生脏页(写buffer io)的进程 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2022/png/326738/1670325261877-41b2c2aa-a8a2-4d3f-9f93-c0868ec24c3a.png#clientId=ue6caa064-d3a4-4&from=paste&height=321&id=uea3c9926&name=image.png&originHeight=321&originWidth=2492&originalType=binary&ratio=1&rotation=0&showTitle=false&size=364051&status=done&style=none&taskId=u08d1dba0-4f74-43af-bdb5-ce9cb2e0869&title=&width=2492) -**进程 IO 块大小分析:**该部分展示诊断期间,进程级别IO提交到OS块层的块大小分布,支持通过磁盘的checklist选择展示不同磁盘的数据,其中pat_WNK,表示IO大小为nKB以内的IO个数占比,large则表示大于512KB的大块IO的占比。 +**进程 IO 块大小分析:** 该部分展示诊断期间,进程级别IO提交到OS块层的块大小分布,支持通过磁盘的checklist选择展示不同磁盘的数据,其中pat_WNK,表示IO大小为nKB以内的IO个数占比,large则表示大于512KB的大块IO的占比。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677139232917-d427d1a8-08f7-4f4c-92b3-4dfd8b612e98.png#clientId=u9cf628e7-b5c5-4&from=paste&height=76&id=u5f99e14e&name=image.png&originHeight=152&originWidth=1500&originalType=binary&ratio=2&rotation=0&showTitle=false&size=122755&status=done&style=none&taskId=u6d1a9866-008d-4bc0-9272-4350f25b6ce&title=&width=750) ##### 5. 离线导入 使用方式同调度抖动诊断。 @@ -625,20 +631,20 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO ##### 2. 功能描述 监控系统每个存储设备的IO访问路径上是否存在IO HANG问题。(检测出问题后,可以选择将IO流量切换到正常的存储设备上,隔离异常的存储设备) ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | -| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | -| 时间阈值 | 保留IO延迟大于设定时间阈值的IO(时间单位:ms) | 必填,默认为 5000ms | -| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | ---------------------------------------------- | ---------------------------- | +| 实例IP | 目标Node节点的IP | 必填 | +| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | +| 时间阈值 | 保留IO延迟大于设定时间阈值的IO(时间单位:ms) | 必填,默认为 5000ms | +| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677139397599-97f1f049-a30d-40e2-8c9b-25713a8e2fe6.png#clientId=u9cf628e7-b5c5-4&from=paste&height=940&id=ud4c445ec&name=image.png&originHeight=1880&originWidth=3806&originalType=binary&ratio=2&rotation=0&showTitle=false&size=630233&status=done&style=none&taskId=u8cf1b013-caba-451c-8f18-0fccfca168c&title=&width=1903) -**IO HANG 总览:**表示在一个诊断周期内,检测是否有IO HANG,无IO HANG时,check result的状态为normal,字体显示绿色,有IO HANG时,check result的状态为abnormal,字体显示红色,而Number of OS HANG或者Number of Disk HANG,分别表示IO HANG在OS或者磁盘的IO个数。 +**IO HANG 总览:** 表示在一个诊断周期内,检测是否有IO HANG,无IO HANG时,check result的状态为normal,字体显示绿色,有IO HANG时,check result的状态为abnormal,字体显示红色,而Number of OS HANG或者Number of Disk HANG,分别表示IO HANG在OS或者磁盘的IO个数。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677139960819-0f82dd81-f072-4294-88e3-96e40c28abf3.png#clientId=u9cf628e7-b5c5-4&from=paste&height=63&id=u11fa23de&name=image.png&originHeight=125&originWidth=1500&originalType=binary&ratio=2&rotation=0&showTitle=false&size=95838&status=done&style=none&taskId=u5198ce42-724b-4f41-9860-d184b85dd74&title=&width=750) 在诊断结果最右侧支持磁盘的checklist选择展示不同磁盘的数据,切换数据展示: ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677139975471-0f420d95-1b44-4333-98de-eaef23355cfa.png#clientId=u9cf628e7-b5c5-4&from=paste&height=35&id=ua3921d94&name=image.png&originHeight=69&originWidth=218&originalType=binary&ratio=2&rotation=0&showTitle=false&size=11242&status=done&style=none&taskId=ud3180ae9-f06a-456b-9376-2c1ff0984f0&title=&width=109) -**TOP 10 详情:**这部分展示了HANG住持续时间的前TOP 10个IO的详情 +**TOP 10 详情:** 这部分展示了HANG住持续时间的前TOP 10个IO的详情 - `time`:表示检测到此IO HANG的时间日期,精确到ms - `abnormal`:表示此IO HANG在哪,以“HANG在哪(具体原因)HANG了多久”形式展示 @@ -665,10 +671,10 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO ##### 2. 功能描述 记录丢包事件、丢包发生的硬件或网卡设备、丢包点等,并进一步分析丢包的原因,帮助用户诊断定位网络丢包的问题。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | -| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | --------------------------- | ---------------- | +| 实例IP | 目标Node节点的IP | 必填 | +| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677141484801-4643a7ce-c329-47a5-b4d4-3401b78387cd.png#clientId=u9cf628e7-b5c5-4&from=paste&height=780&id=uc459331d&name=image.png&originHeight=1560&originWidth=3798&originalType=binary&ratio=2&rotation=0&showTitle=false&size=534838&status=done&style=none&taskId=ucdacd65a-7214-4067-80cf-a6dacc27bf7&title=&width=1899) @@ -687,10 +693,10 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO ##### 2. 功能描述 基于 ICMP 报文,测出 ping 发起端的报文时延(发送路径)以及 ping 接收端的报文时延(接收路径)。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | -| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | --------------------------- | ---------------- | +| 实例IP | 目标Node节点的IP | 必填 | +| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677143053862-c1061938-c56d-4e30-8fb1-550c52df1b5a.png#clientId=u9cf628e7-b5c5-4&from=paste&height=942&id=u3952bbc2&name=image.png&originHeight=1884&originWidth=3806&originalType=binary&ratio=2&rotation=0&showTitle=false&size=594860&status=done&style=none&taskId=u0c0748e2-9792-4d3e-a3a6-022dcd42ad7&title=&width=1903) @@ -702,10 +708,10 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO ##### 2. 功能描述 记录重传的时间、IP、TCP socket所处的状态和拥塞情况,帮助用户了解网络重传发生的情况。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | -| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | --------------------------- | ---------------- | +| 实例IP | 目标Node节点的IP | 必填 | +| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677143413688-f3392633-bac3-4f26-a507-ef65ae80dcf1.png#clientId=u9cf628e7-b5c5-4&from=paste&height=950&id=udc3208e3&name=image.png&originHeight=1900&originWidth=3798&originalType=binary&ratio=2&rotation=0&showTitle=false&size=610553&status=done&style=none&taskId=u1eaa3e9b-4795-409e-946e-9846ecda0a2&title=&width=1899) @@ -723,25 +729,25 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO ##### 2. 功能描述 抖动诊断目前仅支持icmp报文,即ping。其包含两个部分,一个是ping发起端的报文时延,即发送报文路径,另外一个是ping接收端的报文时延,即接收报文路径。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 源实例IP | 源节点IP | 必填 | -| 目标实例IP | 目的节点IP | 必填 | -| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | -| 追踪包数 | 模拟发包的最大报文数 | 必填,默认为 100 | -| 间隔毫秒数 | 模拟发包时两次发包的 -间隔毫秒数(时间单位:ms) | 必填,默认为 1000ms | -| 报文协议 | 模拟发包的报文协议 | 必填,默认为ICMP | +| **参数名** | **参数说明** | **是否必填** | +| -------------------------- | --------------------------- | ---------------- | +| 源实例IP | 源节点IP | 必填 | +| 目标实例IP | 目的节点IP | 必填 | +| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s | +| 追踪包数 | 模拟发包的最大报文数 | 必填,默认为 100 | +| 间隔毫秒数 | 模拟发包时两次发包的 | +| 间隔毫秒数(时间单位:ms) | 必填,默认为 1000ms | +| 报文协议 | 模拟发包的报文协议 | 必填,默认为ICMP | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677144163112-8ecdeab8-bfc6-4d2c-8db1-a0b751dffcf6.png#clientId=u9cf628e7-b5c5-4&from=paste&height=942&id=ud96a1bc1&name=image.png&originHeight=1884&originWidth=3822&originalType=binary&ratio=2&rotation=0&showTitle=false&size=684705&status=done&style=none&taskId=u482d03c1-2a6b-4079-9e53-43529ac6acc&title=&width=1911) -**发送报文路径:**发送报文路径是 ping 的发起端的 icmp 报文时延信息,包含: +**发送报文路径:** 发送报文路径是 ping 的发起端的 icmp 报文时延信息,包含: 1. 内核发送:表示 icmp echo 报文在内核发送路径的时延; 2. 外部链路:表示 icmp 报文在外部链路的耗时; 3. 内核接收:表示 icmp echo reply报文内核接收路径的时延。 -**接收报文路径:**接收报文路径是ping的接收端的 icmp 报文时延信息,包含: +**接收报文路径:** 接收报文路径是ping的接收端的 icmp 报文时延信息,包含: 1. 内核接受:表示 icmp echo 报文在内核接收路径的时延; 2. 内核发送:表示 icmp echo reply 报文内核发送路径的时延。 @@ -760,13 +766,13 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO ##### 2. 功能描述 对内存的整体分布和组成进行分析和展示。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | ---------------- | ------------ | +| 实例IP | 目标Node节点的IP | 必填 | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677144625942-87cca12d-46c0-40ed-b553-1e710e792902.png#clientId=u9cf628e7-b5c5-4&from=paste&height=939&id=uc6526bbd&name=image.png&originHeight=1878&originWidth=3802&originalType=binary&ratio=2&rotation=0&showTitle=false&size=607548&status=done&style=none&taskId=u28539274-ea8c-486a-b99c-6442cf52874&title=&width=1901) -**内存事件:**主要对内存相关风险一键检查,快速识别系统是否存在内存问题 +**内存事件:** 主要对内存相关风险一键检查,快速识别系统是否存在内存问题 - 内存利用率:系统内存利用率; - 内存泄漏:排查系统是否存在泄漏,以及泄漏的类型,目前支持slab, vmalloc和伙伴系统三种泄漏识别; @@ -774,20 +780,20 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO - 内存碎片化:评估系统是否存在内存碎片化,内存碎片化会导致系统性能下降 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677144853316-15bbf7a0-6cd0-4913-8a6a-3ae832194408.png#clientId=u9cf628e7-b5c5-4&from=paste&height=177&id=K698q&name=image.png&originHeight=354&originWidth=3768&originalType=binary&ratio=2&rotation=0&showTitle=false&size=73698&status=done&style=none&taskId=uac94aab5-f02b-46b2-be8d-128305980a8&title=&width=1884) -**内存总览(Overview):**内存总览展示系统所有内存的使用情况,实现内存的可维可测可追踪(1+1+1=3),也就是总内存 = 内核内存(kernel) + 应用内存(app) + 空闲内存(free),然后再进一步细分内核内存和应用内存。 +**内存总览(Overview):** 内存总览展示系统所有内存的使用情况,实现内存的可维可测可追踪(1+1+1=3),也就是总内存 = 内核内存(kernel) + 应用内存(app) + 空闲内存(free),然后再进一步细分内核内存和应用内存。 - **总内存** - `kernel`:表示操作系统内核内存总使用量 - `app`:表示用户态程序内存总使用量 - `free`:系统空闲内存 -- **内核内存:**内核态内存,我们重点关注Sunreclaim,伙伴系统的使用量,我们通常说的内存泄漏通常都是这两个指标异常。 +- **内核内存:** 内核态内存,我们重点关注Sunreclaim,伙伴系统的使用量,我们通常说的内存泄漏通常都是这两个指标异常。 - `Sreclaimable`:Slab可回收内存 - `Sunreclaim`:Slab不可回收内存 - `PageTables`:内核页表占用内存 - `Vmalloc`:内核调用vmalloc分配的内存 - `KernelStack`:进程的内核堆栈总内存 - `AllocPages`:内核调用alloc_pages等接口直接从伙伴系统分配的内存量,这类内存无法通过任何节点文件获取,使用过多会造成内存黑洞。 -- **应用内存 => **用户态内存,我们重点关注anon,shmem,filecache +- **应用内存:** 用户态内存,我们重点关注anon,shmem,filecache - `filecache`:文件缓存内存,这类内存可以通过drop caches回收。 - `anon`:匿名内存,程序堆和栈内存,匿名内存占用过多,需要评估业务进程是否有内存泄漏,系统是否开启了透明大页。 - `mlock`:系统锁住的内存量 @@ -796,9 +802,9 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO - `shmem`:共享内存(tmpfs)。业务进程退出后,经常会忘记删除tmpfs文件,或者在打开状态,直接删掉tmpfs文件,都会操作shmem泄漏。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677144941122-887f04de-3c78-4799-b945-82c38fb84170.png#clientId=u9cf628e7-b5c5-4&from=paste&height=318&id=u42554d07&name=image.png&originHeight=636&originWidth=3776&originalType=binary&ratio=2&rotation=0&showTitle=false&size=313175&status=done&style=none&taskId=u8a61d346-a44d-404d-b185-f858f516ca6&title=&width=1888) -**进程内存:**以进程维度按内存大小排序,并分解成匿名内存,文件缓存,共享内存。 +**进程内存:** 以进程维度按内存大小排序,并分解成匿名内存,文件缓存,共享内存。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677144996803-3c621680-3d6a-4b0b-8225-fb83d8f1687a.png#clientId=u9cf628e7-b5c5-4&from=paste&height=661&id=ud89601a9&name=image.png&originHeight=1322&originWidth=3728&originalType=binary&ratio=2&rotation=0&showTitle=false&size=362567&status=done&style=none&taskId=u9c251029-5c81-49df-adaf-56d901c80bd&title=&width=1864) -**Cache Top:**展示 Cache 占用最多前五个文件和对应的进程。 +**Cache Top:** 展示 Cache 占用最多前五个文件和对应的进程。 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677145200611-ee2ae307-71c5-4bfe-b860-1e5eaa110014.png#clientId=u9cf628e7-b5c5-4&from=paste&height=479&id=uc298d0f7&name=image.png&originHeight=958&originWidth=3752&originalType=binary&ratio=2&rotation=0&showTitle=false&size=442985&status=done&style=none&taskId=u0ac75179-64d0-4550-a05e-b27847e440b&title=&width=1876) ##### 5. 离线导入 使用方式同调度抖动诊断。 @@ -808,11 +814,11 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO ##### 2. 功能描述 分析容器,容器组,整机,cgroup的cache内存由哪些文件引入,以及每个文件引入的active cache和inactive cache。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | -| 容器 | 容器ID或者pod名 | 必填,默认填空字符串"" | -| 诊断类型 | 诊断类型: +| **参数名** | **参数说明** | **是否必填** | +| ---------- | ---------------- | ---------------------- | +| 实例IP | 目标Node节点的IP | 必填 | +| 容器 | 容器ID或者pod名 | 必填,默认填空字符串"" | +| 诊断类型 | 诊断类型: | all: 诊断实例上所用容器cache host: 诊断实例主机cache pod:诊断pod内部cache @@ -820,7 +826,7 @@ container: 诊断容器内部cache | 必填,默认填"all" | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677145357171-f160858c-b3a5-4aaa-9800-d41a17a903db.png#clientId=u9cf628e7-b5c5-4&from=paste&height=858&id=uc920c01c&name=image.png&originHeight=1716&originWidth=3778&originalType=binary&ratio=2&rotation=0&showTitle=false&size=672942&status=done&style=none&taskId=ue66ad097-79ec-458c-93e4-e3e2fdd6b4c&title=&width=1889) -**缓存排序:**对缓存占用最多的几个文件的组成进行分析展示 +**缓存排序:** 对缓存占用最多的几个文件的组成进行分析展示 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677145467075-cf6a3759-9ab3-4153-bbf0-20000d6aa6c3.png#clientId=u9cf628e7-b5c5-4&from=paste&height=722&id=u4c34e39e&name=image.png&originHeight=1444&originWidth=3750&originalType=binary&ratio=2&rotation=0&showTitle=false&size=815748&status=done&style=none&taskId=u381854d4-5e9e-434d-8f65-c658c11b1c1&title=&width=1875) ##### 5. 离线导入 使用方式同调度抖动诊断。 @@ -830,10 +836,10 @@ container: 诊断容器内部cache | 必填,默认填"all" | ##### 2. 功能描述 本项诊断功能可以帮助用户定位定位内存泄漏的位置,并分析导致内存泄露的原因。 ##### 3. 诊断参数 -| **参数名** | **参数说明** | **是否必填** | -| --- | --- | --- | -| 实例IP | 目标Node节点的IP | 必填 | -| 诊断时间 | 指定检测某个过去的时间,不指定代表检查最近一次,填写格式为:unix毫秒时间戳 | 选填 | +| **参数名** | **参数说明** | **是否必填** | +| ---------- | -------------------------------------------------------------------------- | ------------ | +| 实例IP | 目标Node节点的IP | 必填 | +| 诊断时间 | 指定检测某个过去的时间,不指定代表检查最近一次,填写格式为:unix毫秒时间戳 | 选填 | ##### 4. 在线诊断 ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/67256280/1677145599442-a8dffcad-dea6-4a02-88e6-a56352c60e45.png#clientId=u9cf628e7-b5c5-4&from=paste&height=943&id=ub2028e23&name=image.png&originHeight=1886&originWidth=3814&originalType=binary&ratio=2&rotation=0&showTitle=false&size=591617&status=done&style=none&taskId=u9dcfc111-3f5d-498c-9d07-6f20e1a567e&title=&width=1907) @@ -855,14 +861,15 @@ container: 诊断容器内部cache | 必填,默认填"all" | 1. 进入“日志中心”菜单,下拉菜单中选择点击”审计日志“进入“审计日志”页面。 2. 在“审计日志”界面中,会展示所有接口调用的情况。日志列表简要说明: -| 列表名 | 说明 | -| --- | --- | -| 时间 | API接口访问时间 | -| 用户 | API接口调用的用户 | -| 源IP | 用户源IP | -| 请求URL | 接口API | -| 请求方法 | 接口API的请求方法,GET/POST等 | -| 返回状态 | 接口返回码,用于判断成功或者失败 | + +| 列表名 | 说明 | +| -------- | ---------------------------------- | +| 时间 | API接口访问时间 | +| 用户 | API接口调用的用户 | +| 源IP | 用户源IP | +| 请求URL | 接口API | +| 请求方法 | 接口API的请求方法,GET/POST等 | +| 返回状态 | 接口返回码,用于判断成功或者失败 | | 行为类型 | 接口的行为,操作行为,登陆行为等。 | ### 任务日志 @@ -872,11 +879,12 @@ container: 诊断容器内部cache | 必填,默认填"all" | 1. 进入“日志中心”菜单,下拉菜单中选择点击”任务日志“进入“任务日志”页面。 2. 在“任务日志”界面中,会展示诊断任务的情况。日志列表简要说明: -| 列表名 | 说明 | -| --- | --- | -| 时间 | API接口访问时间 | -| 任务ID | 诊断中心中发起诊断的ID | -| 状态 | 诊断任务成功或者失败 | + +| 列表名 | 说明 | +| -------- | -------------------------- | +| 时间 | API接口访问时间 | +| 任务ID | 诊断中心中发起诊断的ID | +| 状态 | 诊断任务成功或者失败 | | 参数列表 | 发起诊断任务请求的入参列表 | ### 告警日志 @@ -886,13 +894,14 @@ container: 诊断容器内部cache | 必填,默认填"all" | 1. 进入“日志中心”菜单,下拉菜单中选择点击”告警日志“进入“告警日志”页面。 2. 在“告警日志”界面中,会展示所有告警消息的情况。日志列表简要说明: -| 列表名 | 说明 | -| --- | --- | -| 告警时间 | 告警时间 | + +| 列表名 | 说明 | +| -------- | -------------------------------- | +| 告警时间 | 告警时间 | | 告警级别 | 告警级别,成功success,失败error | -| 类型 | 告警类型,目前是notification | -| 是否已读 | 告警是否已读 | -| 告警内容 | 告警具体内容 | +| 类型 | 告警类型,目前是notification | +| 是否已读 | 告警是否已读 | +| 告警内容 | 告警具体内容 | ## 安全中心 ### 概述 @@ -918,14 +927,14 @@ container: 诊断容器内部cache | 必填,默认填"all" | 累计已修复漏洞:累计已修复漏洞的个数 下面漏洞列表的说明如下: -| **参数** | **数值** | **说明** | -| --- | --- | --- | -| 序号 | 1,2,3 | 表格排序序号 | -| 编号 | CVE-年份-ID | CVE漏洞的编号 | -| 发布时间 | 年-月-日 | CVE漏洞的发布时间 | -| 漏洞等级 | 高中低危 | CVE漏洞的漏洞等级 | -| 涉及主机 | 主机列表 | 本次扫描中相关CVE漏洞涉及的主机列表 | -| 操作 | 修复 | 超链接,可点击,跳转到修复界面直接修复 | +| **参数** | **数值** | **说明** | +| -------- | ----------- | -------------------------------------- | +| 序号 | 1,2,3 | 表格排序序号 | +| 编号 | CVE-年份-ID | CVE漏洞的编号 | +| 发布时间 | 年-月-日 | CVE漏洞的发布时间 | +| 漏洞等级 | 高中低危 | CVE漏洞的漏洞等级 | +| 涉及主机 | 主机列表 | 本次扫描中相关CVE漏洞涉及的主机列表 | +| 操作 | 修复 | 超链接,可点击,跳转到修复界面直接修复 | ![image.png](https://intranetproxy.alipay.com/skylark/lark/0/2023/png/260640/1676961888147-52b8f6de-1d2d-4a33-9ff1-0f49550ded69.png#clientId=u874c5459-c5a2-4&from=paste&height=629&id=eqnxV&name=image.png&originHeight=1258&originWidth=2816&originalType=binary&ratio=2&rotation=0&showTitle=false&size=1764909&status=done&style=none&taskId=u32ddd17e-24f2-421b-aeeb-6d944250ba1&title=&width=1408)