diff --git a/docs/user_manual.md b/docs/user_manual.md
index 3c54e680c7f188873af726180bd677c09ab3e44f..8350eaf6dc1fdbb3e986b4f2cabc12afc44d36b2 100644
--- a/docs/user_manual.md
+++ b/docs/user_manual.md
@@ -51,9 +51,9 @@ Oct 10 12:58:51 mfeng bash[3217754]: + sed -i 's/^FIRST_INIT_DONE=0/FIRST_INIT_D
建议Safari 版本15.6.1 ,Chrome 版本109.0.5414.119,Microsoft Edge 版本110.0.1587.50等以上
### 操作步骤
打开本地PC机的浏览器,在地址栏输入http://部署服务器的ip(例如:[http://172.22.3.238](http://172.22.3.238)),按“Enter”。
-:::info
-**说明:** HTTP默认端口为80,请确认防火墙已开通80端口。
-:::
+
+> **说明:** HTTP默认端口为80,请确认防火墙已开通80端口。
+
打开登陆界面,如图所示。默认的用户名密码:admin/123456。

#### 修改密码
@@ -61,11 +61,10 @@ Oct 10 12:58:51 mfeng bash[3217754]: + sed -i 's/^FIRST_INIT_DONE=0/FIRST_INIT_D
点击账户密码修改,输入用户名、原始密码和新密码并确认。点击修改密码,密码修改完成。
参数说明如下表所示。
-| **参数** | **说明** |
-| --- | --- |
-| 密码 | 设置登陆用户密码需要满足以下要求:
-SysOM 2.1版本之前没要求。
-SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字母、数字、特殊字符三种及以上 |
+| **参数** | **说明** |
+| -------- | --------------------------------------------------------------------------------------------------------------------------------------------------------- |
+| 密码 | 设置登陆用户密码需要满足以下要求:
SysOM 2.1版本之前没要求。
SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字母、数字、特殊字符三种及以上 |
+
## 主机管理
### 概述
@@ -75,10 +74,11 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字
1. 进入“主机管理”菜单,下拉菜单中选择点击”集群列表“进入“集群管理”页面。
2. 点击“新建集群”打开新建集群弹出框,输入以下参数。
-| **参数** | **说明** |
-| --- | --- |
+
+| **参数** | **说明** |
+| -------- | ------------------------------------------------------- |
| 集群名称 | 设置集群名称需要满足以下要求:集群名称长度应小于128字节 |
-| 备注信息 | 输入集群的备注信息。 |
+| 备注信息 | 输入集群的备注信息。 |
3. 点击“确认”,完成集群创建。
4. 点击“批量导入”弹出“批量导入”弹出框,点击“模板下载”将模板下载到本地,填入步骤2中的参数并保存文件。点击“单击上传”,选中保存的文件,点击“确认”完成集群批量导入。
@@ -87,9 +87,10 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字
1. 在集群列表中找到想要删除的集群,点击“操作”列的“删除”弹出确认删除提示框,点击“OK”即可将该集群信息删除。
2. 批量删除集群,选中需要删除的集群的复选框,或者选中“集群名称”前的复选框选中所有集群。点击列表右上角的“批量删除”,完成集群的批量删除。
-:::info
-**说明:** 包含主机的集群不允许被删除,若想删除则需要将主机删除或移出集群。
-:::
+
+> **说明:** 包含主机的集群不允许被删除,若想删除则需要将主机删除或移出集群。
+
+
### 导出集群
#### 操作步骤
选中需要导出的集群的复选框,或者选中“集群名称”前的复选框选中所有集群。点击列表右上角的“导出数据”,完成集群数据的导出。
@@ -100,22 +101,23 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字
1. 进入“主机管理”菜单,下拉菜单中选择点击”主机列表“进入“主机管理”页面。
2. 单击“新建主机”打开新建主机弹出框,输入以下参数。
-| **参数** | **说明** |
-| --- | --- |
-| 选择集群 | 选择已创建集群。 |
+
+| **参数** | **说明** |
+| -------- | -------------------------------------------------------------------------------- |
+| 选择集群 | 选择已创建集群。 |
| 主机名称 | 主机名称为该主机在SysOM平台上的名称,需要满足以下要求:主机名称长度应小于100字节 |
-| 用户名称 | 输入被管理主机的用户的名称。 |
-| 用户密码 | 输入被管理主机的用户的密码。 |
-| IP地址 | 输入被管理主机的IP地址。
-说明:
-被管理主机与部署SysOM工具的环境需要保持可联通状态。 |
-| 端口 | 输入被管理主机的SSH协议端口。 |
-| 备注信息 | 输入备注信息。 |
+| 用户名称 | 输入被管理主机的用户的名称。 |
+| 用户密码 | 输入被管理主机的用户的密码。 |
+| IP地址 | 输入被管理主机的IP地址。 |
+| 端口 | 输入被管理主机的SSH协议端口。 |
+| 备注信息 | 输入备注信息。 |
+
+> **说明:** 被管理主机与部署SysOM工具的环境需要保持可联通状态。
3. 点击“确认”,完成主机导入。
-:::info
-**说明:** 当主机列表中“主机状态”为“运行中”时,主机导入成功;若为“异常”或“离线”,则导入失败。请检查主机信息、网络连通性及主机状态。
-:::
+
+> **说明:** 当主机列表中“主机状态”为“运行中”时,主机导入成功;若为“异常”或“离线”,则导入失败。请检查主机信息、网络连通性及主机状态。
+
4. 点击“批量导入”弹出“批量导入”弹出框,点击“模板下载”将模板下载到本地,填入步骤2中的参数并保存文件。点击“单击上传”,选中保存的文件,点击“确认”完成主机批量导入。
@@ -131,9 +133,9 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字
### 编辑主机
#### 操作步骤
在主机列表中找到想要删除的主机,点击“操作”列的“编辑”弹出编辑主机框,修改相应主机信息,点击“确认”即可完成主机信息的编辑。
-:::info
-**说明:** 目前仅支持“选择集群”和“备注信息”的编辑。
-:::
+
+> **说明:** 目前仅支持“选择集群”和“备注信息”的编辑。
+
### 访问主机
#### 前提条件
被访问的主机的“主机状态”为“运行中”。
@@ -145,8 +147,8 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字
平台支持操作迁移的操作系统列表如下。
| **源操作系统** | **目的操作系统** |
-| --- | --- |
-| CentOS 7.6 | Anolis OS 8 |
+| -------------- | ---------------- |
+| CentOS 7.6 | Anolis OS 8 |
### 开始迁移评估
#### 前提条件
@@ -161,31 +163,36 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字

2. 填写评估所需的信息,参数说明如下。
-| **参数** | **说明** |
-| --- | --- |
-| 选择机器 | 选择需要被评估的机器,可多选。 |
-| 迁移版本 | 选择机器迁移的目的操作系统版本。 |
-| Repo配置 | 用于配置迁移评估的仓库 (其中仓库代指 yum 源软件仓库),此处可选择使用公网地址的默认地址或内网地址。在评估阶段,SysOM 会自动分析仓库的软件包和基础库,将其与本地环境做比对并得出一封评估报告。
-
-说明:
-- 若选择公网地址,则 SysOM 会尝试从社区源 ([https://mirrors.openanolis.cn/)](https://mirrors.openanolis.cn/)) 取回数据,届时请确保主机可以访问公网;
-- 若选择内网地址,则需要在内网搭建软件仓库,具体搭建方法可以参考社区知识库中的帮助信息([https://openanolis.cn/sig/migration/doc/447499505912234337](https://openanolis.cn/sig/migration/doc/447499505912234337))。
- |
-| 选择评估 | 勾选本次评估的具体内容,其中风险评估为必选项,系统评估,硬件评估,应用评估为可选项。
-说明:
-勾选应用评估之后,请在弹出框中输入需要评估的应用列表,用英文逗号分隔,支持模糊搜索,具体可评估的应用列表请在被评估主机上执行 rpm -qa 进行查看。 |
+
+| **参数** | **说明** |
+| -------- | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
+| 选择机器 | 选择需要被评估的机器,可多选。 |
+| 迁移版本 | 选择机器迁移的目的操作系统版本。 |
+| Repo配置 | 用于配置迁移评估的仓库 (其中仓库代指 yum 源软件仓库),此处可选择使用公网地址的默认地址或内网地址。在评估阶段,SysOM 会自动分析仓库的软件包和基础库,将其与本地环境做比对并得出一封评估报告。 |
+| 选择评估 | 勾选本次评估的具体内容,其中风险评估为必选项,系统评估,硬件评估,应用评估为可选项。 |
+
+> **说明:**
+>
+> Repo配置:
+> - 若选择公网地址,则 SysOM 会尝试从社区源 ([https://mirrors.openanolis.cn/)](https://mirrors.openanolis.cn/)) 取回数据,届时请确保主机可以访问公网;
+> - 若选择内网地址,则需要在内网搭建软件仓库,具体搭建方法可以参考社区知识库中的帮助信息([https://openanolis.cn/sig/migration/doc/447499505912234337](https://openanolis.cn/sig/migration/doc/447499505912234337))。
+>
+> 选择评估:
+> - 勾选应用评估之后,请在弹出框中输入需要评估的应用列表,用英文逗号分隔,支持模糊搜索,具体可评估的应用列表请在被评估主机上执行 rpm -qa 进行查看。
3. 点击“开始评估”,生成一条评估记录,可通过“评估进度”列查看主机迁移评估的进度。“评估进度”和“评估说明”的说明如下。
-| **参数** | **数值** | **说明** |
-| --- | --- | --- |
-| 评估进度 | <100% | 代表当前正在进行评估。 |
-| | 100% | 代表评估已完成。 |
-| 评估状态 | 评估中 | 代表当前正在进行评估。 |
-| | 评估停止 | 代表正在评估中的主机在“操作”中被执行了“停止”操作,评估未完成。 |
-| | 评估失败 | 代表评估失败。
-说明:
-根据勾选评估内容依次执行评估,入遇到某个评估失败,则当前整个评估任务失败,评估失败原因可通过鼠标悬浮在“评估失败”状态上查看。 |
-| | 评估完成 | 代表评估已完成。 |
+
+| **参数** | **数值** | **说明** |
+| -------- | -------- | -------------------------------------------------------------- |
+| 评估进度 | <100% | 代表当前正在进行评估。 |
+| | 100% | 代表评估已完成。 |
+| 评估状态 | 评估中 | 代表当前正在进行评估。 |
+| | 评估停止 | 代表正在评估中的主机在“操作”中被执行了“停止”操作,评估未完成。 |
+| | 评估失败 | 代表评估失败。 |
+| | 评估完成 | 代表评估已完成。 |
+
+> **说明:**
+> 根据勾选评估内容依次执行评估,入遇到某个评估失败,则当前整个评估任务失败,评估失败原因可通过鼠标悬浮在“评估失败”状态上查看。

### 停止评估
@@ -202,48 +209,49 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字
1. 在评估记录列表中找到想要查看的主机,点击“操作”列的“查看报告”跳转到评估报告详情页面,点击不同的评估项可切换到不同的报告内容,即使未评估完成或者评估失败,也可以查看某一项已经评估完成的内容。
2. 报告说明如下表。
-| **评估报告** | **参数** | **说明** |
-| --- | --- | --- |
-| 风险评估 | 风险项 | 迁移过程中可能出现的风险问题 |
-| | 风险 | 风险等级 |
-| | 建议操作 | 可按照该操作处理当前风险 |
-| | 评估结果 | 如果不存在阻塞迁移的风险,则评估通过,如果存在阻塞迁移的风险,则需要用户手动介入处理风险。 |
+
+| **评估报告** | **参数** | **说明** |
+| ------------ | -------- | ------------------------------------------------------------------------------------------ |
+| 风险评估 | 风险项 | 迁移过程中可能出现的风险问题 |
+| | 风险 | 风险等级 |
+| | 建议操作 | 可按照该操作处理当前风险 |
+| | 评估结果 | 如果不存在阻塞迁移的风险,则评估通过,如果存在阻塞迁移的风险,则需要用户手动介入处理风险。 |

-| **评估报告** | **参数** | **说明** |
-| --- | --- | --- |
-| 系统评估 | 环境变量 | 展示系统环境变量及其评估结果 |
-| | 系统服务 | 展示系统服务状态及其评估结果 |
-| | 系统命令 | 展示系统命令列表及其评估结果 |
-| | 内核模块 | 展示内核模块列表及其评估结果 |
-| | 系统调用 | 展示系统调用列表及其评估结果 |
-| | 内核启动参数 | 展示内核启动参数及其评估结果 |
-| | 内核动态配置 | 展示内核动态参数及其评估结果 |
-| | 内核静态配置 | 展示内核静态参数及其评估结果 |
-| | KABI | 展示KABI接口列表及其评估结果 |
+| **评估报告** | **参数** | **说明** |
+| ------------ | ------------ | ---------------------------- |
+| 系统评估 | 环境变量 | 展示系统环境变量及其评估结果 |
+| | 系统服务 | 展示系统服务状态及其评估结果 |
+| | 系统命令 | 展示系统命令列表及其评估结果 |
+| | 内核模块 | 展示内核模块列表及其评估结果 |
+| | 系统调用 | 展示系统调用列表及其评估结果 |
+| | 内核启动参数 | 展示内核启动参数及其评估结果 |
+| | 内核动态配置 | 展示内核动态参数及其评估结果 |
+| | 内核静态配置 | 展示内核静态参数及其评估结果 |
+| | KABI | 展示KABI接口列表及其评估结果 |

-| **评估报告** | **参数** | **说明** |
-| --- | --- | --- |
-| 硬件评估 | 整机信息 | 被评估主机的一些基本物理硬件信息 |
-| | 设备名称 | 主机包含的板卡的设备名称 |
-| | bdf、vid、did、svid、sdid | 板卡硬件各类ID信息 |
-| | 驱动评估结果 | 基于驱动信息评估的结果,支持表示存在支持该板卡的驱动 |
-| | ancert验证结果 | 基于社区ancert硬件兼容性工具验证的结果,通过表示经过测试验证支持该板卡 |
-| | 操作 | 点击可跳转到龙蜥兼容适配网站进行自主验证 |
+| **评估报告** | **参数** | **说明** |
+| ------------ | ------------------------- | ---------------------------------------------------------------------- |
+| 硬件评估 | 整机信息 | 被评估主机的一些基本物理硬件信息 |
+| | 设备名称 | 主机包含的板卡的设备名称 |
+| | bdf、vid、did、svid、sdid | 板卡硬件各类ID信息 |
+| | 驱动评估结果 | 基于驱动信息评估的结果,支持表示存在支持该板卡的驱动 |
+| | ancert验证结果 | 基于社区ancert硬件兼容性工具验证的结果,通过表示经过测试验证支持该板卡 |
+| | 操作 | 点击可跳转到龙蜥兼容适配网站进行自主验证 |

-| **评估报告** | **参数** | **说明** |
-| --- | --- | --- |
-| 应用评估 | 应用列表 | 被评估应用的列表 |
-| | 操作 | 点击详细可跳转到该应用具体的评估内容 |
-| | 依赖评估结果 | 展示应用最终评估结果 |
-| | 应用依赖评估 | 展示当前应用依赖的lib库、系统命令及其评估结果 |
-| | ABI评估报告 | 展示应用依赖的lib库ABI接口及其评估结果 |
-| | CLI评估报告 | 展示应用依赖的CLI接口及其评估结果 |
+| **评估报告** | **参数** | **说明** |
+| ------------ | ------------ | --------------------------------------------- |
+| 应用评估 | 应用列表 | 被评估应用的列表 |
+| | 操作 | 点击详细可跳转到该应用具体的评估内容 |
+| | 依赖评估结果 | 展示应用最终评估结果 |
+| | 应用依赖评估 | 展示当前应用依赖的lib库、系统命令及其评估结果 |
+| | ABI评估报告 | 展示应用依赖的lib库ABI接口及其评估结果 |
+| | CLI评估报告 | 展示应用依赖的CLI接口及其评估结果 |


@@ -257,32 +265,35 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字
1. 进入“操作系统迁移”菜单,下拉菜单中选择点击”迁移实施“进入“迁移实施”页面。
2. 菜单机器列表中可查看所有主机及状态,点击左上角可切换集群,找到需要迁移的主机,在操作列点击“...”弹出下拉菜单。点击“迁移配置”弹出迁移配置框。参数说明如下。
-| **参数** | **说明** |
-| --- | --- |
-| 选择机器 | 显示所选机器。 |
-| 迁移版本 | 选择机器迁移的目的操作系统版本。 |
-| 选择内核 | 选择内核,目前仅支持迁移至ANCK内核。 |
-| Repo配置 | 用于配置迁移实施的仓库 (其中仓库代指 yum 源软件仓库),此处可选择使用公网地址的默认地址或内网地址。在迁移实施阶段,SysOM 会自动从仓库中下载所需的软件包,用以替换当前系统的基础软件体系。
-
-说明:
-- 若选择公网地址,则 SysOM 会尝试从社区源 ([https://mirrors.openanolis.cn/)](https://mirrors.openanolis.cn/))取回数据,届时请确保主机可以访问公网;
-- 若选择内网地址,则需要在内网搭建软件仓库,具体搭建方法可以参考社区知识库中的帮助信息([https://openanolis.cn/sig/migration/doc/447499505912234337](https://openanolis.cn/sig/migration/doc/447499505912234337))。
- |
-| 备份配置 | 选择是否在迁移前进行备份,若不需要备份选择“不备份”,需要则选择“NFS备份”并填入NFS服务的IP地址、输入NFS的目录名称及该主机无需备份的目录名称。 |
+
+| **参数** | **说明** |
+| -------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
+| 选择机器 | 显示所选机器。 |
+| 迁移版本 | 选择机器迁移的目的操作系统版本。 |
+| 选择内核 | 选择内核,目前仅支持迁移至ANCK内核。 |
+| Repo配置 | 用于配置迁移实施的仓库 (其中仓库代指 yum 源软件仓库),此处可选择使用公网地址的默认地址或内网地址。在迁移实施阶段,SysOM 会自动从仓库中下载所需的软件包,用以替换当前系统的基础软件体系。 |
+| 备份配置 | 选择是否在迁移前进行备份,若不需要备份选择“不备份”,需要则选择“NFS备份”并填入NFS服务的IP地址、输入NFS的目录名称及该主机无需备份的目录名称。 |
+
+> **说明:**
+>
+> Repo配置
+> - 若选择公网地址,则 SysOM 会尝试从社区源 ([https://mirrors.openanolis.cn/)](https://mirrors.openanolis.cn/))取回数据,届时请确保主机可以访问公网;
+> - 若选择内网地址,则需要在内网搭建软件仓库,具体搭建方法可以参考社区知识库中的帮助信息([https://openanolis.cn/sig/migration/doc/447499505912234337](https://openanolis.cn/sig/migration/doc/447499505912234337))。

-3. 点击“确定”,主机“迁移状态”变为“就绪中”。根据下表的步骤操作,当迁移状态为“就绪中”时,表示本次操作已完成,可以点击操作列“...”进行下一步操作,直至迁移完成,如果迁移状态为“失败”,失败原因可通过鼠标悬浮在迁移状态上查看。迁移中的所有操作步骤及说明如下。
-| **步骤** | **说明** |
-| --- | --- |
-| 迁移配置 | 配置迁移主机的迁移参数,详情参考步骤2。 |
-| 系统备份 | 根据步骤2中的备份选择,如果选择NFS备份,则该步骤会对迁移主机进行备份。 |
-| 环境准备 | 对迁移主机下发迁移工具,并安装部署。 |
-| 风险评估 | 使用迁移工具进行风险评估,评估当前机器迁移的风险。 |
-| 迁移实施 | 使用迁移工具进行迁移实施,将当前机器迁移到指定版本。 |
-| 重启机器 | 迁移实施完成后,需要重启机器进行系统切换,重启之后才算本次迁移完成。 |
+1. 点击“确定”,主机“迁移状态”变为“就绪中”。根据下表的步骤操作,当迁移状态为“就绪中”时,表示本次操作已完成,可以点击操作列“...”进行下一步操作,直至迁移完成,如果迁移状态为“失败”,失败原因可通过鼠标悬浮在迁移状态上查看。迁移中的所有操作步骤及说明如下。
+
+| **步骤** | **说明** |
+| -------- | ------------------------------------------------------------------------------------------------------ |
+| 迁移配置 | 配置迁移主机的迁移参数,详情参考步骤2。 |
+| 系统备份 | 根据步骤2中的备份选择,如果选择NFS备份,则该步骤会对迁移主机进行备份。 |
+| 环境准备 | 对迁移主机下发迁移工具,并安装部署。 |
+| 风险评估 | 使用迁移工具进行风险评估,评估当前机器迁移的风险。 |
+| 迁移实施 | 使用迁移工具进行迁移实施,将当前机器迁移到指定版本。 |
+| 重启机器 | 迁移实施完成后,需要重启机器进行系统切换,重启之后才算本次迁移完成。 |
| 系统还原 | 如果原系统进行了备份,那么可以在当前机器的任意状态进行系统还原,即使已经完成迁移,也可以进行系统还原。 |
-| 重置状态 | 如果发现配置错误或者想修改配置,则可以使用重置状态,重置当前主机的迁移状态。 |
+| 重置状态 | 如果发现配置错误或者想修改配置,则可以使用重置状态,重置当前主机的迁移状态。 |
### 批量迁移实施
#### 操作步骤
@@ -314,23 +325,25 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字
1. 进入“监控中心”菜单,下拉菜单中选择点击”迁移监控“进入“迁移监控”页面。
2. 在左侧“机器列表”中点击需要查看的主机,右侧的监控面板,就会显示该主机的迁移监控各个指标。指标项简要说明:
-| **指标栏** | 指标项 | **说明** |
-| --- | --- | --- |
-| 资源总额 | 原始/当前内核版本 | 指标项主要展示主机的一些主要资源的总体情况,包括:内核版本,内存总量,大页内存总量,磁盘空间,磁盘个数,网卡数量,启用的网卡数量等。
-
-原始值:代表主机执行操作系统迁移前的情况。如果没有执行过操作系统迁移,那原始的值都为空(No data)
-当前值:代表主机当前的资源情况 |
-| | 原始/当前内存可用总量 | |
-| | 原始/当前大页内存总量 | |
-| | 原始/当前磁盘可用空间总量 | |
-| | 原始/当前磁盘个数 | |
-| | 原始/当前网卡数量 | |
-| | 原始/当前启用网卡数量 | |
-| 资源监控 | CPU | CPU个数,CPU当前的利用率,CPU两日的利用率,以及CPU利用率两日的波动情况。 |
-| | Memory | Memory使用率,以及内存使用率波动情况 |
-| | Disk | 磁盘空间总额,使用率,磁盘的IOPS |
-| | Network | 网络流量监控,网络流量的波动情况 |
-| | System Load | 系统负载值,以及系统负载的波动情况 |
+
+| **指标栏** | 指标项 | **说明** |
+| ---------- | ------------------------- | ------------------------------------------------------------------------------------------------------------------------------------ |
+| 资源总额 | 原始/当前内核版本 | 指标项主要展示主机的一些主要资源的总体情况,包括:内核版本,内存总量,大页内存总量,磁盘空间,磁盘个数,网卡数量,启用的网卡数量等。 |
+| | 原始/当前内存可用总量 | |
+| | 原始/当前大页内存总量 | |
+| | 原始/当前磁盘可用空间总量 | |
+| | 原始/当前磁盘个数 | |
+| | 原始/当前网卡数量 | |
+| | 原始/当前启用网卡数量 | |
+| 资源监控 | CPU | CPU个数,CPU当前的利用率,CPU两日的利用率,以及CPU利用率两日的波动情况。 |
+| | Memory | Memory使用率,以及内存使用率波动情况 |
+| | Disk | 磁盘空间总额,使用率,磁盘的IOPS |
+| | Network | 网络流量监控,网络流量的波动情况 |
+| | System Load | 系统负载值,以及系统负载的波动情况 |
+
+> 原始值:代表主机执行操作系统迁移前的情况。如果没有执行过操作系统迁移,那原始的值都为空(No data)
+>
+> 当前值:代表主机当前的资源情况

### 系统监控
@@ -343,26 +356,21 @@ SysOM 2.1之后的版本要求:密码不能少于8位且必须包含英文字
指标项简要说明(指标项太多,这里不会全列出来):
-| **指标栏** | 指标项 | **说明** |
-| --- | --- | --- |
-| Quick CPU/Mem/Disk | CPU Busy | Quick CPU/Mem/Disk:主要是展示一个整机的大体资源使用情况,以及CPU/Mem/Disk等资源的总额情况。
-CPU Busy:整机的CPU使用率
-Sys Load:整机的负载
-RAM Used:整机的内存使用率
-Root FS Used:根文件系统使用率
-CPU cores:CPU个数
-Uptime:机器运行时长 |
-| | Sys Load | |
-| | RAM Used | |
-| | Swap Used | |
-| | Root FS Used | |
-| | CPU cores | |
-| | Uptime | |
-| Basic CPU / Mem / Net / Disk | CPU Basic | CPU几种状态的占用率情况(System,User,IOwait,IRQS,idle,Other) |
-| | Memory Basic | Memory使用率基本情况(Total,Used,Cache,free,swap) |
-| | Network Traffic Basic | 网络流量收发情况 |
-| | Disk Space Used Basic | 磁盘使用率情况 |
-| 其它 | 省略 | 其它的监控指标主要是根据CPU/Mem/Net/Disk一个个深入展开的具体的指标项。 |
+| **指标栏** | 指标项 | **说明** |
+| ----------------------------------------------------------------------------------------------- | --------------------- | ---------------------------------------------------------------------- |
+| Quick CPU/Mem/Disk
(主要展示一个整机的大体资源使用情况,以及CPU/Mem/Disk等资源的总额情况。) | CPU Busy | CPU Busy:整机的CPU使用率 |
+| | Sys Load | 整机的负载 |
+| | RAM Used | 整机的内存使用率 |
+| | Swap Used | |
+| | Root FS Used | 根文件系统使用率 |
+| | CPU cores | CPU个数 |
+| | Uptime | 机器运行时长 |
+| Basic CPU / Mem / Net / Disk | CPU Basic | CPU几种状态的占用率情况(System,User,IOwait,IRQS,idle,Other) |
+| | Memory Basic | Memory使用率基本情况(Total,Used,Cache,free,swap) |
+| | Network Traffic Basic | 网络流量收发情况 |
+| | Disk Space Used Basic | 磁盘使用率情况 |
+| 其它 | 省略 | 其它的监控指标主要是根据CPU/Mem/Net/Disk一个个深入展开的具体的指标项。 |
+

## 宕机中心
@@ -379,19 +387,19 @@ Uptime:机器运行时长 |
指标说明:
-| **指标栏** | 指标项 | **说明** |
-| --- | --- | --- |
-| 核心指标 | 最近30天的宕机 | 最近30天的宕机总数 |
-| | 最近7天宕机总数 | 最近7天宕机总数 |
-| | 月宕机率 | 一个月内宕机的主机数 / 主机列表机器数 |
-| | 日宕机率(后续修正为“最近7天宕机率”) | 最近7天的宕机的主机数 / 主机列表机器数 |
-| 宕机列表 | 主机名称 | 发生宕机的主机名称 |
-| | IP | 发生宕机的主机IP |
-| | 宕机时间 | 发生宕机的时间 |
-| | 内核版本 | 发生宕机的主机的内核版本 |
-| | Vmcore | 是否有vmcore产生 |
-| | 解决方案 | 是否有对应的解决方案 |
-| | 宕机详情 | 跳转查看宕机的详细信息 |
+| **指标栏** | 指标项 | **说明** |
+| ---------- | ------------------------------------- | -------------------------------------- |
+| 核心指标 | 最近30天的宕机 | 最近30天的宕机总数 |
+| | 最近7天宕机总数 | 最近7天宕机总数 |
+| | 月宕机率 | 一个月内宕机的主机数 / 主机列表机器数 |
+| | 日宕机率(后续修正为“最近7天宕机率”) | 最近7天的宕机的主机数 / 主机列表机器数 |
+| 宕机列表 | 主机名称 | 发生宕机的主机名称 |
+| | IP | 发生宕机的主机IP |
+| | 宕机时间 | 发生宕机的时间 |
+| | 内核版本 | 发生宕机的主机的内核版本 |
+| | Vmcore | 是否有vmcore产生 |
+| | 解决方案 | 是否有对应的解决方案 |
+| | 宕机详情 | 跳转查看宕机的详细信息 |

@@ -450,26 +458,24 @@ CPU长时间在内核态执行,导致用户态进程长期得不到调度,
##### 2. 功能描述
记录调度抖动发生的时间点、发生的次数、和抖动的具体数值,可以帮助用户更好的定位调度抖动的根因。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
-| 诊断时间 | 持续诊断时长(时间单位:s) | 默认为 20s |
-| 诊断阈值 | 延迟的阈值(时间单位:ms),超过这个阈值的延迟样本将会被记录,低于阈值的延迟样本将会被忽略 | 默认为 20ms |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | ------------------------------------------------------------------------------------------ | ------------ |
+| 实例IP | 目标Node节点的IP | 必填 |
+| 诊断时间 | 持续诊断时长(时间单位:s) | 默认为 20s |
+| 诊断阈值 | 延迟的阈值(时间单位:ms),超过这个阈值的延迟样本将会被记录,低于阈值的延迟样本将会被忽略 | 默认为 20ms |
##### 4. 在线诊断

-**事件总览:**目前有3类事件:调度延迟、sys延迟和irq延迟。不同的事件由具体的告警与否(及颜色)来分辨。蓝色表示有告警事件发生,绿色表示正常。
+**事件总览:** 目前有3类事件:调度延迟、sys延迟和irq延迟。不同的事件由具体的告警与否(及颜色)来分辨。蓝色表示有告警事件发生,绿色表示正常。

-**抖动时间线图:**记录了调度抖动发生的时间点、发生的次数、和抖动的具体数值。
+**抖动时间线图:** 记录了调度抖动发生的时间点、发生的次数、和抖动的具体数值。

-**调度抖动详情:**将调具体的度抖动事件以table的方式展示出来,下面是表中各列指标说明。
+**调度抖动详情:** 将调具体的度抖动事件以table的方式展示出来,下面是表中各列指标说明。
+
+| date | class | latency | cpu | current | stamp | extern |
+| ------------------------------ | --------------------------------------------------------------- | ------------------------ | ----------------------- | ------------------------- | ---------------------------------- | ----------------------------------------------------------------------------------------------------------------------------- |
+| 表示调度抖动告警事件发生的日期 | 表示具体的调度抖动事件类型。目前有调度延迟、sys延迟和irq延迟3类 | 具体的抖动延迟值,单位ms | 调度抖动告警发生的cpu号 | 受干扰的当前任务名字和pid | 发生调度抖动告警时的机器上的时间戳 | 额外信息。不同的class有不同的额外信息: 调度延迟:nr_running 表示cpu队列上的排队的任务数量,prev表示当前cpu上前一个任务 |
-| date | class | latency | cpu | current | stamp | extern |
-| --- | --- | --- | --- | --- | --- | --- |
-| 表示调度抖动告警事件发生的日期 | 表示具体的调度抖动事件类型。目前有调度延迟、sys延迟和irq延迟3类 | 具体的抖动延迟值,单位ms | 调度抖动告警发生的cpu号 | 受干扰的当前任务名字和pid | 发生调度抖动告警时的机器上的时间戳 | 额外信息。不同的class有不同的额外信息:
-调度延迟:nr_running 表示cpu队列上的排队的任务数量,prev表示当前cpu上前一个任务
-sys延迟:发生调度抖动告警时的上下文堆栈
-irq延迟:发生调度抖动告警时的上下文堆栈 |

##### 5. 离线导入
@@ -483,17 +489,17 @@ irq延迟:发生调度抖动告警时的上下文堆栈 |
##### 2. 功能描述
SysOM 负载分析诊断功能主要分析系统负载情况,进程分布及对系统的影响。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | ---------------- | ------------ |
+| 实例IP | 目标Node节点的IP | 必填 |
##### 4. 在线诊断

-**事件总览:**显示当前系统负载,并诊断负载是否对系统sys utils、硬中断、软中断、io有影响。
+**事件总览:** 显示当前系统负载,并诊断负载是否对系统sys utils、硬中断、软中断、io有影响。

-**进程分布:**诊断当前系统R和D状态的分布情况和导致系统负载高的贡献度。
+**进程分布:** 诊断当前系统R和D状态的分布情况和导致系统负载高的贡献度。

-**调度火焰图:**显示系统调度火焰图,可直接查询导致负载高的热点函数。
+**调度火焰图:** 显示系统调度火焰图,可直接查询导致负载高的热点函数。

##### 5. 离线导入
使用方式同调度抖动诊断
@@ -502,10 +508,10 @@ SysOM 负载分析诊断功能主要分析系统负载情况,进程分布及
##### 2.功能描述
profile系统的热点应用(占用cpu多的任务),对热点应用给出性能分析,统计应用的用户态与内核态的热点栈占比,最终展示系统top 10的热点应用排布。
##### 3.诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
-| 时间 | 诊断时长 | 选填,默认5min |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | ---------------- | -------------- |
+| 实例IP | 目标Node节点的IP | 必填 |
+| 时间 | 诊断时长 | 选填,默认5min |
##### 4.在线诊断
参数输入
@@ -531,26 +537,26 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
##### 2. 功能描述
记录存储设备的历史IO延迟水位,并且统计每分钟访问 IO 延迟偏离历史水位的次数,用于快速定位导致 IO 延迟偏高的位置。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
-| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
-| 时间阈值 | 保留IO延迟大于设定时间阈值的IO(时间单位:ms) | 必填,默认为 1000ms |
-| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | ---------------------------------------------- | ---------------------------- |
+| 实例IP | 目标Node节点的IP | 必填 |
+| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
+| 时间阈值 | 保留IO延迟大于设定时间阈值的IO(时间单位:ms) | 必填,默认为 1000ms |
+| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) |
##### 4. 在线诊断
**iolantency 总览:** 表示在一个诊断周期内,捕捉到的超时IO的个数,个数为0时,check result的状态为normal,字体显示绿色,表示当前无异常的慢IO,个数不为0时,check result的状态为abnormal,字体显示红色,表示当前存在超出阈值的慢IO;_注意:阈值在发起诊断的时候可以指定,不指定情况下,默认为1000ms,_在诊断结果最右侧支持磁盘的checklist选择展示不同磁盘的数据,切换数据展示。

-**整体 IO 时延分布:**这部分展示IO整体在OS以及磁盘各个存储链路上的延迟分布,每个框图中的指标解读为:
+**整体 IO 时延分布:** 这部分展示IO整体在OS以及磁盘各个存储链路上的延迟分布,每个框图中的指标解读为:
- 左上角为链路名,分别表示IO在经过此路径的延迟损耗,其中主要包括OS、Disk两部分,又根据IO的生命周期,进一步将OS中细分为block、driver、complete三部分(分别表示内核通用块层、驱动、IO完成后回收三部分)
- 右上角表示在此链路耗时占整体耗时的百分比
- 中间的max_us、avg_us、min_us则分别表示IO在此路径上的最大延迟、平均延迟、最小延迟,单位us。

-**单 IO 时延 metrics 展示:**该部分将捕捉到的每一个超时IO,通过时序数据曲线的方式展示出来,X轴为时间日期,Y轴为延迟(单位us),图中有5条曲线,分别表示每个IO的total delay、block delay、driver delay、disk delay、complete delay,可以看出这个是更细粒度的针对每一个IO在存储各链路上的延迟分布。
+**单 IO 时延 metrics 展示:** 该部分将捕捉到的每一个超时IO,通过时序数据曲线的方式展示出来,X轴为时间日期,Y轴为延迟(单位us),图中有5条曲线,分别表示每个IO的total delay、block delay、driver delay、disk delay、complete delay,可以看出这个是更细粒度的针对每一个IO在存储各链路上的延迟分布。

-**Top 10 IO 详情:**这部分展示了IO总延迟大小排在前TOP10的IO的更多细节
+**Top 10 IO 详情:** 这部分展示了IO总延迟大小排在前TOP10的IO的更多细节
- `time`:表示检测到此超时IO的时间日期,精确到ms;
- `abnormal`:表示此IO延迟消耗最大的原因,以“延迟最大的路径(此路径耗时:IO整体耗时 单位)”形式展示;
@@ -576,11 +582,11 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
##### 2. 功能描述
此功能主要分析系统中的IO流量归属。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
-| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 15s |
-| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | ---------------------------------- | ---------------------------- |
+| 实例IP | 目标Node节点的IP | 必填 |
+| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 15s |
+| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) |
##### 4. 在线诊断

@@ -588,7 +594,7 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO

在诊断结果最右侧支持磁盘的checklist选择展示不同磁盘的数据,注意切换的是即将介绍的**磁盘IO流量分析、进程IO流量分析、进程IO块大小分析**这三部分的数据展示:

-**磁盘 IO 流量分析:**该部分展示诊断期间,统计到的磁盘IO流量,支持通过磁盘的checklist选择展示不同磁盘的数据,主要字段:
+**磁盘 IO 流量分析:** 该部分展示诊断期间,统计到的磁盘IO流量,支持通过磁盘的checklist选择展示不同磁盘的数据,主要字段:
- `diskname`:磁盘/分区名称
- `r_rqm`:诊断期间合并读操作的次数
@@ -601,7 +607,7 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
- `util%`:该硬盘设备的繁忙比率

-**进程 IO 流量分析:**该部分展示诊断期间,进程级别IO流量,支持通过磁盘的checklist选择展示不同磁盘的数据,主要字段:
+**进程 IO 流量分析:** 该部分展示诊断期间,进程级别IO流量,支持通过磁盘的checklist选择展示不同磁盘的数据,主要字段:
- `comm` : 进程名
- **tgid:pid** : 进程id信息
@@ -615,7 +621,7 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
其中尤其注意到,该功能支持kworker刷脏的IO溯源能力,所以可以看到在kworker进程下面存在子项,展开可以看到实际产生脏页(写buffer io)的进程

-**进程 IO 块大小分析:**该部分展示诊断期间,进程级别IO提交到OS块层的块大小分布,支持通过磁盘的checklist选择展示不同磁盘的数据,其中pat_WNK,表示IO大小为nKB以内的IO个数占比,large则表示大于512KB的大块IO的占比。
+**进程 IO 块大小分析:** 该部分展示诊断期间,进程级别IO提交到OS块层的块大小分布,支持通过磁盘的checklist选择展示不同磁盘的数据,其中pat_WNK,表示IO大小为nKB以内的IO个数占比,large则表示大于512KB的大块IO的占比。

##### 5. 离线导入
使用方式同调度抖动诊断。
@@ -625,20 +631,20 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
##### 2. 功能描述
监控系统每个存储设备的IO访问路径上是否存在IO HANG问题。(检测出问题后,可以选择将IO流量切换到正常的存储设备上,隔离异常的存储设备)
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
-| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
-| 时间阈值 | 保留IO延迟大于设定时间阈值的IO(时间单位:ms) | 必填,默认为 5000ms |
-| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | ---------------------------------------------- | ---------------------------- |
+| 实例IP | 目标Node节点的IP | 必填 |
+| 诊断时长 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
+| 时间阈值 | 保留IO延迟大于设定时间阈值的IO(时间单位:ms) | 必填,默认为 5000ms |
+| 目标磁盘 | 需要检测的磁盘名称,如sda,sdb等。 | 选填(不指定则诊断所有磁盘) |
##### 4. 在线诊断

-**IO HANG 总览:**表示在一个诊断周期内,检测是否有IO HANG,无IO HANG时,check result的状态为normal,字体显示绿色,有IO HANG时,check result的状态为abnormal,字体显示红色,而Number of OS HANG或者Number of Disk HANG,分别表示IO HANG在OS或者磁盘的IO个数。
+**IO HANG 总览:** 表示在一个诊断周期内,检测是否有IO HANG,无IO HANG时,check result的状态为normal,字体显示绿色,有IO HANG时,check result的状态为abnormal,字体显示红色,而Number of OS HANG或者Number of Disk HANG,分别表示IO HANG在OS或者磁盘的IO个数。

在诊断结果最右侧支持磁盘的checklist选择展示不同磁盘的数据,切换数据展示:

-**TOP 10 详情:**这部分展示了HANG住持续时间的前TOP 10个IO的详情
+**TOP 10 详情:** 这部分展示了HANG住持续时间的前TOP 10个IO的详情
- `time`:表示检测到此IO HANG的时间日期,精确到ms
- `abnormal`:表示此IO HANG在哪,以“HANG在哪(具体原因)HANG了多久”形式展示
@@ -665,10 +671,10 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
##### 2. 功能描述
记录丢包事件、丢包发生的硬件或网卡设备、丢包点等,并进一步分析丢包的原因,帮助用户诊断定位网络丢包的问题。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
-| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | --------------------------- | ---------------- |
+| 实例IP | 目标Node节点的IP | 必填 |
+| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
##### 4. 在线诊断

@@ -687,10 +693,10 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
##### 2. 功能描述
基于 ICMP 报文,测出 ping 发起端的报文时延(发送路径)以及 ping 接收端的报文时延(接收路径)。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
-| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | --------------------------- | ---------------- |
+| 实例IP | 目标Node节点的IP | 必填 |
+| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
##### 4. 在线诊断

@@ -702,10 +708,10 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
##### 2. 功能描述
记录重传的时间、IP、TCP socket所处的状态和拥塞情况,帮助用户了解网络重传发生的情况。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
-| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | --------------------------- | ---------------- |
+| 实例IP | 目标Node节点的IP | 必填 |
+| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
##### 4. 在线诊断

@@ -723,25 +729,25 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
##### 2. 功能描述
抖动诊断目前仅支持icmp报文,即ping。其包含两个部分,一个是ping发起端的报文时延,即发送报文路径,另外一个是ping接收端的报文时延,即接收报文路径。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 源实例IP | 源节点IP | 必填 |
-| 目标实例IP | 目的节点IP | 必填 |
-| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
-| 追踪包数 | 模拟发包的最大报文数 | 必填,默认为 100 |
-| 间隔毫秒数 | 模拟发包时两次发包的
-间隔毫秒数(时间单位:ms) | 必填,默认为 1000ms |
-| 报文协议 | 模拟发包的报文协议 | 必填,默认为ICMP |
+| **参数名** | **参数说明** | **是否必填** |
+| -------------------------- | --------------------------- | ---------------- |
+| 源实例IP | 源节点IP | 必填 |
+| 目标实例IP | 目的节点IP | 必填 |
+| 运行时间 | 持续诊断时长(时间单位:s) | 必填,默认为 10s |
+| 追踪包数 | 模拟发包的最大报文数 | 必填,默认为 100 |
+| 间隔毫秒数 | 模拟发包时两次发包的 |
+| 间隔毫秒数(时间单位:ms) | 必填,默认为 1000ms |
+| 报文协议 | 模拟发包的报文协议 | 必填,默认为ICMP |
##### 4. 在线诊断

-**发送报文路径:**发送报文路径是 ping 的发起端的 icmp 报文时延信息,包含:
+**发送报文路径:** 发送报文路径是 ping 的发起端的 icmp 报文时延信息,包含:
1. 内核发送:表示 icmp echo 报文在内核发送路径的时延;
2. 外部链路:表示 icmp 报文在外部链路的耗时;
3. 内核接收:表示 icmp echo reply报文内核接收路径的时延。
-**接收报文路径:**接收报文路径是ping的接收端的 icmp 报文时延信息,包含:
+**接收报文路径:** 接收报文路径是ping的接收端的 icmp 报文时延信息,包含:
1. 内核接受:表示 icmp echo 报文在内核接收路径的时延;
2. 内核发送:表示 icmp echo reply 报文内核发送路径的时延。
@@ -760,13 +766,13 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
##### 2. 功能描述
对内存的整体分布和组成进行分析和展示。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | ---------------- | ------------ |
+| 实例IP | 目标Node节点的IP | 必填 |
##### 4. 在线诊断

-**内存事件:**主要对内存相关风险一键检查,快速识别系统是否存在内存问题
+**内存事件:** 主要对内存相关风险一键检查,快速识别系统是否存在内存问题
- 内存利用率:系统内存利用率;
- 内存泄漏:排查系统是否存在泄漏,以及泄漏的类型,目前支持slab, vmalloc和伙伴系统三种泄漏识别;
@@ -774,20 +780,20 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
- 内存碎片化:评估系统是否存在内存碎片化,内存碎片化会导致系统性能下降

-**内存总览(Overview):**内存总览展示系统所有内存的使用情况,实现内存的可维可测可追踪(1+1+1=3),也就是总内存 = 内核内存(kernel) + 应用内存(app) + 空闲内存(free),然后再进一步细分内核内存和应用内存。
+**内存总览(Overview):** 内存总览展示系统所有内存的使用情况,实现内存的可维可测可追踪(1+1+1=3),也就是总内存 = 内核内存(kernel) + 应用内存(app) + 空闲内存(free),然后再进一步细分内核内存和应用内存。
- **总内存**
- `kernel`:表示操作系统内核内存总使用量
- `app`:表示用户态程序内存总使用量
- `free`:系统空闲内存
-- **内核内存:**内核态内存,我们重点关注Sunreclaim,伙伴系统的使用量,我们通常说的内存泄漏通常都是这两个指标异常。
+- **内核内存:** 内核态内存,我们重点关注Sunreclaim,伙伴系统的使用量,我们通常说的内存泄漏通常都是这两个指标异常。
- `Sreclaimable`:Slab可回收内存
- `Sunreclaim`:Slab不可回收内存
- `PageTables`:内核页表占用内存
- `Vmalloc`:内核调用vmalloc分配的内存
- `KernelStack`:进程的内核堆栈总内存
- `AllocPages`:内核调用alloc_pages等接口直接从伙伴系统分配的内存量,这类内存无法通过任何节点文件获取,使用过多会造成内存黑洞。
-- **应用内存 => **用户态内存,我们重点关注anon,shmem,filecache
+- **应用内存:** 用户态内存,我们重点关注anon,shmem,filecache
- `filecache`:文件缓存内存,这类内存可以通过drop caches回收。
- `anon`:匿名内存,程序堆和栈内存,匿名内存占用过多,需要评估业务进程是否有内存泄漏,系统是否开启了透明大页。
- `mlock`:系统锁住的内存量
@@ -796,9 +802,9 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
- `shmem`:共享内存(tmpfs)。业务进程退出后,经常会忘记删除tmpfs文件,或者在打开状态,直接删掉tmpfs文件,都会操作shmem泄漏。

-**进程内存:**以进程维度按内存大小排序,并分解成匿名内存,文件缓存,共享内存。
+**进程内存:** 以进程维度按内存大小排序,并分解成匿名内存,文件缓存,共享内存。

-**Cache Top:**展示 Cache 占用最多前五个文件和对应的进程。
+**Cache Top:** 展示 Cache 占用最多前五个文件和对应的进程。

##### 5. 离线导入
使用方式同调度抖动诊断。
@@ -808,11 +814,11 @@ IO流量积压、存储设备异常等情况容易造成 IO 请求处理慢,IO
##### 2. 功能描述
分析容器,容器组,整机,cgroup的cache内存由哪些文件引入,以及每个文件引入的active cache和inactive cache。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
-| 容器 | 容器ID或者pod名 | 必填,默认填空字符串"" |
-| 诊断类型 | 诊断类型:
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | ---------------- | ---------------------- |
+| 实例IP | 目标Node节点的IP | 必填 |
+| 容器 | 容器ID或者pod名 | 必填,默认填空字符串"" |
+| 诊断类型 | 诊断类型: |
all: 诊断实例上所用容器cache
host: 诊断实例主机cache
pod:诊断pod内部cache
@@ -820,7 +826,7 @@ container: 诊断容器内部cache | 必填,默认填"all" |
##### 4. 在线诊断

-**缓存排序:**对缓存占用最多的几个文件的组成进行分析展示
+**缓存排序:** 对缓存占用最多的几个文件的组成进行分析展示

##### 5. 离线导入
使用方式同调度抖动诊断。
@@ -830,10 +836,10 @@ container: 诊断容器内部cache | 必填,默认填"all" |
##### 2. 功能描述
本项诊断功能可以帮助用户定位定位内存泄漏的位置,并分析导致内存泄露的原因。
##### 3. 诊断参数
-| **参数名** | **参数说明** | **是否必填** |
-| --- | --- | --- |
-| 实例IP | 目标Node节点的IP | 必填 |
-| 诊断时间 | 指定检测某个过去的时间,不指定代表检查最近一次,填写格式为:unix毫秒时间戳 | 选填 |
+| **参数名** | **参数说明** | **是否必填** |
+| ---------- | -------------------------------------------------------------------------- | ------------ |
+| 实例IP | 目标Node节点的IP | 必填 |
+| 诊断时间 | 指定检测某个过去的时间,不指定代表检查最近一次,填写格式为:unix毫秒时间戳 | 选填 |
##### 4. 在线诊断

@@ -855,14 +861,15 @@ container: 诊断容器内部cache | 必填,默认填"all" |
1. 进入“日志中心”菜单,下拉菜单中选择点击”审计日志“进入“审计日志”页面。
2. 在“审计日志”界面中,会展示所有接口调用的情况。日志列表简要说明:
-| 列表名 | 说明 |
-| --- | --- |
-| 时间 | API接口访问时间 |
-| 用户 | API接口调用的用户 |
-| 源IP | 用户源IP |
-| 请求URL | 接口API |
-| 请求方法 | 接口API的请求方法,GET/POST等 |
-| 返回状态 | 接口返回码,用于判断成功或者失败 |
+
+| 列表名 | 说明 |
+| -------- | ---------------------------------- |
+| 时间 | API接口访问时间 |
+| 用户 | API接口调用的用户 |
+| 源IP | 用户源IP |
+| 请求URL | 接口API |
+| 请求方法 | 接口API的请求方法,GET/POST等 |
+| 返回状态 | 接口返回码,用于判断成功或者失败 |
| 行为类型 | 接口的行为,操作行为,登陆行为等。 |
### 任务日志
@@ -872,11 +879,12 @@ container: 诊断容器内部cache | 必填,默认填"all" |
1. 进入“日志中心”菜单,下拉菜单中选择点击”任务日志“进入“任务日志”页面。
2. 在“任务日志”界面中,会展示诊断任务的情况。日志列表简要说明:
-| 列表名 | 说明 |
-| --- | --- |
-| 时间 | API接口访问时间 |
-| 任务ID | 诊断中心中发起诊断的ID |
-| 状态 | 诊断任务成功或者失败 |
+
+| 列表名 | 说明 |
+| -------- | -------------------------- |
+| 时间 | API接口访问时间 |
+| 任务ID | 诊断中心中发起诊断的ID |
+| 状态 | 诊断任务成功或者失败 |
| 参数列表 | 发起诊断任务请求的入参列表 |
### 告警日志
@@ -886,13 +894,14 @@ container: 诊断容器内部cache | 必填,默认填"all" |
1. 进入“日志中心”菜单,下拉菜单中选择点击”告警日志“进入“告警日志”页面。
2. 在“告警日志”界面中,会展示所有告警消息的情况。日志列表简要说明:
-| 列表名 | 说明 |
-| --- | --- |
-| 告警时间 | 告警时间 |
+
+| 列表名 | 说明 |
+| -------- | -------------------------------- |
+| 告警时间 | 告警时间 |
| 告警级别 | 告警级别,成功success,失败error |
-| 类型 | 告警类型,目前是notification |
-| 是否已读 | 告警是否已读 |
-| 告警内容 | 告警具体内容 |
+| 类型 | 告警类型,目前是notification |
+| 是否已读 | 告警是否已读 |
+| 告警内容 | 告警具体内容 |
## 安全中心
### 概述
@@ -918,14 +927,14 @@ container: 诊断容器内部cache | 必填,默认填"all" |
累计已修复漏洞:累计已修复漏洞的个数
下面漏洞列表的说明如下:
-| **参数** | **数值** | **说明** |
-| --- | --- | --- |
-| 序号 | 1,2,3 | 表格排序序号 |
-| 编号 | CVE-年份-ID | CVE漏洞的编号 |
-| 发布时间 | 年-月-日 | CVE漏洞的发布时间 |
-| 漏洞等级 | 高中低危 | CVE漏洞的漏洞等级 |
-| 涉及主机 | 主机列表 | 本次扫描中相关CVE漏洞涉及的主机列表 |
-| 操作 | 修复 | 超链接,可点击,跳转到修复界面直接修复 |
+| **参数** | **数值** | **说明** |
+| -------- | ----------- | -------------------------------------- |
+| 序号 | 1,2,3 | 表格排序序号 |
+| 编号 | CVE-年份-ID | CVE漏洞的编号 |
+| 发布时间 | 年-月-日 | CVE漏洞的发布时间 |
+| 漏洞等级 | 高中低危 | CVE漏洞的漏洞等级 |
+| 涉及主机 | 主机列表 | 本次扫描中相关CVE漏洞涉及的主机列表 |
+| 操作 | 修复 | 超链接,可点击,跳转到修复界面直接修复 |
