diff --git a/docs/zh/faq/caselibrary/caselibrary_menu.md b/docs/zh/faq/caselibrary/caselibrary_menu.md index b3665eca17101e1bca9519565555bb64c37d0790..b4748a626869efc079c1219fe7426d40e259e615 100644 --- a/docs/zh/faq/caselibrary/caselibrary_menu.md +++ b/docs/zh/faq/caselibrary/caselibrary_menu.md @@ -2,18 +2,19 @@ | 序号 | 问题来源 | 特性分类 | 关键字 | 标题 | |---|---|---|---|---| -| 1 | 开发者反馈 | 基础服务 | systemd-logind,NIS | [systemd-logind服务无法获取NIS服务器上的用户信息](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/systemd-logind.md) | -| 2 | 开发者反馈 | storage | mount,sysroot,crypto | [mount/sysroot失败的问题](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/mountsysroot.md) | -| 3 | 开发者反馈 | 基础服务 | audit,log | [audit写日志占满分区空间出现系统停机](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/audit.md) | -| 4 | 开发者反馈 | 容器 | docker,umask | [docker配置容器umask值](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/umask.md) | -| 5 | 开发者反馈 | 容器 | docker,容器运行退出 | [docker容器运行一定时间后自动退出](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/docker.md) | -| 6 | 开发者反馈 | 基础服务 | kpatch,热补丁激活失败 | [制作内核热补丁,插入时dmesg提示缺少sssnic模块](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/sssnic.md) | -| 7 | 开发者反馈 | 计算 | 22.03-LTS,安装zabbix教程 | [openEuler-22.03-LTS安装zabbix教程](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/zabbix.md) | -| 8 | 开发者反馈 | 容器 | isulad,grpc,restful | [isulad使用grpc与rest直接调用服务方法](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/isulad.md) | -| 9 | 开发者反馈 | 存算 | lvm,存算 | [LVM标签损坏](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/lvm.md) | -| 10 | 开发者反馈 | 容器 | pvs、vgs | [pvs或vgs出现Unknown问题](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/pvs_vgs.md) | -| 11 | 开发者反馈 | 存算 | kdump、kexe-tools,vmcore | [kdump常见问题](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/crash.md) | -| 12 | 开发者反馈 | 安装 | efivars | [安装出现efivars报错](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/efivars.md) | -| 13 | 开发者反馈 | 安装 | 换标 | [换标常见问题](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/rebranding.md) | -| 14 | 开发者反馈 | 安装 | anaconda | [anaconda安装常见磁盘问题](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/anaconda.md) | -| 15 | 开发者反馈 | 安装 | 系统文件 | [系统文件恢复问题](https://gitee.com/openeuler/docs/blob/common/docs/zh/faq/caselibrary/sysfile.md) | +| 1 | 开发者反馈 | 基础服务 | systemd-logind,NIS | [systemd-logind服务无法获取NIS服务器上的用户信息](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/systemd-logind.md) | +| 2 | 开发者反馈 | storage | mount,sysroot,crypto | [mount/sysroot失败的问题](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/mountsysroot.md) | +| 3 | 开发者反馈 | 基础服务 | audit,log | [audit写日志占满分区空间出现系统停机](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/audit.md) | +| 4 | 开发者反馈 | 容器 | docker,umask | [docker配置容器umask值](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/umask.md) | +| 5 | 开发者反馈 | 容器 | docker,容器运行退出 | [docker容器运行一定时间后自动退出](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/docker.md) | +| 6 | 开发者反馈 | 基础服务 | kpatch,热补丁激活失败 | [制作内核热补丁,插入时dmesg提示缺少sssnic模块](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/sssnic.md) | +| 7 | 开发者反馈 | 计算 | 22.03-LTS,安装zabbix教程 | [openEuler-22.03-LTS安装zabbix教程](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/zabbix.md) | +| 8 | 开发者反馈 | 容器 | isulad,grpc,restful | [isulad使用grpc与rest直接调用服务方法](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/isulad.md) | +| 9 | 开发者反馈 | 存算 | lvm,存算 | [LVM标签损坏](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/lvm.md) | +| 10 | 开发者反馈 | 容器 | pvs、vgs | [pvs或vgs出现Unknown问题](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/pvs_vgs.md) | +| 11 | 开发者反馈 | 存算 | kdump、kexe-tools,vmcore | [kdump常见问题](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/crash.md) | +| 12 | 开发者反馈 | 安装 | efivars | [安装出现efivars报错](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/efivars.md) | +| 13 | 开发者反馈 | 安装 | 换标 | [换标常见问题](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/rebranding.md) | +| 14 | 开发者反馈 | 安装 | anaconda | [anaconda安装常见磁盘问题](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/anaconda.md) | +| 15 | 开发者反馈 | 安装 | 系统文件 | [系统文件恢复问题](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/sysfile.md) | +| 16 | 开发者反馈 | 容器 | docker服务启动 | [docker服务启动问题](https://gitee.com/openeuler/docs/blob/stable2-common/docs/zh/faq/caselibrary/docker_1.md) | diff --git a/docs/zh/faq/caselibrary/docker_1.md b/docs/zh/faq/caselibrary/docker_1.md new file mode 100644 index 0000000000000000000000000000000000000000..c134a1676f06017a721d0a4a570be66789a2a26c --- /dev/null +++ b/docs/zh/faq/caselibrary/docker_1.md @@ -0,0 +1,213 @@ +# docker服务启动失败常见问题汇总 + +## 场景1: 报错Non existing device xxx-thinpool和Unable to take ownership of thin-pool + +### 问题背景 + +docker配置thinpool存储驱动启动服务。 + +### 现象描述 + +执行systemctl restart docker发现如下报错: + +![thinpool](./figures/docker启动thinpool报错.png) + +### 原因分析 + +这种通常是thinpool损坏导致的,需要进行thinpool的恢复和重建。 + +### 解决方案 + +可参考如下步骤对thinpool进行重建流程: + +1. 对于防止systemctl重启导致的恢复异常重建之前应将其关闭。 + + ```bash + mv /usr/lib/systemd/system/docker.service /usr/lib/systemd/system/docker.service_bak + ``` + +2. 删除/var/lib/docker目录下除hooks文件夹之外的所有文件。 + + ```bash + cd /var/lib/docker/ + rm -rf !(hooks) + ``` + +3. 执行重建thinpool的操作。 + + ```bash + lvremove /dev/docker/thinpool + lvcreate --wipesignatures y -n thinpool docker -L 19g(95%VG) + lvcreate --wipesignatures y -n thinpoolmeta docker -L 0.2g(1%VG) + lvconvert -y --zero n -c 512K --thinpool docker/thinpool --poolmetadata docker/thinpoolmeta + lvchange --metadataprofile docker-thinpool docker/thinpool + ``` + +4. 打开之前操作的docker重拉。 + + ```bash + mv /usr/lib/systemd/system/docker.service_bak /usr/lib/systemd/system/docker.service + systemctl enable docker.service + ``` + +5. 重启docker。 + + ```bash + systemctl start docker + ``` + +systemctl status docker 结果中查看docker是否running。 + +## 场景2:systemd报错timeout + +### 问题背景 + +正常启动docker.service服务。 + +### 现象描述 + +启动超时,导致dockerd服务启动失败: + +![image](./figures/docker启动服务超时.png) + +### 原因分析 + +通常是docker服务启动时间太长,导致systemd拉起服务超时90s。 + +### 解决方案 + +这种情况一般是docker服务启动的时候需要清理的内容太多,可能的原因有容器数量太多或者环境cpu压力较大,建议拉长超时时间重试。 + +1. 在/usr/lib/systemd/system/docker.service的[Service]添加`TimeoutSec=0`。 + +2. 重启docker服务systemctl restart docker。 + +## 场景3:报错unable to configure the Docker daemon with file /etc/docker/daemon.json和unable to configure the Docker daemon with file /etc/sysconfig/docker + +### 问题背景 + +修改docker daemon.json配置文件后重新启动docker服务。 + +### 现象描述 + +dockerd服务启动失败: +![image](./figures/docker启动配置文件错误.png) + +### 原因分析及解决方案 + +一般是配置文件有问题,具体到报错中提示的文件中定位,找到错误的配置并修改即可。 + +## 场景4:systemctl status docker不打印日志,但是启动不了 + +### 问题背景 + +执行systemctl status docker命令查看docker服务日志。 + +### 现象描述 + +docker服务不打印日志,且启动失败: + +![image](./figures/docker启动失败且不打印日志.png) + +### 原因分析及解决方案 + +#### 原因1 + +一般出现于日志服务有问题的情况。 + +#### 解决方案 + +1. 检查rsyslog服务是否正常运行。 + +2. 如果没有运行的话可以先重启日志服务。 + +3. 根据docker服务启动的报错日志进行下一步定位。 + +#### 原因2 + +/run被占满,docker出现过日志打印占满/run目录的问题。 + +#### 解决方案 + +1. 进入`/var/run/docker/containerd/daemon/io.containerd.runtime.v1.linux/moby/`目录,执行`du -sh *`找到空间占用较大的目录 +2. 进入步骤1中找到的目录,执行`echo "" > log.json`清空该异常日志文件,**注意不能删除该文件,删除会导致容器运行异常。** + +## 场景5:dockerd链接/var/run/containerd/containerd.sock失败 + +### 问题背景 + +启动docker.service服务。 + +### 现象描述 + +docker服务启动失败并报错: + +![image](./figures/docker启动链接containerd.sock失败.png) + +### 原因分析 + +该场景常见于在/var/run/containerd目录下存在非法的containerd.sock文件,比如该文件为一个失效的软链接的情况。 + +### 解决方案 + +删除错误文件并重启dockerd即可恢复。 + +## 场景6:创建/var/run/docker目录失败导致服务启动失败 + +### 问题背景 + +启动docker服务。 + +### 现象描述 + +服务启动失败并报错: + +![image](./figures/docker启动创建docker目录失败.png) + +### 原因分析 + +常见于/var/run目录有问题的情况,比如软链接失效。 + +### 解决方案 + +使用ln命令重建软链接,重启docker服务恢复。 + +## 场景7:docker服务初始化,报错no space left + +### 问题背景 + +启动docker服务。 + +### 现象描述 + +docker服务启动失败并报错: + +![image](./figures/docker启动报错no_spcae_left.png) + +### 原因分析 + +常见于给docker预留的存储空间被占满的情况: + +![image](./figures/docker启动报错no_space_left2.png) + +### 解决方案 + +重新预分配,将给docker的存储空间增大。 + +## 场景8:containerd、containerd-shim、runc二进制权限不对导致docker服务无法启动 + +### 问题背景 + +启动docker服务。 + +### 现象描述 + +docker服务启动失败并报错: + +![image](./figures/docker启动二进制权限不正确.png) + +### 原因分析及解决方案 + +从报错来看是找不到runc二进制,实际上是可执行权限被去掉导致的,修改为原本的的权限之后恢复。 + +更多常见相关问题可在后续继续补充。 diff --git "a/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250thinpool\346\212\245\351\224\231.png" "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250thinpool\346\212\245\351\224\231.png" new file mode 100644 index 0000000000000000000000000000000000000000..4f501f5b5955f57970087e9be112359c35defc15 Binary files /dev/null and "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250thinpool\346\212\245\351\224\231.png" differ diff --git "a/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\344\272\214\350\277\233\345\210\266\346\235\203\351\231\220\344\270\215\346\255\243\347\241\256.png" "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\344\272\214\350\277\233\345\210\266\346\235\203\351\231\220\344\270\215\346\255\243\347\241\256.png" new file mode 100644 index 0000000000000000000000000000000000000000..35543ec2f18105a5e19de18a8b7c658853384d33 Binary files /dev/null and "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\344\272\214\350\277\233\345\210\266\346\235\203\351\231\220\344\270\215\346\255\243\347\241\256.png" differ diff --git "a/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\345\210\233\345\273\272docker\347\233\256\345\275\225\345\244\261\350\264\245.png" "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\345\210\233\345\273\272docker\347\233\256\345\275\225\345\244\261\350\264\245.png" new file mode 100644 index 0000000000000000000000000000000000000000..5c09140f0511ed676728a7d273238662bbc75353 Binary files /dev/null and "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\345\210\233\345\273\272docker\347\233\256\345\275\225\345\244\261\350\264\245.png" differ diff --git "a/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\345\244\261\350\264\245\344\270\224\344\270\215\346\211\223\345\215\260\346\227\245\345\277\227.png" "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\345\244\261\350\264\245\344\270\224\344\270\215\346\211\223\345\215\260\346\227\245\345\277\227.png" new file mode 100644 index 0000000000000000000000000000000000000000..ec69f59c80c07573ecffcb28825baa4eb1b5f134 Binary files /dev/null and "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\345\244\261\350\264\245\344\270\224\344\270\215\346\211\223\345\215\260\346\227\245\345\277\227.png" differ diff --git "a/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\346\212\245\351\224\231no_space_left2.png" "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\346\212\245\351\224\231no_space_left2.png" new file mode 100644 index 0000000000000000000000000000000000000000..53a7153d12d38557822d31662a40e3ce2e983baf Binary files /dev/null and "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\346\212\245\351\224\231no_space_left2.png" differ diff --git "a/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\346\212\245\351\224\231no_spcae_left.png" "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\346\212\245\351\224\231no_spcae_left.png" new file mode 100644 index 0000000000000000000000000000000000000000..11eaed7279127c472f19f3ac38db4df77fc67315 Binary files /dev/null and "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\346\212\245\351\224\231no_spcae_left.png" differ diff --git "a/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\346\234\215\345\212\241\350\266\205\346\227\266.png" "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\346\234\215\345\212\241\350\266\205\346\227\266.png" new file mode 100644 index 0000000000000000000000000000000000000000..fa148daa637d1cab290c12e5aac21de9fa324b25 Binary files /dev/null and "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\346\234\215\345\212\241\350\266\205\346\227\266.png" differ diff --git "a/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\351\205\215\347\275\256\346\226\207\344\273\266\351\224\231\350\257\257.png" "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\351\205\215\347\275\256\346\226\207\344\273\266\351\224\231\350\257\257.png" new file mode 100644 index 0000000000000000000000000000000000000000..0a21dda6339615674350d0a087d9a961660926dc Binary files /dev/null and "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\351\205\215\347\275\256\346\226\207\344\273\266\351\224\231\350\257\257.png" differ diff --git "a/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\351\223\276\346\216\245containerd.sock\345\244\261\350\264\245.png" "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\351\223\276\346\216\245containerd.sock\345\244\261\350\264\245.png" new file mode 100644 index 0000000000000000000000000000000000000000..afb4d9053b8e3c0b4674674dcb8fe2f31f3a7fda Binary files /dev/null and "b/docs/zh/faq/caselibrary/figures/docker\345\220\257\345\212\250\351\223\276\346\216\245containerd.sock\345\244\261\350\264\245.png" differ