服务器之家:专注于VPS、云服务器配置技术及软件下载分享
分类导航

云服务器|WEB服务器|FTP服务器|邮件服务器|虚拟主机|服务器安全|DNS服务器|服务器知识|Nginx|IIS|Tomcat|

服务器之家 - 服务器技术 - 服务器知识 - 强制异常容器重启,让你的Docker锦上添花

强制异常容器重启,让你的Docker锦上添花

2024-01-16 13:24微技术之家 服务器知识

Docker在1.12版本之后提供了HEALTHCHECK指令,可以设定一行command用来判断服务的状态是否正常,这样可以更准确地判断服务状态。

今天我们接着上次的docker健康检查机制那篇文章,讲述一下如何给不健康的容器进行重启。另外有读者反馈有几个参数不是很理解,我们会在这篇文章里再补充讲解一下。

Docker在1.12版本之后提供了HEALTHCHECK指令,可以设定一行command用来判断服务的状态是否正常,这样可以更准确地判断服务状态。

HEALTHCHECK Container启动后的初始状态为starting,在指令检查成功后,状态会更改为healthy,如果连续失败超过指定次数则会改为unhealthy。看下HealthCheck的工作机制。

强制异常容器重启,让你的Docker锦上添花

HEALTHCHECK参数选项:

--interval: Health check时间间隔,预设为30秒

--timeout:当Health check超过此设定的时间,则会视为失败,预设为30秒

--retries:当Health check连续失败次数超过此设定时,则会将状态更改为,预设为3次unhealthy

--start-period:启动时间,预设为0秒

HEALTHCHECK可以通过Dockerfile或是docker-compose.yml设定:

Dockerfile 示例

在Dockerfile中,HEALTHCHECK指令格式为

HEALTHCHECK [options] CMD <command>

<command>可以是shell指令或是exec格式(和其他Dockerfile指令相同,可以参考ENTRYPOINT)。而一个Dockerfile中只能有一个HEALTHCHECK指令,如果同时有多个HEALTHCHECK指令,则只有最后一个有效。

<command>的返回值代表container的状态:

0:成功,container is healthy

1:失败,如果失败超过指定次数,则container为unhealthy

2: reserved,不要使用这个值

假设我们的container服务是web服务,我们可以使用来检查服务是否正常运行,例如:每30秒检查一次是否可在5秒内响应请求:curl http://localhost:3000

# ...


HEALTHCHECK --interval=30s --timeout=5s --retries=5 --start_period=30s \
  CMD curl -fs http://localhost:3000/ || exit 1


# ...

Docker-compose 示例

docker-compose.yml的healthcheck,示例如下:

version: "3.7"
services:
  api:
    restart: always
    image: api
    container_name: api
    ports:
      - 3000:3000
    build:
      context: ./api
    healthcheck:
      test: curl -fs http://localhost:3000/ || exit 1
      interval: 30s
      timeout: 5s
      retries: 5
      start_period: 30s
    networks:
      - net
networks:
  net:
    name: net
    driver: bridge

其中test必须是string或list.如果是list,第一个item必须是NONE,或CMD-SHELL。如果是string,则等同于CMD-SHELL。

确认健康状态

在设定好health check指令之后,接着启动container,检查container状态时可以看到初始状态是:health: starting

$ docker ps
CONTAINER ID        IMAGE               COMMAND                  CREATED             STATUS                            PORTS                       NAMES
6c7b9ca321d2        api:1.0.0           "uwsgi --ini /home/d…"   5 seconds ago       Up 2 seconds (health: starting)   0.0.0.0:3000->3000/tcp      api

过30秒之后再执行一次docker ps,可以看到container的状态变成:healthy

$ docker ps
CONTAINER ID        IMAGE               COMMAND                  CREATED             STATUS                            PORTS                       NAMES
6c7b9ca321d2        api:1.0.0           "uwsgi --ini /home/d…"   35 seconds ago      Up 32 seconds (healthy)           0.0.0.0:3000->3000/tcp      api

而如果连续失败超过指定次数,状态会变成unhealthy。

关键步骤:重新启动不正常的容器

以上的步骤只有检查container的健康状态,但没有针对unhealthy container做任何处理,这部分我们可以搭配docker-autoheal来重启unhealthy container。先看下AutoHeal的工作机制。

强制异常容器重启,让你的Docker锦上添花

autoheal可以直接使用docker执行,或是写在docker-compose中:

使用 docker 指令:

$ docker run -d \
    --name autoheal \
    --restart=always \
    -e AUTOHEAL_CONTAINER_LABEL=all \
    -v /var/run/docker.sock:/var/run/docker.sock \
    willfarrell/autoheal

使用docker-compose指令:

version: "3.7"
services:
  autoheal:
    restart: always
    image: willfarrell/autoheal
    container_name: autoheal
    environment:
      - AUTOHEAL_CONTAINER_LABEL=all
    volumes:
      - /var/run/docker.sock:/var/run/docker.sock

然后执行 docker-compose up -d autoheal 就可以启动。

启动之后可以通过docker ps观察unhealthy的容器是否重启了。也可以查看autoheal的日志查看是否有启动记录。

最后再给大家介绍一种模拟unhealthy的方法,正常情况下都是healthy的,可以通过修改命令来模拟unhealthy。比如模拟mysql的服务,我们可以使用如下命令。

test: ["CMD", "nc -vz localhost 3307 || exit 1"]

正常监听3306端口,我们用3307连接检查,就会一直处于unhealthy状态,这个时候我们可以通过autoheal的日志观察到对mysql容器的重启。

有了这个机制,以后docker假死的情况就可以自动重启了。这个检查和自动重启机制对于数据库或者tomcat服务都非常有用。如果使用过程中有什么问题也欢迎发消息给我们。

原文地址:https://mp.weixin.qq.com/s?__biz=MzkzNjQzOTE3Nw==&mid=2247489743&idx=1&sn=01112993f00226cc49556f5e21be7cb8

延伸 · 阅读

精彩推荐
  • 服务器知识VMWare VMNet 8的配置使用详解

    VMWare VMNet 8的配置使用详解

    这篇文章主要介绍了VMWare VMNet 8的配置使用详解,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧...

    野火15832021-01-08
  • 服务器知识使用Docker部署Dashdot服务器仪表盘的步骤

    使用Docker部署Dashdot服务器仪表盘的步骤

    Dashdot是一款简单、实用的开源服务器仪表盘,设计时考虑到了玻璃形态,它旨在用于较小的 VPS 和私人服务器,这篇文章主要介绍了使用Docker部署Dashdot服务...

    江湖有缘8552023-03-20
  • 服务器知识服务器做raid1问题集锦

    服务器做raid1问题集锦

    这篇文章主要是因为最近的服务器为了安全性考虑了做了raid1,但怕硬盘出问题,特整理了这篇文章,并根据自己的经验结合了下,希望能帮到需要的朋友...

    服务器知识网4892020-07-07
  • 服务器知识Linux系统docker部署.net core3.1的详细步骤

    Linux系统docker部署.net core3.1的详细步骤

    这篇文章主要介绍了Linux系统docker部署.net core3.1,文章演示基本的基于docker部署.netcore服务,linux系统腾讯云ubuntu,.net core版本3.1,需要的朋友可以参考下...

    CL静淡4112022-11-16
  • 服务器知识Kong和Konga在K8s部署真的很难吗?

    Kong和Konga在K8s部署真的很难吗?

    随着k8s的成熟,在k8s上使用ingress-nginx、traefik、apisix等各类ingress的人也越来越多。ingress-kong也可以作为k8s的ingress使用,当然kong也可以单独作为微服务的g...

    运维开发故事7502021-09-26
  • 服务器知识Docker四种网络类型原理实例解析

    Docker四种网络类型原理实例解析

    这篇文章主要介绍了Docker四种网络类型原理实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以...

    水墨如丹青8742021-04-26
  • 服务器知识关于数据库服务器的四个问题

    关于数据库服务器的四个问题

    总的来说,数据库服务器解决方案为用户网络提供中央数据管理、安全性、访问和权限控制以及交互式存储库。本文着眼于什么是数据库服务器、数据库提...

    IT1689442021-08-26
  • 服务器知识ICMP重定向报文导致的问题与分析

    ICMP重定向报文导致的问题与分析

    前段时间, 业务方反馈集群内有一台服务器慢请求(>1s)记录比其他台多一倍。查找了下原因,发现这台服务器的网关配置成同网段内其他服务器IP上了,...

    小编72023-08-31