У меня есть кластер из 2 узлов, настроенный на CentOS 7.6
с последним докером
и Пакеты pacemaker
.
В настоящее время я пытаюсь предоставить HA для пары контейнеров, но после настройки ресурса pacemaker
ocf: heartbeat: docker
все контейнеры не запускаются . Я пробовал использовать простой контейнер alpine
без каких-либо других параметров, кроме тех, которые требуются агенту ресурсов, но он по-прежнему не запускается.
Может кто-нибудь объяснить, что может быть причиной этого и как устранить неполадки проблема.
следующий вывод был получен из crm_mon
.
[root@drbd-node01 ~]# crm_mon -Arf1
Stack: corosync
Current DC: drbd-node01 (version 1.1.19-8.el7_6.4-c3c624ea3d) - partition with quorum
Last updated: Fri Sep 13 19:50:54 2019
Last change: Thu Sep 12 17:25:22 2019 by hacluster via cibadmin on drbd-node01
2 nodes configured
4 resources configured
Online: [ drbd-node01 drbd-node02 ]
Full list of resources:
blog-vip (ocf::heartbeat:IPaddr2): Started drbd-node01
Clone Set: blog-drbd-svcs-clone [blog-drbd-svcs]
Started: [ drbd-node01 drbd-node02 ]
test_docker (ocf::heartbeat:docker): FAILED drbd-node01 (Monitoring)
Node Attributes:
* Node drbd-node01:
* Node drbd-node02:
Migration Summary:
* Node drbd-node01:
test_docker: migration-threshold=1000000 fail-count=78996 last-failure='Fri Sep 13 19:50:54 2019'
* Node drbd-node02:
test_docker: migration-threshold=1000000 fail-count=1000000 last-failure='Thu Sep 12 17:25:53 2019'
Failed Actions:
* test_docker_start_0 on drbd-node01 'unknown error' (1): call=348928, status=complete, exitreason='Newly created docker container exited after start',
last-rc-change='Fri Sep 13 19:50:53 2019', queued=0ms, exec=1098ms
* test_docker_start_0 on drbd-node02 'unknown error' (1): call=94, status=complete, exitreason='Newly created docker container exited after start',
last-rc-change='Thu Sep 12 17:25:53 2019', queued=0ms, exec=489ms
Я нашел решение, немного поработав с командой pcs resource create
. Проблема возникла из-за того, что я предоставил значения аргументу run_opts
. Пришлось инкапсулировать ответ в ""
, чтобы запустить его правильно.
pcs resource create blog_db_docker ocf:heartbeat:docker image=mariadb reuse=true allow_pull=true run_opts="--volume-driver drbdmanage -v blogdb:/var/lib/mysql --expose=3306 --env MYSQL_ROOT_PASSWORD=abc123" op monitor interval=30s