Мне интересно, может ли быть так, что VPS является основной причиной сбоев, которые происходят каждые 3-7 дней в ночное время с 03:00 до 04:00. (ошибка ядра или что-то еще), или это узел, на котором размещен виртуальный сервер (проблема с бэкэндом).
Подробности: VPS на основе KVM с CentOS 7, xfs размещен у поставщика VPS, у которого есть спина -концевая и внутренняя инфраструктура хранилища.
Обычно это происходит следующим образом, когда запущенный процесс kthreadd
сразу переходит в D
-статус (т.е. непрерывный сон), а затем мы получаем такие сообщения: заблокирован более 120 секунд.
и высокий LA:
21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] Мне интересно, может ли быть так, что VPS является основной причиной сбоев, которые происходят каждые 3-7 дней ночью с 03:00 до 04:00 (ошибка ядра или что-то еще), или это узел, на котором виртуальный сервер размещен (проблема с бэкэндом).
Подробности: VPS на основе KVM с CentOS 7, xfs размещен у поставщика VPS, у которого есть серверная часть и внутренняя инфраструктура хранилища.
Обычно это происходит следующим образом , сразу же выполняющийся процесс kthreadd
переходит в состояние D
(т.е. в непрерывный сон), а затем мы получаем такие сообщения, как: заблокирован более чем на 120 секунд.
и высокий LA:
21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] Мне интересно, может ли быть так, что VPS является основной причиной сбоев, которые происходят каждые 3-7 дней ночью с 03:00 до 04:00 (ошибка ядра или что-то еще), или это узел, на котором виртуальный сервер размещен (проблема с бэкэндом).
Подробности: VPS на основе KVM с CentOS 7, xfs размещен у поставщика VPS, у которого есть серверная часть и внутренняя инфраструктура хранилища.
Обычно это происходит следующим образом , сразу же выполняющийся процесс kthreadd
переходит в состояние D
(т.е. в непрерывный сон), а затем мы получаем такие сообщения, как: заблокирован более чем на 120 секунд.
и высокий LA:
21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] или это узел, на котором размещен виртуальный сервер (проблема с серверной частью).
Подробности: VPS на основе KVM с CentOS 7, xfs, размещенный у поставщика VPS, у которого есть серверная часть и внутренняя инфраструктура хранения.
Обычно это происходит следующим образом: сразу запущенный процесс kthreadd
переходит в D
-статус (т.е. непрерывный сон), а затем мы получаем такие сообщения: заблокирован более 120 секунд.
и высокий LA:
21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] или это узел, на котором размещен виртуальный сервер (проблема с серверной частью).
Подробности: VPS на основе KVM с CentOS 7, xfs, размещенный у поставщика VPS, у которого есть серверная часть и внутренняя инфраструктура хранения.
Обычно это происходит следующим образом: сразу запущенный процесс kthreadd
переходит в D
-статус (т.е. непрерывный сон), а затем мы получаем такие сообщения: заблокирован более 120 секунд.
и высокий LA:
21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] а затем мы получаем такие сообщения:
заблокирован более чем на 120 секунд.
и высокий LA:
21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] а затем мы получаем такие сообщения:
заблокирован более чем на 120 секунд.
и высокий LA:
21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd]
21 мая 03:10:01 vps root: root 2 0.0 0.0 0 0? S 18 мая 0:00 [kthreadd]
21 мая 03:12:01 vps root: root 2 0.0 0.0 0 0? S 18 мая 0:00 [kthreadd]
21 мая 03:14:01 vps root: root 2 0.0 0.0 0 0? D 18 мая 0:00 [kthreadd]
21 мая, 03:15:16 vps kernel: INFO: задача kthreadd: 2 заблокирована более 120 секунд.
21 мая 03:15:16 ядро vps: kthreadd D ffffffffffffffff 0 2 0 0x00000000
21 мая, 03:15:16 ядро vps: [
здесь у нас есть трассировка звонков:
18 мая 04:14:37 vps kernel: INFO: задача kthreadd: 2 заблокирована более 120 секунд.
18 мая, 04:14:37 vps kernel: "echo 0> / proc / sys / kernel / hung_task_timeout_secs" отключает это сообщение.
18 мая 04:14:37 ядро vps: kthreadd D ffffffffffffffff 0 2 0 0x00000000
18 мая 04:14:37 ядро vps: ffff88023413b4e0 0000000000000046 ffff880234120b80 ffff88023413bfd8
18 мая 04:14:37 vps ядро: ffff88023413bfd8 ffff88023413bfd8 ffff880234120b80 ffff88023413b628
18 мая 04:14:37 ядро vps: ffff88023413b630 7fffffffffffffff ffff880234120b80 ffffffffffffffff
18 мая 04:14:37 ядро vps: Отслеживание вызовов:
18 мая, 04:14:37 ядро vps: [
Уловка с грязными страницами не помогла.
Только полная перезагрузка помогает привести сервер в рабочее состояние.
Не могли бы вы помочь понять, возникла ли проблема на стороне VPS или узла?
С Уважением, Алекс.
Вероятно, это процесс резервного копирования или что-то влияющее на хранилище, происходящее на уровне хоста . Это находится вне вашего контроля, и вам следует подтолкнуть поставщика VPS к решению.
Если они не могут решить эту проблему, подумайте о том, чтобы обратиться в другое место.
Это потому, что вы используете Redhat / CentOS 7.2 и xfs. Ядро нестабильно, как было с 7.1. Текущее решение - перейти на ext4, если вы хотите использовать CentOS 7.2.