VPS на основе KVM дает сбой каждые 3-7 дней. Это проблема на стороне VPS или узла?

Question

VPS на основе KVM дает сбой каждые 3-7 дней. Это проблема на стороне VPS или узла?

Мне интересно, может ли быть так, что VPS является основной причиной сбоев, которые происходят каждые 3-7 дней в ночное время с 03:00 до 04:00. (ошибка ядра или что-то еще), или это узел, на котором размещен виртуальный сервер (проблема с бэкэндом).

Подробности: VPS на основе KVM с CentOS 7, xfs размещен у поставщика VPS, у которого есть спина -концевая и внутренняя инфраструктура хранилища.

Обычно это происходит следующим образом, когда запущенный процесс kthreadd сразу переходит в D -статус (т.е. непрерывный сон), а затем мы получаем такие сообщения: заблокирован более 120 секунд. и высокий LA:

21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] Мне интересно, может ли быть так, что VPS является основной причиной сбоев, которые происходят каждые 3-7 дней ночью с 03:00 до 04:00 (ошибка ядра или что-то еще), или это узел, на котором виртуальный сервер размещен (проблема с бэкэндом).



 Подробности: VPS на основе KVM с CentOS 7, xfs размещен у поставщика VPS, у которого есть серверная часть и внутренняя инфраструктура хранилища. 

 Обычно это происходит следующим образом , сразу же выполняющийся процесс  kthreadd  переходит в состояние  D  (т.е. в непрерывный сон), а затем мы получаем такие сообщения, как:  заблокирован более чем на 120 секунд.  и высокий LA: 


 21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] Мне интересно, может ли быть так, что VPS является основной причиной сбоев, которые происходят каждые 3-7 дней ночью с 03:00 до 04:00 (ошибка ядра или что-то еще), или это узел, на котором виртуальный сервер размещен (проблема с бэкэндом). 


 Подробности: VPS на основе KVM с CentOS 7, xfs размещен у поставщика VPS, у которого есть серверная часть и внутренняя инфраструктура хранилища. 

 Обычно это происходит следующим образом , сразу же выполняющийся процесс  kthreadd  переходит в состояние  D  (т.е. в непрерывный сон), а затем мы получаем такие сообщения, как:  заблокирован более чем на 120 секунд.  и высокий LA: 


 21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] или это узел, на котором размещен виртуальный сервер (проблема с серверной частью). 


 Подробности: VPS на основе KVM с CentOS 7, xfs, размещенный у поставщика VPS, у которого есть серверная часть и внутренняя инфраструктура хранения. 

 Обычно это происходит следующим образом: сразу запущенный процесс  kthreadd  переходит в  D  -статус (т.е. непрерывный сон), а затем мы получаем такие сообщения:  заблокирован более 120 секунд.  и высокий LA: 


 21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] или это узел, на котором размещен виртуальный сервер (проблема с серверной частью). 


 Подробности: VPS на основе KVM с CentOS 7, xfs, размещенный у поставщика VPS, у которого есть серверная часть и внутренняя инфраструктура хранения. 

 Обычно это происходит следующим образом: сразу запущенный процесс  kthreadd  переходит в  D  -статус (т.е. непрерывный сон), а затем мы получаем такие сообщения:  заблокирован более 120 секунд.  и высокий LA: 


 21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] а затем мы получаем такие сообщения:  заблокирован более чем на 120 секунд.  и высокий LA: 



 21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd] а затем мы получаем такие сообщения:  заблокирован более чем на 120 секунд.  и высокий LA: 



 21 мая 03:08:01 vps root: root 2 0,0 0,0 0 0? S 18 мая 0:00 [kthreadd]
21 мая 03:10:01 vps root: root 2 0.0 0.0 0 0? S 18 мая 0:00 [kthreadd]
21 мая 03:12:01 vps root: root 2 0.0 0.0 0 0? S 18 мая 0:00 [kthreadd]
21 мая 03:14:01 vps root: root 2 0.0 0.0 0 0? D 18 мая 0:00 [kthreadd]
21 мая, 03:15:16 vps kernel: INFO: задача kthreadd: 2 заблокирована более 120 секунд.
21 мая 03:15:16 ядро vps: kthreadd D ffffffffffffffff 0 2 0 0x00000000
21 мая, 03:15:16 ядро vps: [] kthreadd + 0x2b2 / 0x2f0
21 мая 03:16:01 vps root: root 2 0.0 0.0 0 0? D 18 мая 0:00 [kthreadd]
21 мая 03:18:01 vps root: root 2 0.0 0.0 0 0? D 18 мая 0:00 [kthreadd]
21 мая 03:20:02 vps root: root 2 0.0 0.0 0 0? D 18 мая 0:00 [kthreadd]


 здесь у нас есть трассировка звонков: 


 18 мая 04:14:37 vps kernel: INFO: задача kthreadd: 2 заблокирована более 120 секунд.
18 мая, 04:14:37 vps kernel: "echo 0> / proc / sys / kernel / hung_task_timeout_secs" отключает это сообщение.
18 мая 04:14:37 ядро vps: kthreadd D ffffffffffffffff 0 2 0 0x00000000
18 мая 04:14:37 ядро vps: ffff88023413b4e0 0000000000000046 ffff880234120b80 ffff88023413bfd8
18 мая 04:14:37 vps ядро: ffff88023413bfd8 ffff88023413bfd8 ffff880234120b80 ffff88023413b628
18 мая 04:14:37 ядро vps: ffff88023413b630 7fffffffffffffff ffff880234120b80 ffffffffffffffff
18 мая 04:14:37 ядро vps: Отслеживание вызовов:
18 мая, 04:14:37 ядро vps: [] расписание + 0x29 / 0x70
18 мая, 04:14:37 ядро vps: [] schedule_timeout + 0x209 / 0x2d0
18 мая, 04:14:37 ядро vps: []? x2apic_send_IPI_mask + 0x13 / 0x20
18 мая, 04:14:37 ядро vps: []? try_to_wake_up + 0x1b6 / 0x300
18 мая, 04:14:37 ядро vps: [] wait_for_completion + 0x116 / 0x170
18 мая, 04:14:37 ядро vps: []? wake_up_state + 0x20 / 0x20
18 мая, 04:14:37 ядро vps: [] flush_work + 0xfc / 0x1c0
18 мая, 04:14:37 ядро vps: []? move_linked_works + 0x90 / 0x90
18 мая, 04:14:37 ядро vps: [] xlog_cil_force_lsn + 0x8a / 0x210 [xfs]
18 мая, 04:14:37 ядро vps: [] _xfs_log_force_lsn + 0x6e / 0x2f0 [xfs]
18 мая, 04:14:37 ядро vps: []? __slab_free + 0x10e / 0x277
18 мая, 04:14:37 ядро vps: [] xfs_log_force_lsn + 0x2e / 0x90 [xfs]
18 мая, 04:14:37 ядро vps: []? xfs_iunpin_wait + 0x19 / 0x20 [xfs]
18 мая, 04:14:37 ядро vps: [] __xfs_iunpin_wait + 0xa7 / 0x150 [xfs]
18 мая, 04:14:37 ядро vps: []? wake_atomic_t_function + 0x40 / 0x40
18 мая, 04:14:37 ядро vps: [] xfs_iunpin_wait + 0x19 / 0x20 [xfs]
18 мая, 04:14:37 ядро vps: [] xfs_reclaim_inode + 0x8c / 0x350 [xfs]
18 мая, 04:14:37 ядро vps: [] xfs_reclaim_inodes_ag + 0x267 / 0x390 [xfs]
18 мая, 04:14:37 ядро vps: [] xfs_reclaim_inodes_nr + 0x33 / 0x40 [xfs]
18 мая, 04:14:37 ядро vps: [] xfs_fs_free_cached_objects + 0x15 / 0x20 [xfs]
18 мая, 04:14:37 ядро vps: [] prune_super + 0xe8 / 0x170
18 мая, 04:14:37 ядро vps: [] shrink_slab + 0x165 / 0x300
18 мая, 04:14:37 ядро vps: []? vmpressure + 0x21 / 0x90
18 мая, 04:14:37 ядро vps: [] do_try_to_free_pages + 0x3c2 / 0x4e0
18 мая, 04:14:37 ядро vps: [] try_to_free_pages + 0xfc / 0x180
18 мая, 04:14:37 ядро vps: [] __alloc_pages_nodemask + 0x7fd / 0xb90
18 мая, 04:14:37 ядро vps: [] copy_process.part.25 + 0x163 / 0x1610
18 мая, 04:14:37 ядро vps: []? kthread_create_on_node + 0x140 / 0x140
18 мая 04:14:37 ядро vps: [] do_fork + 0xe1 / 0x320
18 мая, 04:14:37 ядро vps: [] kernel_thread + 0x26 / 0x30
18 мая 04:14:37 vps ядро: [] kthreadd + 0x2b2 / 0x2f0
18 мая, 04:14:37 ядро vps: []? kthread_create_on_cpu + 0x60 / 0x60
18 мая 04:14:37 ядро vps: [] ret_from_fork + 0x58 / 0x90
18 мая, 04:14:37 ядро vps: []? kthread_create_on_cpu + 0x60 / 0x60


 Уловка с грязными страницами не помогла. 

 Только полная перезагрузка помогает привести сервер в рабочее состояние. 

 Не могли бы вы помочь понять, возникла ли проблема на стороне VPS или узла? 

 С Уважением,
Алекс.


         
            2

         
         
            kvm-virtualization centos7 server-crashes         
         
         
            задан Alex
            24 May 2016 в 14:52 
         
         
         Ссылка


    2 ответа


  
    
   
   
      

      
         
                     
      

         
         
            
               
                  
                      Вероятно, это процесс резервного копирования или что-то влияющее на хранилище, происходящее на уровне  хоста .  Это находится вне вашего контроля, и вам следует подтолкнуть поставщика VPS к решению. 

 Если они не могут решить эту проблему, подумайте о том, чтобы обратиться в другое место. 
                  
                  5

                  
                  
                     ответ дан 
                     3 December 2019 в 10:38 
                  
                  Ссылка
               
                              
                  
                     
      
                                         
                  
               
            
         
         
         
            
               
                  

                    

                  
              
           

   
         
            
               
                  
                      Это потому, что вы используете Redhat / CentOS 7.2 и xfs.  Ядро нестабильно, как было с 7.1.  Текущее решение - перейти на ext4, если вы хотите использовать CentOS 7.2. 
                  
                  -2

                  
                  
                     ответ дан 
                     3 December 2019 в 10:38 
                  
                  Ссылка
               
                              
                  
                     
      
                                         
                  
               
            
         
         
              



      
        Теги
        
         kvm-virtualization centos7 server-crashes       

        Похожие вопросы
        
          
                          364 
 Кто-либо еще испытывающий высокие показатели сервера Linux разрушает во время прыжка второй день? - 4 July 2012 00:09 
                            141 
 Различие между KVM и QEMU - 24 June 2015 10:12 
                            100 
 Как Вы увеличиваете дисковое пространство гостя KVM? - 24 October 2011 17:37 
                            59 
 Centos 7 сохраняет iptables настройки - 5 March 2017 19:57 
                            42 
  Я обновил свою систему CentOS 7. Почему Meltdown / Spectre смягчается лишь частично?  - 5 January 2018 21:19 
                            41 
 Заменить инфраструктуру VMware vSphere альтернативами с открытым исходным кодом? - 14 October 2011 18:15 
                            36 
 Xen по сравнению с KVM в производительности - 17 September 2017 22:50 
                            34 
 Корректный способ переместить kvm vm - 2 October 2012 17:20 
                            31 
 KVM/libvirt: Как настроить статические гостевые IP-адреса на хосте виртуализации - 9 September 2014 20:21 
                            28 
 Существует ли способ выполнить virt-менеджера в Windows? - 12 November 2013 13:08 
                            28 
 Гость KVM установлен от консоли. Но как добраться до консоли гостя? - 10 April 2011 18:17 
                            28 
  Как уменьшить / home и добавить больше места в CentOS7  - 21 April 2016 14:30 
                            27 
  Программа установки Windows 7 зависает при запуске Windows с использованием Proxmox 4. 2  - 13 May 2016 13:23 
                            27 
 Невероятно низкая производительность диска KVM (qcow2 дисковые файлы + virtio) - 2 May 2019 11:21 
                            24 
 как переименовать VM, использующий libvirt+KVM - 18 November 2010 10:08

score 5 · Answer 1 · 3 December 2019 в 10:38

Вероятно, это процесс резервного копирования или что-то влияющее на хранилище, происходящее на уровне хоста . Это находится вне вашего контроля, и вам следует подтолкнуть поставщика VPS к решению.

Если они не могут решить эту проблему, подумайте о том, чтобы обратиться в другое место.

score -2 · Answer 2 · 3 December 2019 в 10:38

Это потому, что вы используете Redhat / CentOS 7.2 и xfs. Ядро нестабильно, как было с 7.1. Текущее решение - перейти на ext4, если вы хотите использовать CentOS 7.2.