Какое значение жесткого диска avgqu-sz является критическим?

Это - мой график жесткого диска avgqu-sz от различных машин приложения:avgqu-sz данные кэшей Приложения в памяти и каждый n минуты являются данными, сброшенными к файловой системе + каждый, m минуты являются данными (ре), загруженное из файловой системы в памяти. Это - причина скачков. Использование блочных устройств во время этих скачков составляет 80-95%.

Q: Я должен волноваться о своей дисковой производительности? То, как интерпретировать этот график - в порядке или не хорошо? Я должен оптимизировать что-то?

  • Да, у меня есть довольно высокие скачки ~1k, но затем размер очереди ~1 =>, однажды в среднем ~16 - я не знаю, Могу ли я быть доволен этим, в среднем оценивают
  • Да, я знаю то, что означает метрика avgqu-sz
  • Да, я оптимизировал свои файловые системы для высокого IOps (noatime, nodirtime)
0
задан 4 December 2014 в 21:00
2 ответа

Да, я знаю, что означает метрика avggu-sz Это означает, что вы знаете, что обычно такие потоки данных

     app --> bio layer --> I/O Scheduler --> Driver --> Disks
                           nr_requests                  queue_depth

Это всего лишь общий обзор и не охватывает все. Пока nr_requests остается queue_Depth, ввод-вывод будет проходить быстро. Проблема начинает возникать, когда эти запросы превышают глубину очереди. и ввод / вывод начинается на уровне планировщика.

Глядя на ваши графики, я настоятельно рекомендую 1: проверьте диск с высокими пиками 2: Попробуйте изменить значение nr_requests и queue_depth, чтобы узнать, поможет ли это 3: Измените планировщик в своей тестовой среде (так как ваши данные здесь не содержат запрос на слияние (чтение / запись) ... поэтому я не могу комментировать)

                /sys/block/<your disk drive sda,sdb...>/queue/nr_requests (io scheduler)
                /sys/block/<your disk drive sda,sdb...>/device/queue_depth (driver)
1
ответ дан 4 December 2019 в 17:07

Средний размер очереди, превышающий 1000 запросов, представляет собой проблему, если вы не используете массив с сотнями дисков, представленных как одно устройство.

Однако, исходя из вашего графика, я могу утверждать, что большинство ваших всплесков - это артефакты измерений или графического представления - ваши данные выглядят так, как будто они собираются с 5-минутными интервалами, но ширина всплесков в основном равна нулю - очень необычно. Вам следует взглянуть на необработанные данные, собранные sar или отображаемые iostat в режиме, близком к реальному времени, чтобы исключить это. Если вы по-прежнему видите размер очереди, превышающий 30 запросов на каждый используемый шпиндель, проверьте здесь данные.

0
ответ дан 4 December 2019 в 17:07

Теги

Похожие вопросы