Как Martin сказал, эта ошибка принадлежат Вашим бэкендам, хотя можно удостовериться, что Вы не ставите слишком много в очередь запросы на неудавшемся бэкенде и получаете хороший обзор состояния бэкенда с haproxy и его организацией очередей и healthchecking возможностями. Вход восходящего времени отклика в nginx ($upstream_response_time) может быть полезным также.
Эта проблема была решена путем создания соединений SAN с 1 по 1 через порты коммутатора. Разрешение всех виртуальных локальных сетей SAN на всех портах испортило настройку.