У меня есть решение VMware, работающее на HP bladesystem с Левым ISCSI san. В той среде в настоящее время существует два хоста VMware.
У меня есть совместное использование двух VM Debian диска ISCSI (с ocfs2), смонтированный непосредственно от san, использующего открытый-iscsi. Все это работало отлично, но вчера один клиент отказал, как только это заставило писать что-то на общем ocfs2 разделе.
Я пытался установить некоторые параметры ISCSI на более консервативные значения, напрасно. Только (v-) перемещение клиента к другому хосту VM разрешил проблему. Сегодня, перемещение другого клиента к проблематичному хосту вызывает те же ошибки:
connection1:0: ping timeout of 5 secs expired, recv timeout 5, last rx 4294971299, last ping 4294966612, now 4294973799
connection1:0: detected conn error (1011)
iscsid: Kernel reported iSCSI connection 1:0 error (1011 - ISCSI_ERR_CONN_FAILED: iSCSI connection failed) state (3)
kernel: [ 328.558970] connection1:0: detected conn error (1020)
iscsid: connection1:0 is operational after recovery (1 attempts)
[repeat until hard reset]
Это, кажется, связано с этим хост VM, который имеет ту же самую конфигурацию как другая. Будучи блейдами, они используют те же сетевые аппаратные средства, гибкий провод 10 межсоединений.
У кого-то есть какая-либо идея, с чем это могло быть связано? Я хотел бы найти причину, поскольку оба хоста VM могли en, имеющий ту же проблему (я должен буду переключиться на сетевые диски затем, кажется более стабильным, менее подверженным жестким перезагрузкам).
Эта ошибка связана с тайм-аутом сообщений при записи. Есть люди, которые рекомендуют использовать vlan для получения лучшей пропускной способности при передаче данных. Так что проблема заключается в следующем: хост: IP-стек, адаптер, сетевой коммутатор, сетевой адаптер NetApp и т.д.
Другое, что вы можете сделать - это увеличить тайм-аут записи на диск.
echo 180 > /sys/block/sdX/device/timeout
At iscsi initiator config I used to config:
node.session.iscsi.InitialR2T = No
and these parameters will increase the iscsi loggs. Используйте только то, что необходимо:
# echo 1 > /sys/module/libiscsi/parameters/debug_libiscsi_session
# echo 1 > /sys/module/libiscsi/parameters/debug_libiscsi_eh
# echo 1 > /sys/module/libiscsi/parameters/debug_libiscsi_conn
# echo 1 > /sys/module/libiscsi_tcp/parameters/debug_libiscsi_tcp
# echo 1 > /sys/module/iscsi_tcp/parameters/debug_iscsi_tcp