DL180 G6 - ESXI 6.0 - P410 - Потеря доступа к тому Проблема

У нас есть сервер DL180 G6 с картой RAID P410. Сервер имеет следующие три RAID-массива.

4x2TB - RAID 10

4x2TB - RAID 10

2x2TB - RAID 1

Жесткие диски 2x2TB сконфигурированы как «горячий» резерв для трех массивов.

Ниже приведено описание соответствующий вывод ESXCLI

Smart Array P410 в слоте 1

Bus Interface: PCI
Slot: 1
Serial Number: PACCR9VYJKGQ
Cache Serial Number: PAAVP9VYJCYN
RAID 6 (ADG) Status: Enabled
Controller Status: OK
Hardware Revision: C
Firmware Version: 2.72
Rebuild Priority: Medium
Expand Priority: Medium
Surface Scan Delay: 15 secs
Surface Scan Mode: Idle
Parallel Surface Scan Supported: No
Queue Depth: Automatic
Monitor and Performance Delay: 60  min
Elevator Sort: Enabled
Degraded Performance Optimization: Disabled
Inconsistency Repair Policy: Disabled
Wait for Cache Room: Disabled
Surface Analysis Inconsistency Notification: Disabled
Post Prompt Timeout: 0 secs
Cache Board Present: True
Cache Status: OK
Cache Ratio: 25% Read / 75% Write
Drive Write Cache: Disabled
Total Cache Size: 512 MB
Total Cache Memory Available: 400 MB
No-Battery Write Cache: Disabled
Cache Backup Power Source: Batteries
Battery/Capacitor Count: 1
Battery/Capacitor Status: OK
SATA NCQ Supported: True
Number of Ports: 2 Internal only
Driver Name: HP HPSA
Driver Version: 6.0.0
PCI Address (Domain:Bus:Device.Function): 0000:06:00.0
Host Serial Number: USE626N2XD
Sanitize Erase Supported: False
Primary Boot Volume: None
Secondary Boot Volume: None
Secondary Boot Volume: None

массив A (SATA, неиспользуемое пространство: 0 МБ)

  logicaldrive 1 (3.6 TB, RAID 1+0, OK)

  physicaldrive 1I:1:9 (port 1I:box 1:bay 9, SATA, 2 TB, OK)
  physicaldrive 1I:1:10 (port 1I:box 1:bay 10, SATA, 2 TB, OK)
  physicaldrive 1I:1:11 (port 1I:box 1:bay 11, SATA, 2 TB, OK)
  physicaldrive 1I:1:12 (port 1I:box 1:bay 12, SATA, 2 TB, OK)
  physicaldrive 1I:1:5 (port 1I:box 1:bay 5, SATA, 2 TB, OK, spare)
  physicaldrive 1I:1:6 (port 1I:box 1:bay 6, SATA, 2 TB, OK, spare)

массив B (SATA, неиспользуемое пространство: 0 МБ)

  logicaldrive 2 (3.6 TB, RAID 1+0, OK)

  physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SATA, 2 TB, OK)
  physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SATA, 2 TB, OK)
  physicaldrive 1I:1:3 (port 1I:box 1:bay 3, SATA, 2 TB, OK)
  physicaldrive 1I:1:4 (port 1I:box 1:bay 4, SATA, 2 TB, OK)
  physicaldrive 1I:1:5 (port 1I:box 1:bay 5, SATA, 2 TB, OK, spare)
  physicaldrive 1I:1:6 (port 1I:box 1:bay 6, SATA, 2 TB, OK, spare)

массив C (SATA, Неиспользуемое пространство: 0 МБ)

  logicaldrive 3 (1.8 TB, RAID 1, OK)

  physicaldrive 1I:1:7 (port 1I:box 1:bay 7, SATA, 2 TB, OK)
  physicaldrive 1I:1:8 (port 1I:box 1:bay 8, SATA, 2 TB, OK)
  physicaldrive 1I:1:5 (port 1I:box 1:bay 5, SATA, 2 TB, OK, spare)
  physicaldrive 1I:1:6 (port 1I:box 1:bay 6, SATA, 2 TB, OK, spare)

Теперь в ESXI мы время от времени получаем следующие ошибки. d8d385644ec0 (datastore2) из-за возможности подключения вопросы. Выполняется попытка восстановления

Имейте в виду, что это влияет на все три массива в одно и то же точное время , и через несколько секунд все три массива восстанавливаются. Согласно пониманию, все диски подключены к одному порту на карте RAID P410. Как вы думаете, может ли использование обоих портов повысить производительность и потенциально устранить эту повторяющуюся проблему?

На данный момент мы испробовали все программные решения, включая обновление прошивка (обновлена ​​до 6.64). Какие могут быть другие варианты?

Обновление 1

Два запасных диска были настроены как запасные для всех трех массивов, как описано выше. Я удалил запчасти со всех массивов минут на 15, и ошибки прекратились. Теперь я настроил первый запасной для первого массива, а второй - для второго массива, чтобы проверить, появляется ли ошибка снова.

Обновление 2

Повторное подключение запасных частей привело к возврату ошибки, и это влияет на все три массивы. Поэтому я удаляю запчасти одну за другой для дальнейшего устранения этой проблемы. Вероятно, это известная проблема, описанная здесь: http://community.hpe.com/t5/ProLiant-Servers-ML-DL-SL/ESXi5x-HPSA-P410i-WARNING-LinScsi-SCSILinuxAbortCommands-1843/td- p / 6818369 . Скрещенные пальцы.

3
задан 7 May 2016 в 22:40
2 ответа

Асуултанд байрлуулсан хоёр шинэчлэлт ба цаашдын алдааг олж засварлах нь асуудлын бодит хариулт руу хөтлөв. Энэ нь P410 рейд картны ESXI драйвертай холбоотой болохыг бид олж мэдсэн. Бид http://h20564.www2.hpe.com/hpsc/swd/public/detail?swItemId=MTX_d18033ac346f468c92062ce127 -с авах боломжтой драйверын .60 хувилбар руу шилжүүлж асуудал шийдэгдсэн.

Сүүлийн үеийн драйверуудын аль нь ч .114, .116 болон саяхан гарсан .118 хувилбаруудыг оруулаад ажиллахгүй гэдгийг санаарай. Тиймээс энэ асуудал нь хэрэглэгчийн @ewwhite-ийн тайлбарласнаар техник хангамжтай холбоогүй тохиолдолд энэ асуудлыг шийдвэрлэх цорын ганц програм хангамжийн шийдэл юм.

Хэрэв та DL180G6 сервер дээр P410 карттай нөөц драйвер ашиглаж байгаа тохиолдолд л ийм асуудал гардаг гэдгийг санаарай. Энэ нь бусад HP серверүүд дээр бас гарч ирдэг бичлэгүүдийг би харсан тул та эдгээр сервер дээрх драйверын .60 хувилбарыг туршиж үзээд таны асуудлыг шийдэж байгаа эсэхийг шалгаж болно.

Энэ асуудалтай тулгарах үед та дискэнд үе үе нэмэгдсэнийг харж магадгүй юм. Таны сервер дээр унших, бичих ачаалал багатай хоцролтыг дараахь зургаар тайлбарлавал илүү дээр юм:

Periodic Latency Spikes

Дээрх зураг дээр улаан цэгүүд сэлбэг хэрэгслийг хавсаргаж байх үед үечилсэн үсрэлтийг илэрхийлнэ. Ногоон цэгүүд нь сэлбэг хэрэгслийг зайлуулж байх хугацааг илэрхийлнэ.

Дээрх зургаас харж байгаачлан хоцролтын үсрэлт нь холбогдох унших, бичих ачаалалтай холбоогүй бөгөөд үе үе байв. Бидний хувьд эдгээр нь яг таван минутын зайтай болж байв. Сэлбэг хэрэгслийг авмагц баяжуулалт зогссон.

Драйверын .60 хувилбарын зэрэглэлийг бууруулахын тулд ВМ-г сайн хаасны дараа машинаа засвар үйлчилгээний горимд оруулаад дараах тушаалуудыг оруулна уу

cd /tmp
wget http://ftp.hp.com/pub/softlib2/software1/pubsw-linux/p964549618/v97400/scsi-hpsa-5.5.0.60-1OEM.550.0.0.1331820.x86_64.vib
esxcli software vib install -v /tmp/scsi-hpsa-5.5.0.60-1OEM.550.0.0.1331820.x86_64.vib

Үүний дараа серверээ дахин ачаална уу. . Энэ нь хэн нэгэнд тусална гэж найдаж байна. HP нь P410-д зориулсан HPSA драйверын тогтвортой хувилбарыг гаргахад би энэ хариуг шинэчлэх болно.

2
ответ дан 3 December 2019 в 06:29

Вероятно, это проблема объединительной платы или расширителя объединительной платы. Есть небольшая вероятность, что это может быть кабель. И возможно RAID-контроллер.

DL180 G6, который вы используете, вероятно, представляет собой 3,5-дюймовое устройство с 12 отсеками и подключается к Smart Array P410 с помощью одного 4-полосного кабеля SAS SFF-8087.

Обновление прошивки было первым делом, которое вы сделали должен был сделать. Была ли у вас такая же проблема после обновления прошивки контроллера? Вы можете также сделать прошивку дисков для хорошей меры.

Но внешний вид этого сервера полностью зависит от объединительной платы SAS и того факта, что что все диски затронуты одновременно, вы столкнулись с проблемой подключения, которая, вероятно, потребует обслуживания или замены.

1
ответ дан 3 December 2019 в 06:29

Теги

Похожие вопросы