mdadm raid1, сбой диска потерял ценность 14 дней данных?

В нашей среде у меня есть подобная установка как та, которую Вы предлагаете. Я соглашаюсь, что процедура восстановления баз данных для хранения репликации последовательной является немного громоздкой, и я также скорее воссоздаю репликацию, если существует серьезная проблема, но я все еще копирую базу данных отчета.

В течение времени это берет, чтобы генерировать и передать полный снимок (8 часов в нашем случае), я могу восстановить статическую копию базы данных отчета с другим именем через 30 минут и указать на приложение отчета на ту базу данных для предотвращения слишком большого количества времени простоя для моих пользователей отчета, тот способ, которым пользователи могут выполнить свои отчеты о данных со вчерашнего дня, пока дублируемая база данных не в порядке.

2
задан 9 May 2013 в 13:04
3 ответа

Думаю, это могло произойти, если: у вас есть 2 диска - / dev / sda и / dev / sdb в raid1. Например, запись mbr находилась на / dev / sda. 26 апреля система посчитала, что / dev / sdb неисправна (по ошибке или из-за сбоя какой-либо программы) и была удалена из рейда. Через две недели / dev / sda выходит из строя, и вы получаете несинхронизированный рейд. Как вы сказали выше, вам нужно настроить mdadm, и я предлагаю настроить smartd (из пакета smartmontools). Смартд пару раз "спасал мне жизнь" :)

PS raid1 не является резервной копией, у меня было несколько инцидентов, когда 2 диска выходили из строя одновременно без возможности восстановить с них какие-либо данные.

3
ответ дан 3 December 2019 в 10:50

Возможно, ваш / boot не на raid1? only / (или другие ваши разделы).

Некоторые старые версии grub (0,9X, я полагаю) не могли загрузиться с устройства mdadm.

Если вы можете загрузить liveCD или подобное, возможно, вы сможете смонтировать свой рейд и сохраните данные.

0
ответ дан 3 December 2019 в 10:50

У вас было зеркалирование RAID1, один из дисков отказал 14 дней назад. Ошибка была достаточно сильной, чтобы карта перестала писать на нее, но не настолько, чтобы она фактически не работала , когда вы пытались читать / писать. Но поскольку он был помечен как сбойный, ваша карта RAID больше не будет его касаться. Затем, 14 дней спустя, возможно, в ответ на другую проблему, вы вынули другой (более современный) диск и заменили его пустым.

Поскольку на ваш неисправный диск не производилась запись в течение двух недель, данные были двухнедельной давности. Это то, что вы синхронизировали со свежим диском, поэтому похоже, что ваш сервер не использовался две недели.

Предположительно, ваш ДРУГОЙ диск (тот, который не вышел из строя две недели назад)

A : по-прежнему хорош и может быть использован для восстановления ваших недавних данных или
B : также не удалось, хотя и совсем недавно и, возможно, с большей серьезностью

Сбой одного диска в RAID-1 не является катастрофическим, и поэтому кариес без признаков дистресса. Ваш компьютер просто продолжает работать на оставшемся исправном диске. Если вы не ведете активный мониторинг своего RAID-массива, вы не узнаете о сбое до тех пор, пока другой диск не выйдет из строя, что приведет к сбою сервера (не останется рабочих дисков).

Некоторые Карты RAID сбрасывают флаг сбоя / исправности на диске после перезагрузки при определенных условиях. Это глупо, такое бывает.

Это очень похоже на то, что случилось с вами.

хотя и совсем недавно и, возможно, с большей серьезностью

. Отказ одного диска в RAID-1 не является катастрофическим и, следовательно, не вызывает никаких внутренних признаков неисправности. Ваш компьютер просто продолжает работать на оставшемся исправном диске. Если вы не ведете активный мониторинг своего RAID-массива, вы не узнаете о сбое до тех пор, пока другой диск не выйдет из строя, что приведет к сбою сервера (не останется рабочих дисков).

Некоторые Карты RAID сбрасывают флаг сбоя / исправности на диске после перезагрузки при определенных условиях. Это глупо, такое бывает.

Это очень похоже на то, что случилось с вами.

хотя и совсем недавно и, возможно, с большей серьезностью

. Отказ одного диска в RAID-1 не является катастрофическим и, следовательно, не вызывает никаких признаков неисправности. Ваш компьютер просто продолжает работать на оставшемся исправном диске. Если вы не ведете активный мониторинг своего RAID-массива, вы не узнаете о сбое до тех пор, пока другой диск не выйдет из строя, что приведет к сбою сервера (не останется рабочих дисков).

Некоторые Карты RAID сбрасывают флаг сбоя / исправности на диске после перезагрузки при определенных условиях. Это глупо, такое бывает.

Это очень похоже на то, что случилось с вами.

вы не узнаете об ошибке, пока другой диск также не выйдет из строя, что приведет к сбою сервера (не останется рабочих дисков).

Некоторые карты RAID будут сброшены флаг сбоя / исправности на диске после перезагрузки при определенных условиях. Это глупо, такое бывает.

Это очень похоже на то, что случилось с вами.

вы не узнаете об ошибке, пока другой диск также не выйдет из строя, что приведет к сбою сервера (не останется рабочих дисков).

Некоторые карты RAID будут сброшены флаг сбоя / исправности на диске после перезагрузки при определенных условиях. Это глупо, такое бывает.

Это очень похоже на то, что случилось с вами.

0
ответ дан 3 December 2019 в 10:50

Теги

Похожие вопросы