Беспорядок FreeNAS: не уверенный, что произошло. raidz1 “УХУДШИЛСЯ”, диск “ДАЛ СБОЙ”

find не должно быть необходимым. Если Вы сначала переходите к правильному dir,

rm -f `ls -rt | head -n -100`

указывать путь

rm -f `ls -rt /path/to/my/dir | head -n -100`

и для cron (на Ubuntu!)

/bin/rm -f `/bin/ls -rt /path/to/my/dir | /usr/bin/head -n -100`

Путь команды может быть определен с помощью which, например.

which ls

Наконец, если имена файлов содержат пробелы, они должны быть заключены в кавычки ls -Q затем отправленный в xargs

/bin/ls -Qrt /path/to/my/dir | /usr/bin/head -n -100 | /usr/bin/xargs /bin/rm -f

(протестированный на Ubuntu, для Ваших тестов, замены rm -f с echo видеть, что должно быть удалено),

3
задан 18 August 2012 в 09:31
2 ответа

Я недостаточно использовал zfs, чтобы сказать о целостности данных. zpool list дал raidz1-0 ОНЛАЙН 0 0 0 c8t1d0p0 ОНЛАЙН 0 0 0 c8t2d0p0 ОНЛАЙН 0 0 0 c8t3d0p0 ONLINE 0 0 0

smartctl -d sat, 12 -a / dev / rdsk / c8t3d0p0 перечислил определенные атрибуты. -d sat -d ata -d scsi может заставить его работать в зависимости от того, какой у вас тип дисков. посмотрите на частоту необработанных ошибок чтения, количество перемещенных секторов, частоту ошибок поиска, аппаратный ecc и ожидающее перемещение сектора. -t short или -t long вместо -a запустит тест. длительный тест может занять один или несколько часов в зависимости от диска. Seak чтения и аппаратные ошибки не обязательно являются ошибкой. однако, если они продолжают прыгать между списками, они могут быть хорошим индикатором. Также некоторые производители приводов могут потребовать от вас использовать их инструменты для установки привода.

Если бы я был на вашем месте и не был уверен в приводе, я бы получил замену и после того, как проверил его работоспособность, работая с производителем, либо установил его. Я бы добавил дополнительный диск в качестве горячего резерва, чтобы, если это произойдет снова, у вас был готов и ждал другой диск. z2 тоже неплохая идея, но запаску я бы все же держал в запасе. при таком размере дисков восстановление их занимает много времени, и возможно возникновение второй ошибки.

Что касается поврежденных файлов, если у вас все еще есть оригинал одного из этих «поврежденных» файлов, выполните вычисление md5, а затем посмотрите, совпадает ли md5 поврежденного файла. это скажет вам, были ли повреждены биты. в противном случае файлы могут быть повреждены незаметно. решать, будет ли нанесен ущерб, чтобы стать проблемой.

при таком размере дисков восстановление их занимает много времени, и возможно возникновение второй ошибки.

Что касается поврежденных файлов, если у вас все еще есть оригинал одного из этих «поврежденных» файлов, выполните вычисление md5, а затем посмотрите, совпадает ли md5 поврежденного файла. это скажет вам, были ли повреждены биты. в противном случае файлы могут быть повреждены незаметно. решать, будет ли нанесен ущерб, чтобы стать проблемой.

при таком размере дисков восстановление их занимает много времени, и возможно возникновение второй ошибки.

Что касается поврежденных файлов, если у вас все еще есть оригинал одного из этих «поврежденных» файлов, выполните вычисление md5, а затем посмотрите, совпадает ли md5 поврежденного файла. это скажет вам, были ли повреждены биты. в противном случае файлы могут быть повреждены незаметно. решать, будет ли нанесен ущерб, чтобы стать проблемой.

0
ответ дан 3 December 2019 в 07:07

То же самое произошло со мной, когда я случайно удалил неправильный диск при замене неисправного. Когда я проверил массив, он сказал, что весь vdev вышел из строя с двумя неисправными дисками. После того, как я повторно подключил исправный диск и заменил фактический неисправный диск, пул полностью восстановился без заметного воздействия на файлы, которые изначально были указаны как поврежденные / утерянные / поврежденные.

Насколько я понимаю, когда диск на мгновение раскачивался, он был помечен как неисправный, затем, поскольку один диск действительно вышел из строя, весь массив также был отмечен как неисправный. Затем, как только он был повторно подключен, он сканируется и отображается как часть существующего пула, а затем восстанавливается вместе с остальным. Поскольку 3/4 диска достаточно для хранения жизнеспособных данных, если они не слишком сильно изменились, все может восстановиться после замены неисправного диска.

Ошибки контрольной суммы не являются серьезными ошибками - это исправимые ошибки. Когда возникает ошибка контрольной суммы, ZFS немедленно исправляет ошибку в RAIDZ, это одна из основных причин того, что ZFS такая отличная файловая система. Тем не менее, наличие ошибок контрольной суммы является признаком проблемы. Внимательно следите за дисками, постарайтесь иметь под рукой запасной на случай, если один выйдет из строя. Если вы снова начнете видеть ошибки контрольной суммы, замените диск / кабель, на котором они возникают. Это может быть объединительная плата, может быть разъем, может быть что угодно, проверьте все. Если вас беспокоит весь отсек, замените его.

Отсутствие известных ошибок относится только к текущему состоянию пула, а не к его полной истории. Поскольку диск был заменен и массив восстановлен, статистика также выглядит очищенной; ошибки контрольной суммы обнуляются. Ранее было две ошибки, и они останутся до тех пор, пока не будут устранены.

Отчетам ZFS можно доверять, поэтому любой из файлов, не указанных в списке поврежденных файлов, подойдет. Как упоминалось в другом ответе, если у вас есть хорошие копии любого из файлов, выполнение выборочной проверки хэшей не повредит. Создание полных резервных копий тоже было бы неплохой идеей. ;)

Создание полных резервных копий тоже было бы неплохой идеей. ;)

Создание полных резервных копий тоже было бы неплохой идеей. ;)

2
ответ дан 3 December 2019 в 07:07

Теги

Похожие вопросы