Механизм сетки Sun: автоматически завершающиеся неактивные интерактивные задания

IMO, необходимо использовать чередование отдельно только, когда Вы не заботитесь вообще о Ваших данных.

при чередовании данных через несколько дисков Вы увеличиваете риск потери всего на всех дисках, потому что отказ любого диска означает полную потерю всего объема... и чем больше дисков Вы чередуете, тем больше риск.

соответственно, IMO, ответ на, "когда я должен чередовать?" или "никогда" или, "когда Вы чередуете зеркальные тома, как в RAID-10".

если сами и данные и производительность IO важны для Вас, то получите хорошие аппаратные средства плата RAID SAS (например, adaptec 3805 или 5805 или подобный) с большим кэшем записи с аварийным батарейным питанием и сделайте объем RAID-6. для получения 4 ТБ с RAID-6 Вам будут нужны диски 6 x 1 ТБ. плюс еще один как горячая или холодная запчасть.

Контроллеры SAS поддерживают и диски SAS и диски SATA. модели упомянули выше поддержки до 8 дисков непосредственно, но могут поддерживать больше с помощью расширителей SAS (за счет производительности - больше дисков означает меньше пропускной способности IO на диск, но Вы могли, вероятно, развернуть приблизительно до 16 дисков без того, чтобы замечать любой реальный хит производительности. Канал 3 Гбит/с за SATA дает Вам, возможно, 250MB/s IO, и текущие хорошие нетвердотельные диски могут использовать о 100-120MB/s или так каждый).

альтернативно, используйте программное обеспечение RAID 10 (чередуемый массив зеркальных томов). массив на 4 ТБ потребовал бы дисков на 8x1 ТБ. например, 4 массива x RAID-1, чередуемые вместе с RAID 0 (или LVM) для единственного объема на 4 ТБ.

можно использовать LVM сверх этих RAID-массивов для управления пространством. Если Вы идете путем RAID-10, то чередование может быть сделано с LVM, а не RAID 0.

еще одна вещь рассмотреть состоит в том, чтобы разделить приложения IO-потребления так, чтобы они не конкурировали за IO., например, сохранили Вашу ОС на одном небольшом диске, сказали 80 ГБ (или RAID-1 зеркально отраженная пара), Ваш исходный код для регрессии компилятора на другом диске или паре RAID-1 и Ваших видеоданных или на коротковолновом RAID-10 или на hw RAID-6.

и установка столько памяти, сколько Вы возможно можете в машину как Linux, будет использовать все это для дисковой буферизации. наиболее распространенные материнские платы поддерживают до 4 DDR-2 или 6 карт памяти DDR-3, таким образом, с палками на 2 ГБ, являющимися намного более дешевым, чем палки на 4 ГБ, можно установить максимум 8 ГБ или 12 ГБ по разумной цене. если Вам нужны больше, чем которые, это более экономически эффективно для замены материнской платы сервером МБ (от Tyan или SuperMicro и т.д.) с большим количеством сокетов RAM, чем это должно использовать палки на 4 ГБ.

о, и отсеки замены в горячем режиме являются хорошей идеей - когда (не, если, когда) диск приводит Вас к сбою, должен смочь заменить его как можно быстрее. RAID-6 может справиться с любыми двумя дисками, переставшими работать одновременно, поэтому когда 1 сбой диска он только возьмет еще один диск, перестающий работать для взятия всего с ним. RAID-10 может справиться с большим количеством сбоя дисков (до половины дисков может перестать работать, целая 1 из каждой зеркальной пары выживает).

и, наконец, резервное копирование. RAID, как упоминался много раз прежде многими людьми, НЕ является заменой для резервного копирования. Единственный носитель ленты, в настоящее время способный к резервному копированию количества данных, которые Вы имеете в разумный срок, не проводя дни, подкачивая картриджи, является LTO-4. Диски для этого являются дорогими, и ленточные картриджи кажутся дорогими (но являются на самом деле более дешевыми, чем жесткие диски, когда Вы вычисляете стоимость на гигабайт). если Ваш бюджет не простирается к этому, то Вы могли использовать несколько дополнительных дисков (соединенный через электронный-sata, firewire, запасной отсек замены в горячем режиме... или даже USB) для резервного копирования к - вставляют диск, выполняют резервное копирование, удаляют диск, хранилище на полке или прилегающем объекте... текущие емкости дисков составляют до 2 ТБ и будут становиться больше и более дешевыми со временем. BTW, по текущим ценам (приблизительно $1 500 - 2 000 для пустого диска LTO по сравнению с приблизительно 100$ для жесткого диска на 1 ТБ - приблизительно текущие цены австралийского доллара), стоимость диска LTO купила бы Вас 15 - 20 жестких дисков для резервного копирования..., и Вы могли купить их, поскольку Вам нужны они, а не внезапно с ценами, отбрасывающими noticably каждый раз.

1
задан 13 April 2010 в 04:04
2 ответа

Вы могли установить SGE, чтобы иметь разумное значение по умолчанию walltimes (h_rt) для завершения сессий после предопределенного предела.

Вы попытались получить оболочку пользователя к тайм-ауту на неактивном? Больше информации и примеров по http://www.cyberciti.biz/faq/linux-unix-login-bash-shell-force-time-outs/.

1
ответ дан 3 December 2019 в 22:35

nayrmil имеет некоторые хорошие предложения. Другая опция состояла бы в том, чтобы ограничить, какие машины могут выполнить интерактивные задания. Мы в основном определяем некоторые узлы как "интерактивные" и помещаем очередь на них, которая превышает намеченную сумму ресурсов узла, столько пользователей может войти в систему сразу. Пользователи могут в основном расположиться лагерем там, пока они хотят, но если они хотят получить доступ к некоторым реальным ресурсам, они должны отправить надлежащее задание.

1
ответ дан 3 December 2019 в 22:35

Теги

Похожие вопросы