Высокая доступность сервера для малого бизнеса

По-видимому, Вы говорите о пропускной способности, когда Вы говорите что 700k в секунду, не IOPS (ввод-вывод в секунду)?

Так или иначе при выполнении 1K-размера случайные записи через весь диск, Вы, вероятно, буферизуетесь операционной системой. Случайные записи как этот будут кэшироваться и выписанные к диску более разумным способом.

Также важно отметить - когда Вы говорите, что диск, Вы говорящий о:

  • Блочное устройство? (т.е. RAID, диск SAN, и т.д.)
  • Диск SATA?
  • Диск SAS?
  • Диск Волоконно-оптического канала?

Каждая из этих опций получит Вас различный ответ.

Если Вы хотите действительно протестировать свой диск разумным способом, я рекомендую проверить bonnie ++.

11
задан 29 August 2009 в 07:36
5 ответов

Я думаю, что необходимо запустить путем собирания чисел для описания стоимости, связанной с выполнением установленного "требования", чтобы видеть, находится ли это даже в пределах бюджета. Если Вы не будете довольны всеми "нормальными" методами, которые использовались бы для выполнения требования (отказоустойчивая кластеризация, гипервизоры с "горячей миграцией" возможность, и т.д.), то Вы, вероятно, преуспеете для нахождения консультанта, который может выручить.

Там будет некоторой стоимостью, связанной с технико-экономическим обоснованием, но это собирается стоить намного меньше, чтобы обнаружить, что хорошее решение не будет соответствовать в установленном требовании (подразумевать, что ожидания должны быть установлены более реалистично управлением - или они должны заплатить больше денег), чем это будет стоить, чтобы сделать что-то half-assed, который заканчивает тем, что не выполнил требование вообще и унес тонну денег в процессе.

Это кажется, что Ваш босс просто вытащил то число из воздуха. Возможно, он сделал некоторый анализ и знает, какова стоимость на час, связанная со временем простоя различных систем, но я сомневаюсь относительно этого. Это походит на некоторое мечтательное число, которое не связывается с действительностью. Я был бы удивлен, нужна ли всем Вашим системам такая доступность. Это может быть, в ходе изучения бизнеса, что Вы обнаруживаете, что только подмножество функциональности должно иметь такой градус времени работы и отказоустойчивости (и, таким образом, такое решение в конечном счете стоило бы меньше). Я уверен, что телефоны и приложение направления деятельности возросли там, но у Вас может быть некоторый допуск в течение времени простоя в некоторых из других систем.

Мой пищеварительный тракт говорит, что Вы, вероятно, собираетесь найти, что победа в использовании технологий виртуализации создает систему обработки отказа на основе миграции виртуальных машин между избыточными аппаратными средствами. Будет ли это соответствовать Вашему бюджету или не будет зависеть от Вашего бизнеса, так как Вам определенно будет нужен некоторый тип SAN для создания той работы эффективно.

Не обесценивайте "традиционную" отказоустойчивую кластеризацию, все же. Существуют определенно "победы" там также, если Ваши приложения хорошо подходят для такой конфигурации.

Интересно, думал ли Ваш босс о сценариях катастрофического отказа (создающий записи, лавинную рассылку, торнадо, воровство, и т.д.). Если бы это уже не запланировало - это было бы прекрасным случаем работать в некотором непредвиденном обстоятельстве планирования и аварийного восстановления непрерывности основной деятельности.

Получите некоторую справку от кого-то, кто может войти и изучить Ваш бизнес и предоставить рекомендации.Вы не пожалеете об этом.

5
ответ дан 2 December 2019 в 21:53
  • 1
    Спасибо за большой ответ. I' m уверенный 30 минимальных периодов времени были составлены на месте также. –  Matthew 25 August 2009 в 09:31

"Эта дорога приводит к большому количеству боли и вреда..."

Так, каков План Непрерывности Вашего Бизнеса? Вы План аварийного восстановления?

Вы обсудили это? Записанный это? ПРОТЕСТИРОВАННЫЙ ЭТО?

Вы должны иметь надлежащий разговор с "более высоким up's" и действительно добраться до сути относительно требований для высокой доступности, потому что это отличается для различных сервисов.

Таким образом, какова действительно была "болевая точка", которую они чувствовали тем утром?

Это было?

  • Телефоны прекратили работать? Довольно главный (и видимый) проблема. И да - этому будет нужно "решение", но надо надеяться это находится под соглашением о поддержке?
  • Веб-сайт перестал работать? Хорошо - Довольно видимый, но не неожиданный, и если у Вас нет ОГРОМНОГО веб-присутствия, затем не настолько важного. Хорошо иметь этот сервер вниз в течение нескольких часов.
  • Сервер базы данных вниз? Страшный... Надеюсь, что Вы получили хорошие резервные копии! Не теряйте данные иначе он, бизнес перестанет работать. Но, пока данные безопасны затем, это - сервер, который важен и должен иметь план восстановления.
  • Файл и печать (и внутренние приложения и т.д.). Это - ЛАВАШ для большинства людей, поскольку они будут сидеть без дела и ничего не делать в течение утра, поскольку Вы фиксируете его.

Я предполагаю, что Вы купили высококачественные аппаратные средства для своих основных систем? Хороший, потому что к дешевому на аппаратных средствах ложная экономика как эти серверы, с которыми идут "двойной" все в поле.

Я также предположу, что Вы знаете, КАК восстановить сервер, подкачать вентиляторы, источники питания, установить сервер в стойку, настроить двойные сети пути в резервные коммутаторы? Вы сделали это достаточно раз для понимания, какие работы и что не делает, что нормально и что ошибочно? Если не затем получают справку и обучение (или по крайней мере практика и опыт).

Возможно, большой проблемой был СТРАХ. У них не было подсказки, что такая проблема могла произойти (и насколько важный серверы были к их бизнесу), и Вы действительно не знали то, что Вы делали (?) проблему уверенности?

Необходимо получить все вышеупомянутое право ПЕРЕД потерей работоспособности по очень дорогому маршруту HA. Может бизнес позволять себе это дорогое оборудование (и большая часть из него, по определению, будет только когда-либо использоваться в отказе и часто никогда не использоваться!)

2
ответ дан 2 December 2019 в 21:53
  • 1
    What' s хороший способ поместить его; инфраструктура ИТ компаний выросла органически. Нет никакого Плана аварийного восстановления (за исключением, большое указание и вопли), и наши резервные копии являются очень простыми. Проблемой утром была проблема питания с сервером, который обрабатывает маршрутизацию для большей части нашей сети. В действительности наша CRM, электронная почта и телефоны были всеми вниз для 30-40minutes. Будучи центром обработки вызовов, не много работы было сделано в течение того времени. –  Matthew 25 August 2009 в 12:48
  • 2
    План аварийного восстановления сохранен на сервере с процедурами резервного копирования... ой... that' s тот, который отказал... –  Bart Silverstrim 25 August 2009 в 15:07
  • 3
    @Matthew - Если Ваш центр обработки вызовов и Ваша сеть снижаются затем на это, очевиден Ваши целые остановки направления деятельности. Поэтому необходимо сотрудничать с высшим руководством в ряду планов и проектов смягчить это в будущем. Don' t позволяют управлению, чтобы всучить Вам и просто ожидать, что его единственное ВАШЕ задание зафиксирует его - ЦЕЛЫЙ ОСТАНОВЛЕННЫЙ БИЗНЕС! Будьте благодарны, что у Вас был умеренный вызов пробуждения, не потерял важных данных или серверов (или клиенты, надо надеяться). Первой вещью... является какой-либо из Ваших серверов на UPS? –  Guy 25 August 2009 в 15:16

Хит Evan на некоторых положительных сторонах, но вот, возможно, некоторый определенный экономически эффективный способ получить время sub 1 восстановления часа перед лицом отказов.

Малый бизнес, вероятно, имеет в виду маленькие аппаратные средства, таким образом, это не может быть много стоимости, чтобы сделать некоторые простые вещи, которые на самом деле добавляют существенное количество упругости перед лицом проблем. Основная идея, просто имеют дополнительное оборудование, готовое пойти.

Во-первых, станьте довольными мыслью о виртуальном IP. Это - IP-адрес, с которым пользователи будут говорить, но могут находиться на любом сервере, которому Вы даете его. Это - IP-адрес, Вы - пользователи, и приложения захотят говорить. И это будет самым полезным для ultimatly любое решение, для которого Вы идете. Наличие VIP означает, что Вам не придется часто реконфигурировать никого приложения при обработке отказа. Кроме того, имейте в виду, что наличие избыточных аппаратных средств также оказывает влияние администрирования увеличений наверху, делая два обновления конфигурации вместо 1.

Если мы запускаем с, Вы направляете / веб-прокси-сервер, это является, вероятно, самым легким, так как их не будет никакое реальное состояние, которое должно быть сохранено на самом поле. Поэтому просто получите дубликат того же поля и настройте его то же. Я сохранил бы и включенным на сегменте LAN и предположении, что Вы - Интернет, находится в другом интерфейсе, кабели подкачки, если их отказ. С точки зрения маршрутизации Вы устанавливаете все, что Вы - клиенты локальной сети для предназначения для.1 адресов (VIP) для их сервера маршрутизации по умолчанию, и прокси-сервер дают сервер эти.2 адресов и сервер B эти.3 адресов. Таким образом, ими можно оба управлять для обновлений конфигурации (относится к обоим). И все, что необходимо сделать к обработке отказа, удаляют.1 присвоений IP от.2 и перемещают его в.3 и перемещают интернет-соединение с другим интерфейсом. Это не очень сложно, легко сделать и понять, и стоит дополнительного оборудования второго поля. Если можно получить дублирование на интернет-стороне, Вы могли бы добавить некоторую сложность и получить автоматическую обработку отказа с помощью чего-то как VRRP.

Без специфических особенностей трудно сказать, но Вы - веб-сервер, может быть столь же простым. Добавьте второй сервер с Идентичной конфигурацией, создайте VIP между этими двумя и переместите VIP в резервное копирование перед лицом отказа. Я обычно не возражаю, если состояние сеанса потеряно на обработке отказа (это - критическая проблема для порождения обработки отказа). Таким образом, если пользователи должны войти в систему снова, никакое грандиозное предприятие. Снова, vrrp может, вероятно, использоваться для автоматической обработки отказа.

Перемещение на Вы - DB, это значительно более сложно. Большая часть DB имеет своего рода основное устройство / вторичная модель, где Вы копируете исходный DB к вторичному устройству, и затем копируете все журналы транзакций или изменения DB во вторичном устройстве. Снова, можно объединить это с VIP для приложений / пользователи, на самом деле получающие доступ к DB. Однако обработка отказа более соединена. В зависимости от отказа основного устройства Вы, возможно, должны на самом деле разбудить диски и работающий для копирования и оставшиеся журналы транзакций. Затем принесите активное вторичное устройство. Если можно терпеть некоторые потерянные данные, то можно принести вторичное устройство, активное сразу же. После обработки отказа сервер B теперь, Вы являетесь основными, и Вы - работа, должен был бы восстановить сервер A и превратить его в новое резервное копирование, таким образом, это готово быть отказавшим к тому, когда сервер b в конечном счете имеет проблемы.

Файловые серверы являются всегда самой твердой частью, с тех пор в отличие от DB, намного более трудно получить созданный в функции файловой системы. Однако некоторый уровень упругости может быть достигнут при наличии второго сервера и простой записи сценарий, который сканирует файловую систему для изменений, и копируют любые новые файлы в, Вы вторичны. Можно в основном выполнить rsync на кроне, которому я верю, чтобы сделать это. Снова, Вы используете VIP, который Вы даете пользователям, что Вы отодвигаетесь, если Вы делаете обработку отказа. В Вы - сценарий, я, wrould настоятельно рекомендуют, чтобы Вы проверили, чтобы удостовериться, что система является владельцем VIP прежде, чем передать файлы. Вы действительно действительно действительно не хотите, чтобы rsync выполнился в неправильном направлении и перезаписал любые изменения, Вы - пользователи, делают. Это могло потерять некоторые файлы, если их отказ и также не защитит снова пользователей, вытирающих сами файлы.

Я понятия не имею, о чем Вы могли сделать, Вы - телефонная система... она действительно зависит от поставщика и как это - установка. У поставщика может быть некоторое готовое решение для упругости.

Некоторые заключительные слова предупреждения. Удостоверьтесь, что Вы полностью тестируете любую установку, с которой Вы собираетесь пойти. Удостоверьтесь, что Вы знаете, как заменить его, не теряя ту критическую информацию. Тестовый тест тестирует, чтобы удостовериться, что он будет работать при необходимости в нем к. Удостоверьтесь, что у Вас есть процессы на месте, что изменения конфигурации, обновления программного обеспечения, и т.д. применяются правильно и к основному и к резервные копии. Хорошие новости, можно, вероятно, сделать, управлял обработкой отказа, когда Вы хотите снизить сервер для обновления и т.д. Это не активно-активная установка, таким образом, Вы понятия не имеете, будет ли вторичное устройство работать при необходимости в нем.

Я работаю в телекоммуникациях, и наше оборудование очень очень избыточно, включая в большинстве случаев географическое дублирование. Наша точка номер 1 отказа является дублированием, не тестируется после изменений и пользователей, вносящих изменения, которые не знают, как модель дублирования работает. Однако у нас есть добавленная проблема, что все наше оборудование должно поддерживать автоматическую обработку отказа через не больше, чем несколько секунд. Можно терпеть ручное вмешательство в, Вы - обработки отказа, если только необходимо быть в порядке в течение 30 - 60 минут. Вы просто должны быть подготовлены.Удачи.

1
ответ дан 2 December 2019 в 21:53
  • 1
    почему использование " виртуальный IP" когда можно использовать DNS? that' s, что it' s для. если данный сервис перемещается в другой сервер с другим IP затем, Вы обновляете запись в DNS для соответствия. конечные пользователи shouldn' t должен знать или помнить IP-адреса. –  cas 25 August 2009 в 11:33
  • 2
    it' s также хорошая идея использовать в своих интересах то, что IP-адрес может иметь несколько имен, указывающих на него так, что можно настроить A или записи CNAME для конкретных сервисов - например, " ntp" " file" " www" " ftp" " mx" и так далее. тем путем можно переместить сервисы между машинами (или добавить больше машин позже), и просто обновите запись DNS для того сервиса. –  cas 25 August 2009 в 11:37
  • 3
    DNS является опцией, которая может использоваться. В поставщике услуг располагают нас с интервалами don' t действительно используют его для чего-либо that' s очень важный, it' s обычно не стоящий добавленной сложности. Я наиболее определенно все еще использовал бы VIP для управления обработкой отказа, но у Вас могла быть точка адреса DNS к любому VIP, который Вы использовали. Дружественные имена хороши, но с недавними уязвимостями системы обеспечения безопасности... и общим итогом 5 серверов, почему Вам даже нужен он? Если Вы действительно идете с DNS, удостоверьтесь, что Вы устанавливаете истечение кэша. –  Kevin Nisbet 25 August 2009 в 17:12

Все точки elses являются великими поэтому просто несколько комментариев.

30 минут невозможно гарантировать, специально для всего. Можно сказать, что это - цель, но нет никакого способа, которым это может быть гарантия, потому что всегда существует The X Factor. У Вас могло быть 2 строки ISP, и грузовик врезался в здание и берет их обоих, потому что Вы не думали, что маршрутизация их от противоположных концов здания имела значение, один пример.

Как запуск для стоения, дважды всего. У Вас есть 5 серверов, таким образом, необходимо удвоиться, это. Этому не нужно ко всем быть на аппаратных средствах, можно виртуализировать, но Вы видите то, что я имею в виду. Вдобавок ко всему, все должно быть HA, знающим, который также добавит к стоимости, можно узнать, что Вы оказываетесь перед необходимостью заменять свой маршрутизатор новым, и о Вам нужны 2 из них. Не забывайте удваивать кабель питания и получать генератор, потому что Вы не можете гарантировать, что энергетическая компания вернется в течение 30 минут.

Эти примеры думают более или менее установка горячего резервирования, которая является тем, что я подозреваю, что Ваш босс думает.

То, что я нахожу лучше для малого бизнеса, должно разработать план восстановить и классифицировать все.

Фигура, которая сервисы

очень важный (бизнес-остановки)

важный (бизнес замедляется),

стандартная программа (бизнес может суметь обойтись без него некоторое время).

Например, Ваши телефоны центра обработки вызовов являются critial, настолько возможно, что каждый стоит купить второй сервер и второй ISP, и Ваше отключение электричества средней мощности составляет приблизительно 15 минут, таким образом, мы доберемся, UPS для этого продлится, 60 минут (не забывайте рабочие станции ни один). Теперь позволяет, говорят, что ERP только важен, означание Вашего может функционировать без него некоторое время. Возможно, Ваши люди центра обработки вызовов используют его, но если это снижается, они могут вернуться назад к перу и бумаге или блокноту и затем обновить ERP после. Процедура, чтобы сделать это, если это снижается на желание, может быть более дешево затем попытка сделать это критическим сервисом. И стандартные могли бы быть чем-то как принтеры, хорошо это - боль, но мы можем сделать должным в течение нескольких дней, если они все понижаются.

Это также дает Вам распоряжение зафиксировать материал, если s ** t действительно поражает вентилятор однажды :)

1
ответ дан 2 December 2019 в 21:53

Действительно ли это возможно?Конечно. Действительно ли это доступно? Вероятно, не для "малого бизнеса", особенно если у Вас есть босс, дающий Вам произвольные числа, которыми можно работать, и он требует высокой доступности от отдела ИТ, который состоит из замещенного программиста (замеченный это много раз в других местах, и это никогда не симпатично для Ваших уровней напряжения, если Ваша ситуация была похожа на их).

Обработка отказа возможна, но обычно требует, чтобы избыточные аппаратные средства, SAN обменялись данными среди серверов, и т.д...., другими словами, удача, получив финансируемый, если они не наймут преданного администратора для заботы о нем.

Ваше оборудование системы вызова, которое Вы упомянули, является специализированными аппаратными средствами, и Вы сослались на то, чтобы быть callcenter. Необходимо говорить с поставщиком об опциях сократить это. Попадание впросак с этим могло освободить поддержку во-первых.

Другие системы, которые Вы могли, скорее всего, получить некоторое дублирование путем инвестирования в решения типа VMware (или Hyper-V или XenServer, но я посмотрю на VMware и XenServer сначала). Затем можно посмотреть на получение SAN, пара раскормленных серверов с быстрыми сетевыми коммутаторами, и использовать LiveMotion для миграции виртуализированных серверов между аппаратными серверами, если существует отказ, а также сбалансируйте часть загрузки между серверами, поскольку потребности подходят.

Вы упомянули выполнение Linux в тех системах. С деньгами для получения нескольких серверов Вы могли вместо этого посмотреть на установку DRBD с программой heartbeat и STONITH, чтобы копировать данные между серверами и вступить во владение, когда каждый становится недоступным; Вы посмотрели бы на установку системы, где Вы буквально копировали каждый сервер, а также удвоили Вашу потребляемую мощность и рассеяние тепла в серверной (если у Вас есть серверная). Это может быть сделано для стоимости аппаратных средств и Вашей исправности. Плюс необходимо было бы протестировать его, у Вас будет время простоя при конфигурировании его, и у Вас все еще есть возможность, что это не будет время от времени работать, поскольку существует все еще возможность проблем, неожиданно возникающих, которые должны заботиться о (мозг разделения, например).

В последний раз план относительно получения пары систем, чтобы действовать как пустые системы большого списка и иметь действительно хороший план резервного копирования, чтобы позволить, чтобы Вы восстановили данные к одной из "пустых" систем, если сервер перестает работать. Наличие аппаратных средств на месте даст Вам некоторые опции, if/when, сервер перестает работать; но у Вас все еще будет некоторое время простоя при восстановлении данных, и Вам нужны инструкции относительно того, как правильно установить Ваши приложения к новому серверу. В зависимости от того, как быстро Вы работаете и насколько большой данные - Вы, может иметь время простоя, длясь с нескольких часов до дня или два. У Вас действительно есть работа, известная - хорошее резервное копирование Вашими серверами, с планом восстановления на месте, да?

Необходимо ли делать попытку его? Моя первая реакция состоит в том, что, если Вы царапаете голову в каком-либо из предложений или чувствуете яму в животе при попытке продумать этот материал, затем Вы не были должны. Вам была бы нужна консалтинговая компания, чтобы войти и посмотреть на проблему и разработать затраты и реализовать ее, или необходимо нанять преданного системного администратора, чтобы сделать это для компании.

Факт, который они говорят Вам делать, это и Вы говорит, что Вы - "просто программист, который был "продвинут", и у Вас есть PHB сообщение, Вы для предоставления дублирования с максимальным временем отказа 30 минут - то, что Вы - отчасти ручей.

1
ответ дан 2 December 2019 в 21:53

Теги

Похожие вопросы