О доступности и серверах холодного резерва…

О терминах доступности:

 

«24x7» – аббревиатура обозначающая «двадцать четыре часа в сутки, семь дней в

24x7

24x7

неделю», обычно обозначающая, что бизнес функции компании или информационные системы (сервисы) доступны потребителям круглосуточно и никогда не останавливаются.

 

Расширенный формат термина «24х7х365», добавляет к фразе «триста шестьдесят пять дней в году», подчеркивая, что сервисы компании не прерываются в течение всего года.

 

«24/5» означает то же самое, но подразумевает выходные дни (субботу и воскресенье), когда сервисы могут быть недоступны.

 

«Девятки» (999, 9999, 99999) относятся к понятию «Доступность».

Доступность (Availability) в данном смысле слова  подразумевает под собой наличие возможности для пользователей компьютерной системы (людей или приложений) получить доступ к компьютерной системе в целях сбора, обработки, хранения или передачи информации.

Доступность измеряется в процентах из соотношения времени, когда система была доступна пользователям в течение заданного интервала времени, ко всему времени измерений. Иногда доступность измеряется с использованием «девяток», что округленно соответствует количеству девяток после запятой. Т.е. «доступность пять девяток» означает доступность 0.99999 или 99.999%. Применительно к году работы систем это означает допустимый простой всего в 5 минут в год. Это практически соответствует 24х7х365.

 

О сервере холодного резерва (пустующий сервер без кластерного программного обеспечения, выступающий в качестве резервного в случае выхода из строя основного сервера):

 

Использование холодного резерва вполне приемлемо в случаях, когда допустима остановка банковских систем на несколько часов.

Это самый дешевый вариант, но в наше время редко кто позволяет себе такой длительный простой.

 

При использовании сервера холодного резерва, в случае выхода из строя основного сервера, потребуется некоторый период времени для переключения производственной нагрузки на сервер холодного резерва.

Даже если не потребуется восстановление с ленточных носителей и есть возможность передать логические диски основного сервера с системы хранения данных серверу холодного резерва, все равно такое восстановление займет достаточно продолжительное время.

Standard versus rapid data recovery

Standard versus rapid data recovery

 

 

У одного из наших заказчиков был случай, когда использование резервного сервера в качестве тестового (а это, как правило, все и делают с простаивающим сервером) привело к тому, что администраторы, к сожалению, не смогли оперативно переключиться на резервный сервер по причине изменения конфигурации сервера и нехватки дискового пространства. В довершение ко всему, в виду некорректных попыток восстановления работы сервера они испортили файловую систему и были вынуждены долго ждать ее восстановления. В результате был простой в несколько часов. В итоге руководство банка поставило задачу перед департаментом информационных технологий в кратчайшие сроки внедрить катастрофоустойчивую кластерную систему, что и было успешно реализовано нашей компанией на серверах IBM POWER 570 (процессоры POWER6) с использованием синхронной аппаратной репликации между площадками (EMC CLARiiON CX3-40), кластерным программным обеспечением SFHA/DR компании Symantec (VERITAS) и технологией мгновенного восстановления данных из моментальных копий (Snapshot Rollback).

 

Veritas Cluster Server (Symantec)

Veritas Cluster Server (Symantec)

 

Общая стоимость владения

Последнее время по работе пишу документ по архитектурам кластерных решений для одного из наших заказчиков. Задался вопросом об экономическом обосновании. Посмотрел, что есть по этому поводу у VERITAS. Все кажется немного натянутым. Вот, типа купили асинхронную репликацию данных по IP (VERITAS VVR) и вам сразу не надо покупать SAN и вот вы сэкономили столько-то тысяч долларов… Или я что-то еще не понимаю в TCO или это немного притянуто за уши.

Но зато эти документы меня натолкнули на интересный способ, как узнать сколько теряют банки во

Lost money

Lost money

время внепланового простоя. Зашел на Казновский сайт, на страницу финансовых обзоров, где размещают итоги работы крупнейших банков Урала. И ко мне пришла мысль: А почему бы нам не взять доход банка за полугодие и просто разделить на количество минут в полугодии? Таким образом мы можем прикинуть сколько от дохода потеряет банк за минуту простоя. Интересно, что сумма потерь так сильно отличается у банков с высоким доходом и у банков с низким доходом. Например, по моим подсчетам по

указанной выше таблице, УБРиР, в случае простоя, потеряет 8719 руб. за каждую минуту простоя (если такой произойдет), в то же время Мечелбанк, в случае простоя, будет терять лишь 508 руб. в минуту.

LEXUS IS 250

LEXUS IS 250

Удивительно, что в первом случае, акционеры могут терять целый LEXUS IS250 всего за 150 минут, т.е. 2,5 часа простоя!!! Конечно это не на все 100% правильный расчет, но он очень близок к истине.

Не секрет, что внеплановые простои бывают практически у всех, но как, оказывается, странно, что советы директоров некоторых организаций не принимают решения инвестировать деньги в создание решения, легко способного бы минимизировать простои практически до нуля (технологии в наше время есть и они реально работают уже у многих).

[Собственный комментарий]: Президент нашей компании заметил, что банки теряют не прибыль, а доход. Т.к. прибыль зависит и от величины различных расходов организации, а доход нет. Расходы всегда остаются, а доходы могут быть, а могут и не быть. Ввиду этого исправил все упоминания слова «прибыль» в статье  на слово «доход». Цифры править не стал, все равно уже время прошло и значения поменялись. Главное, чтобы был понятен смысл.