Переезд

Блог переехал на teterkin.ru

 

О доступности и серверах холодного резерва…

О терминах доступности:

 

«24x7» – аббревиатура обозначающая «двадцать четыре часа в сутки, семь дней в

24x7

24x7

неделю», обычно обозначающая, что бизнес функции компании или информационные системы (сервисы) доступны потребителям круглосуточно и никогда не останавливаются.

 

Расширенный формат термина «24х7х365», добавляет к фразе «триста шестьдесят пять дней в году», подчеркивая, что сервисы компании не прерываются в течение всего года.

 

«24/5» означает то же самое, но подразумевает выходные дни (субботу и воскресенье), когда сервисы могут быть недоступны.

 

«Девятки» (999, 9999, 99999) относятся к понятию «Доступность».

Доступность (Availability) в данном смысле слова  подразумевает под собой наличие возможности для пользователей компьютерной системы (людей или приложений) получить доступ к компьютерной системе в целях сбора, обработки, хранения или передачи информации.

Доступность измеряется в процентах из соотношения времени, когда система была доступна пользователям в течение заданного интервала времени, ко всему времени измерений. Иногда доступность измеряется с использованием «девяток», что округленно соответствует количеству девяток после запятой. Т.е. «доступность пять девяток» означает доступность 0.99999 или 99.999%. Применительно к году работы систем это означает допустимый простой всего в 5 минут в год. Это практически соответствует 24х7х365.

 

О сервере холодного резерва (пустующий сервер без кластерного программного обеспечения, выступающий в качестве резервного в случае выхода из строя основного сервера):

 

Использование холодного резерва вполне приемлемо в случаях, когда допустима остановка банковских систем на несколько часов.

Это самый дешевый вариант, но в наше время редко кто позволяет себе такой длительный простой.

 

При использовании сервера холодного резерва, в случае выхода из строя основного сервера, потребуется некоторый период времени для переключения производственной нагрузки на сервер холодного резерва.

Даже если не потребуется восстановление с ленточных носителей и есть возможность передать логические диски основного сервера с системы хранения данных серверу холодного резерва, все равно такое восстановление займет достаточно продолжительное время.

Standard versus rapid data recovery

Standard versus rapid data recovery

 

 

У одного из наших заказчиков был случай, когда использование резервного сервера в качестве тестового (а это, как правило, все и делают с простаивающим сервером) привело к тому, что администраторы, к сожалению, не смогли оперативно переключиться на резервный сервер по причине изменения конфигурации сервера и нехватки дискового пространства. В довершение ко всему, в виду некорректных попыток восстановления работы сервера они испортили файловую систему и были вынуждены долго ждать ее восстановления. В результате был простой в несколько часов. В итоге руководство банка поставило задачу перед департаментом информационных технологий в кратчайшие сроки внедрить катастрофоустойчивую кластерную систему, что и было успешно реализовано нашей компанией на серверах IBM POWER 570 (процессоры POWER6) с использованием синхронной аппаратной репликации между площадками (EMC CLARiiON CX3-40), кластерным программным обеспечением SFHA/DR компании Symantec (VERITAS) и технологией мгновенного восстановления данных из моментальных копий (Snapshot Rollback).

 

Veritas Cluster Server (Symantec)

Veritas Cluster Server (Symantec)

 

Общая стоимость владения

Последнее время по работе пишу документ по архитектурам кластерных решений для одного из наших заказчиков. Задался вопросом об экономическом обосновании. Посмотрел, что есть по этому поводу у VERITAS. Все кажется немного натянутым. Вот, типа купили асинхронную репликацию данных по IP (VERITAS VVR) и вам сразу не надо покупать SAN и вот вы сэкономили столько-то тысяч долларов… Или я что-то еще не понимаю в TCO или это немного притянуто за уши.

Но зато эти документы меня натолкнули на интересный способ, как узнать сколько теряют банки во

Lost money

Lost money

время внепланового простоя. Зашел на Казновский сайт, на страницу финансовых обзоров, где размещают итоги работы крупнейших банков Урала. И ко мне пришла мысль: А почему бы нам не взять доход банка за полугодие и просто разделить на количество минут в полугодии? Таким образом мы можем прикинуть сколько от дохода потеряет банк за минуту простоя. Интересно, что сумма потерь так сильно отличается у банков с высоким доходом и у банков с низким доходом. Например, по моим подсчетам по

указанной выше таблице, УБРиР, в случае простоя, потеряет 8719 руб. за каждую минуту простоя (если такой произойдет), в то же время Мечелбанк, в случае простоя, будет терять лишь 508 руб. в минуту.

LEXUS IS 250

LEXUS IS 250

Удивительно, что в первом случае, акционеры могут терять целый LEXUS IS250 всего за 150 минут, т.е. 2,5 часа простоя!!! Конечно это не на все 100% правильный расчет, но он очень близок к истине.

Не секрет, что внеплановые простои бывают практически у всех, но как, оказывается, странно, что советы директоров некоторых организаций не принимают решения инвестировать деньги в создание решения, легко способного бы минимизировать простои практически до нуля (технологии в наше время есть и они реально работают уже у многих).

[Собственный комментарий]: Президент нашей компании заметил, что банки теряют не прибыль, а доход. Т.к. прибыль зависит и от величины различных расходов организации, а доход нет. Расходы всегда остаются, а доходы могут быть, а могут и не быть. Ввиду этого исправил все упоминания слова «прибыль» в статье  на слово «доход». Цифры править не стал, все равно уже время прошло и значения поменялись. Главное, чтобы был понятен смысл.

Вышла книжка про обещанный к понедельнику IBM DS5000

Ну не совсем книжка. Пока это драфт. Планируемая дата окончательной публикации: 1 Января 2009 года.

Интересные, на мой взгляд, моменты:

        ·         Производительность как у DS8000 (по словам IBM).

·         Можно обновить DS4800 до DS5000 просто поменяв контроллер и оставив диски.

·         Максимальная набивка: 238 ТБ с дисками SATA или 107 ТБ с дисками FC.

·         Диски можно смешивать.

·         Также можно смешивать новые дисковые полки со старыми полками от DS4800.

·         Миграция с DS4800 без потери данных.

·         Пока вышло две модели: 5100 и 5300.

·         Скорость на одном порту: до 400 Mbps.

·         Поддержка портов 8 Gbps FC и 10 Gbps iSCSI (но пока, как я понял только 4Gbps).

·         Максимум 16 портов для подключения серверов

·         Максимум 16GB кеш

·         Поддержка RAID6

·         Возможность создавать логические тома больше 2 ТБ

·         Аппаратная проверка консистентности данных при чтении

·         Теперь помимо 4К блока и 16К блока появляется и блок размером 8К

·         Максимум 16 мгновенных снимков (FlashCopy). Раньше в серии DS4000 было только 4

·         Поддержка нового драйвера многопоточности (Multipathing) SDDDSM вместо драйвера RDAC

·         Новый дизайн внутренних компонент и их связей

·         Поддержка операционных систем:

IBM POWER Systems:

– AIX 5.2, 5.3, 6.1

– RedHat Enterprise Linux® 4.6, 5.1

– Novell® SuSE SLES 9 SP4, 10 SP1

IBM BladeCenter®:

– Microsoft Windows 2003, 2008

– RedHat Enterprise Linux 4.6, 5.1 (on Intel and Power)

– Novell SuSE SLES 9 SP4, 10 SP1 (on Intel and Power)

– AIX 5.2, 5.3, 6.1 (on Power)

IBM System x™, Intel, AMD™:

– Microsoft Windows 2003, 2008

– RedHat Enterprise Linux 4.6, 5.1

– Novell SuSE SLES 9 SP4, 10 SP1

VMware:

– version 3.5

Hewlett-Packard:

HPUX 11iv2, 11iv3

Вот как оно выглядит:

ds5000

ds5000

Сравнение производительности с DS4800:

 

DS5000 performance
DS5000 performance

 Сравнение конфигурации с DS4800:

А вот и сам драфт:

http://www.redbooks.ibm.com/redpieces/abstracts/sg247676.html?Open.   

 Ну что ж, я рад за IBM. На фоне последних нововведений от EMC и HP тоже не плохо совсем смотрится. Жалко конечно, что моментальный откат из мгновенных копий все еще не сделали, но сравнения по скоростям просто впечатляют!

Непрерывность бизнеса

BCP lifecycle
BCP lifecycle

Интересный горизонт для дальнейшего роста на днях открылся передо мной — Непрерывность бизнеса (Business Continuity)!

Я почему-то раньше думал, что в это понятие входят обычные катастрофоустойчивые технологии, репликация данных между удаленными (географически разделенными) площадками, кластеры, отказоустойчивость, дублирование, резервное копирование и т.д. Оказывается, в технологиях непрерывного бизнеса скрыто гораздо больше! Это целая наука. Здесь и анализ факторов воздействия на бизнес, и анализ рисков, и создание плана обеспечения непрерывности бизнеса, и документирование процедур, и создание специальной команды для реагирования на возникшие риски, и поддержка, и обучение, и тестирование (имитация реализации рисков), и многое-многое другое. Это – целая система, а я очень люблю системные вещи!

Все дальше это уходит от IT в сторону управления процессами. Точнее не уходит от IT, а наблюдается интеграция IT в бизнес, в непосредственную деятельность организации. Для меня раньше была какая-то пропасть между бизнесом и катастрофоустойчивым системами. Конечно, все понимали и раньше необходимость создания таких систем, но сейчас две эти среды четко интегрируются в моем сознании. Возникает ощущение, что это одна из тех областей, куда в дальнейшем выльется развитее IT. Подобно тому, как сравнивать нашу компанию с множеством других, которые просто «возят коробки», т.е.  продают железо без поставки под ключ, без контроля качества, без настройки мониторинга, без тех. поддержки клиентов и т.д.

Интересно, что все лица, разрабатывающие стандарт ЦБ РФ об обеспечении информационной безопасности организаций банковской системы Российской Федерации, насколько мне известно, сертифицированы в международном институте по Business Continuity.

Катастрофа здесь означает любое непредвиденное событие, способное прервать нормальную бизнес деятельность компании. А это значит, никто не застрахован от таких рисков, потому что такие события встречаются довольно часто. В наше быстро меняющееся время, важно не упустить тренд, в соответствии с которым движется развитие технологий. Например, раньше, если банк не работает 2 часа, было нормальным явлением, и никто не переживал сильно по этому поводу. Сейчас, когда у пользователей банковских услуг по несколько счетов в разных банках, когда наблюдается такое обилие банковских предложений, пользователь просто «разворачивается», уходит, и переносит все свои операции в другой банк, особенно, если у него сорвалась сделка или была испорчена репутация из-за пустых обещаний. Таким образом, в наше время простой в 2 часа – уже неприемлемое явление. Конечно, если на компьютере целый день просто раскладывается «Пасьянс», то в случае аварии, можно просто пойти и купить новый компьютер, даже кластер делать не надо. 🙂 Для этого и существует предварительный анализ факторов воздействия на бизнес (Business Impact Analysis, BIA), когда все процессы и ресурсы, вовлеченные в бизнес, исследуются с целью выявления степени влияния на бизнес.
Ну да ладно, не буду вдаваться в подробности, хотел просто поделиться своим вдохновением…

ASUS P750 + NAVITEL 3.0

Пару дней была передышка — ездил в командировку в Тюмень. И вчера тоже было не до журнала — практически до утра проковырялся с новым коммуникатором.

Старый я благополучно «подарил» водителю такси, сам того не осознавая. Нет, был трезв. Он просто отвалился, а я не заметил. В следующий раз нужно покупать правильные чехлы для коммуникаторов. Мой мог легко отцепиться и я подсознательно

Qtek s200

Qtek s200

догадывался, что он однажды так и сделает. ДВАДЦАТЬ ДВЕ тысячи на ветер (когда я его купил, эта модель только появилась в продаже и была очень дорогой)! 

Как раз утром того дня, когда я его потерял, я подумал: «А не сменить ли мне телефон?». Кто теперь  будет спорить, что мысли не материализуются? 🙂

Новый коммуникатор — просто супер! Мощный процессор — приложения быстро открываются. Больше памяти — нет необходимости хранить приложения на карточке и можно не закрывать приложения целиком (пусть висят в памяти — не жалко, а скорость открытия от этого — только выше). Есть поддержка 3,5G — скорость супер! У нас в Екатеринбурге, кстати, до Октября месяца у МТС все видео звонки — бесплатные. Многие коллеги из Москвы нам теперь очень завидуют. 🙂 Ну… вторая камера — 3 мегапикселя. Правда, зачем она нужна? Фотографировать надо фотоаппаратом. Очень меня порадовал продукт ПО спутниковой навигации Navitel (он должен был идти вместе с аппаратом, но почему то отстал по дороге… привезли без Navitel, пришлось покупать отдельно). Очень удобно: в поиске набираешь любой магазин или ресторан, и Navitel сам прокладывает тебе маршрут, говорит где

Asus p750

ASUS P750

дорожные «пробки», камеры ГИБДД, знаки и т.п. Причем если сворачиваешь, он прокладывает новый маршрут с учетом твоего решения. Я сегодня даже на обед с ним ходил, пешком. Говорит: «Впереди ограничение скорости 60 км/ч». 🙂 Ну знаете, я так быстро бегать не умею.

Кстати, чуть не забыл написать про цифровую клавиатуру. Я давно хотел приобрести девайс с такой клавиатурой. Все-таки не очень удобно набирать номер пальцами на экране и каждый раз лазить за стилусом. Сейчас для набора номера мне достаточно набрать первые три или четыре буквы имени или фамилии (при условии, что у меня в адресной книге несколько сотен записей), при этом стилус не требуется.

P.S.: Так что… в любых плохих историях может быть хороший конец.
Кстати, еще я за него ни сколько не заплатил. ГК ХОСТ, где я работаю, «учитывая мои заслуги», оплатила покупку (кроме Navitel-а конечно). Так что я опять попал на светлую сторону зебры, если так можно выразиться…

Эффект бабочки

   Пару лет назад увидел программу написанную Евгением Корниенко, интересным человеком, занимающимся искусственным интеллектом. В этой программе была бабочка, которая вначале просто хаотически летала над полем, пролетая над цветком, она осознавала, что это ей нравится (запах, зрение), постепенно она училась лететь туда, где есть цветок. Уникальность данной программы заключалось в том, что бабочку никто не программировал куда лететь, она выбирала сама. После этого у меня возникло большое желание сделать что-то более серьезное на тех же принципах невмешательства. Искусственный интеллект невозможно запрограммировать, мы можем лишь заложить какие-то основы, дальше интеллект должен развиваться сам. Точно так же у маленьких детей есть какие-то основополагающие понятия, которые они знают с рождения. Например, что Молоко – это вкусно, а кипяток – нет. Что улыбка – это хорошо, а злость на лице – нет. Что сухо – это хорошо, а мокро – нет. И так далее. Основываясь на этом базовом минимуме, ребенок развивается, учится, исследует, запоминает. Постепенно у него развивается интеллект. Конечно у ребенка много учителей, но выбирает что ему нравится он сам. Точно так же искусственный интеллект способен учиться.
Робот

Робот