#FailOverConfЭкономика отказоустойчивостивеб-проектов                       Александр Демидов                             ...
А нужна лиотказоустойчивость?Разные классы сайтов и веб-сервисов: Домашние странички, личные блоги и т.п. «Продающие» сайт...
Почему сайт должен бытьвсегда доступен?  Клиенты и их лояльность (сайт недоступен –  потеряны заказы).                    ...
Почему сайт должен бытьвсегда доступен?    Индексация сайта поисковыми роботами•   Если сайт при сбое будет отдавать не 50...
Почему сайт должен бытьвсегда доступен?  Финансовые потери во время рекламных  компаний – вы платите за «холостые» клики  ...
Отказы инфраструктуры         Интернет-каналы         DNS         Серверы         Диски         Датацентры
Спасет ли SLA провайдера?  Ни один SLA не покроет вашу упущенную выгоду  (прибыль), только расходы на хостинг  Наиболее ча...
«Хитрости» SLA                      $25 / месяц                                                                           ...
Веб-кластер            Веб-сервер 1        Веб-сервер 2                     MySQL    MySQL      memcached 1               ...
«Узкие» места
Ручные операции для восстановленияmaster’а MySQL или другой СУБД                       Балансировщик (клиентские запросы  ...
Высокие требования к сети, связностьсерверов друг с другом                                 SQL-балансировщик  База данных ...
Аварии на уровне целого датацентра илиинтернет-канала                       Балансировщик (клиентские запросы             ...
Резервирование на уровне ДЦ             Чтобы избежать «холостой» работы половины             ресурсов, каждый ДЦ обслужив...
Не бывает «почти круглосуточно»Технические работы должныпроходить незаметно дляклиентов:  Сервисные работы  Замена оборудо...
Посчитаем стоимость «новойИТ-системы»  Оборот за 2012 год - $132 млн. (Digital Guru)  7 суток простоя – около $2.5 млн.А ч...
Real Time мониторинг – какузнавать о проблемах?                             Можно – так…
Real Time мониторинг – какузнавать о проблемах?                 Или – так…
С чего начать?  Внешние системы:     http://host-tracker.com/     Яндекс.Метрика     И т.д.Зачастую можно найти бесплатные...
Организация системымониторинга  Дежурная смена и/или мгновенные уведомления (да, это  будет стоить дополнительных денег). ...
18 февраля 2013  Оборот за 2012 год - $379 млн.  До суток простоя – более $1 млн.
Аналитика – со стороныпользователя   Мало знать «среднюю температуру по больнице» и   мониторить только главную страницу с...
Ключевые страницы – не толькодоступные, но и быстрые                        Замедление загрузки                        стр...
Не забывайте «сохраняться»Исследование Strategic Research Institute 30% предпринимателей после утраты данных прекращают пр...
Резюме    Ваш сайт должен быть максимально доступен – в    разумных пределах•   Резервируйте критичные узлы – исходя из не...
Спасибо за внимание!Вопросы?Александр Демидовdemidov@1c-bitrix.ru+7-926-521-3700    @demidovhttp://www.1c-bitrix.ru
Экономика отказоустойчивости
Экономика отказоустойчивости
Экономика отказоустойчивости
Экономика отказоустойчивости
Экономика отказоустойчивости
Экономика отказоустойчивости
Экономика отказоустойчивости
Экономика отказоустойчивости
Экономика отказоустойчивости
Экономика отказоустойчивости
Upcoming SlideShare
Loading in …5
×

Экономика отказоустойчивости

313 views

Published on

Published in: Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
313
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
4
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Экономика отказоустойчивости

  1. 1. #FailOverConfЭкономика отказоустойчивостивеб-проектов Александр Демидов «1С-Битрикс»
  2. 2. А нужна лиотказоустойчивость?Разные классы сайтов и веб-сервисов: Домашние странички, личные блоги и т.п. «Продающие» сайты (интернет-магазины) Имиджевые сайты (в том числе и корпоративные) «Business critical application» - веб- сервисы, использующиеся в работе (CRM, учет, таск-менеджмент, почта и т.п.)Разные стадии проекта: Инвестиции, развитие Выход на операционную прибыль
  3. 3. Почему сайт должен бытьвсегда доступен? Клиенты и их лояльность (сайт недоступен – потеряны заказы). • $ 237 млн. – оборот за 2012 год (по данным Digital Guru) • До $ 1 млн. в день – с учетом выходных, праздников • Более $ 40 000 (1.3 млн. руб.) – один час возможного простоя
  4. 4. Почему сайт должен бытьвсегда доступен? Индексация сайта поисковыми роботами• Если сайт при сбое будет отдавать не 50x код, а, например, 200 или 404 – будет проиндексирован его текущий контент (сообщение об ошибке)• Частота переиндексации зависит от многих факторов. Возьмем условно 5 дней для относительно популярного интернет-магазина.• 60% траффика интернет-магазина – поиск (конверсия 0.5 %), 40% остального траффика – средняя конверсия 1.1% (исследование Webprofiters)• Несложная математика: около 40% заказов – из поиска• Вы готовы 5 дней (и более) получать на 40% меньше заказов?
  5. 5. Почему сайт должен бытьвсегда доступен? Финансовые потери во время рекламных компаний – вы платите за «холостые» клики Стоимость контекстной рекламы Даже если сайт доступен, но работает медленно, его позиции в результатах поиска будут ниже (учет поведенческих факторов)
  6. 6. Отказы инфраструктуры Интернет-каналы DNS Серверы Диски Датацентры
  7. 7. Спасет ли SLA провайдера? Ни один SLA не покроет вашу упущенную выгоду (прибыль), только расходы на хостинг Наиболее часто встречается гарантия 99.9% доступности в SLA Это – около 9 часов простоя в год Небольшие слоты (до 5 минут) никто не считает Ребут сервера, скорее всего, не попадает под SLA. А если это база данных, она может стартовать несколько часов после аварийного завершения.
  8. 8. «Хитрости» SLA $25 / месяц Elastic Load Balancing CloudWatch CloudWatch Web 1 Web 2 + Web N Web 1 Web 2 + Web N … … AutoScaling AutoScaling S3 mysqld mysqld master-master replication mysqld mysqld mysqld mysqld mysqld master-master replication mysqld mysqld mysqld mysqld mysqld mysqld mysqldcontrol cache: memcached control cache: memcached master-master replication mysqld mysqld control cache: memcached control cache: memcached mysqld mysqld control cache: memcached control cache: memcached $5000 / месяц
  9. 9. Веб-кластер Веб-сервер 1 Веб-сервер 2 MySQL MySQL memcached 1 memcached 1 master slave
  10. 10. «Узкие» места
  11. 11. Ручные операции для восстановленияmaster’а MySQL или другой СУБД Балансировщик (клиентские запросы по HTTP) Веб-сервер 1 Веб-сервер 2 MySQL MySQL memcached 1 memcached 1 master slave
  12. 12. Высокие требования к сети, связностьсерверов друг с другом SQL-балансировщик База данных MySQL База данных MySQL База данных MySQL База данных MySQL MASTER SLAVE 1 SLAVE … SLAVE N
  13. 13. Аварии на уровне целого датацентра илиинтернет-канала Балансировщик (клиентские запросы по HTTP) Веб-сервер 1 Веб-сервер 2 MySQL MySQL memcached 1 memcached 1 master slave
  14. 14. Резервирование на уровне ДЦ Чтобы избежать «холостой» работы половины ресурсов, каждый ДЦ обслуживает свою группу клиентов Elastic Load Balancing Elastic Load Balancing CloudWatch CloudWatch Web 1 Web 2 + Web N Web 1 Web 2 + Web N … … AutoScaling AutoScaling mysqld mysqld master-master replication mysqld mysqld mysqld mysqld mysqld master-master replication mysqld mysqld mysqld mysqld mysqld mysqld mysqldcontrol cache: memcached control cache: memcached master-master replication mysqld mysqld control cache: memcached control cache: memcached mysqld mysqld control cache: memcached control cache: memcached
  15. 15. Не бывает «почти круглосуточно»Технические работы должныпроходить незаметно дляклиентов: Сервисные работы Замена оборудования Обновления системного ПО Обновления приложений
  16. 16. Посчитаем стоимость «новойИТ-системы» Оборот за 2012 год - $132 млн. (Digital Guru) 7 суток простоя – около $2.5 млн.А что с поиском?
  17. 17. Real Time мониторинг – какузнавать о проблемах? Можно – так…
  18. 18. Real Time мониторинг – какузнавать о проблемах? Или – так…
  19. 19. С чего начать? Внешние системы: http://host-tracker.com/ Яндекс.Метрика И т.д.Зачастую можно найти бесплатные варианты.Вы быстро узнаете об отказах, но не будете знать, гдеони произошли и почему.
  20. 20. Организация системымониторинга Дежурная смена и/или мгновенные уведомления (да, это будет стоить дополнительных денег). Необходимо автоматизировать типовые действия при авариях. Иначе сайт будет простаивать до реакции админа. Мониторить – всё. Необходимо составить список всех критических точек в системе и отслеживать их состояние. Мониторить не только состояние серверов – сроки регистрации доменов, SSL сертификатов и т.п.
  21. 21. 18 февраля 2013 Оборот за 2012 год - $379 млн. До суток простоя – более $1 млн.
  22. 22. Аналитика – со стороныпользователя Мало знать «среднюю температуру по больнице» и мониторить только главную страницу сайта Гистограммы распределения времени хитов, кодов ответа и т.п. – из логов (awk-скрипт), pinba или других инструментов
  23. 23. Ключевые страницы – не толькодоступные, но и быстрые Замедление загрузки страницы на 1 секунду снижает конверсию на 7%, а количество просмотров - на 11%.
  24. 24. Не забывайте «сохраняться»Исследование Strategic Research Institute 30% предпринимателей после утраты данных прекращают предпринимательскую деятельность в течение года. 60% предпринимателей, потерявших ВСЕ данные, прекращают предпринимательскую деятельность в течение 6 месяцев после этого.
  25. 25. Резюме Ваш сайт должен быть максимально доступен – в разумных пределах• Резервируйте критичные узлы – исходя из необходимости и экономики• Важно не только запустить проект, но и грамотно его эксплуатировать – иметь систему мониторинга• Доступность проекта зависит не только от инфраструктуры, но и от кода, внешних сервисов и т.п.• Имейте резервные копии и умейте быстро из них восстанавливаться
  26. 26. Спасибо за внимание!Вопросы?Александр Демидовdemidov@1c-bitrix.ru+7-926-521-3700 @demidovhttp://www.1c-bitrix.ru

×