• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Экономика отказоустойчивости
 

Экономика отказоустойчивости

on

  • 346 views

 

Statistics

Views

Total Views
346
Views on SlideShare
346
Embed Views
0

Actions

Likes
0
Downloads
2
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Экономика отказоустойчивости Экономика отказоустойчивости Presentation Transcript

    • #FailOverConfЭкономика отказоустойчивостивеб-проектов Александр Демидов «1С-Битрикс»
    • А нужна лиотказоустойчивость?Разные классы сайтов и веб-сервисов: Домашние странички, личные блоги и т.п. «Продающие» сайты (интернет-магазины) Имиджевые сайты (в том числе и корпоративные) «Business critical application» - веб- сервисы, использующиеся в работе (CRM, учет, таск-менеджмент, почта и т.п.)Разные стадии проекта: Инвестиции, развитие Выход на операционную прибыль
    • Почему сайт должен бытьвсегда доступен? Клиенты и их лояльность (сайт недоступен – потеряны заказы). • $ 237 млн. – оборот за 2012 год (по данным Digital Guru) • До $ 1 млн. в день – с учетом выходных, праздников • Более $ 40 000 (1.3 млн. руб.) – один час возможного простоя
    • Почему сайт должен бытьвсегда доступен? Индексация сайта поисковыми роботами• Если сайт при сбое будет отдавать не 50x код, а, например, 200 или 404 – будет проиндексирован его текущий контент (сообщение об ошибке)• Частота переиндексации зависит от многих факторов. Возьмем условно 5 дней для относительно популярного интернет-магазина.• 60% траффика интернет-магазина – поиск (конверсия 0.5 %), 40% остального траффика – средняя конверсия 1.1% (исследование Webprofiters)• Несложная математика: около 40% заказов – из поиска• Вы готовы 5 дней (и более) получать на 40% меньше заказов?
    • Почему сайт должен бытьвсегда доступен? Финансовые потери во время рекламных компаний – вы платите за «холостые» клики Стоимость контекстной рекламы Даже если сайт доступен, но работает медленно, его позиции в результатах поиска будут ниже (учет поведенческих факторов)
    • Отказы инфраструктуры Интернет-каналы DNS Серверы Диски Датацентры
    • Спасет ли SLA провайдера? Ни один SLA не покроет вашу упущенную выгоду (прибыль), только расходы на хостинг Наиболее часто встречается гарантия 99.9% доступности в SLA Это – около 9 часов простоя в год Небольшие слоты (до 5 минут) никто не считает Ребут сервера, скорее всего, не попадает под SLA. А если это база данных, она может стартовать несколько часов после аварийного завершения.
    • «Хитрости» SLA $25 / месяц Elastic Load Balancing CloudWatch CloudWatch Web 1 Web 2 + Web N Web 1 Web 2 + Web N … … AutoScaling AutoScaling S3 mysqld mysqld master-master replication mysqld mysqld mysqld mysqld mysqld master-master replication mysqld mysqld mysqld mysqld mysqld mysqld mysqldcontrol cache: memcached control cache: memcached master-master replication mysqld mysqld control cache: memcached control cache: memcached mysqld mysqld control cache: memcached control cache: memcached $5000 / месяц
    • Веб-кластер Веб-сервер 1 Веб-сервер 2 MySQL MySQL memcached 1 memcached 1 master slave
    • «Узкие» места
    • Ручные операции для восстановленияmaster’а MySQL или другой СУБД Балансировщик (клиентские запросы по HTTP) Веб-сервер 1 Веб-сервер 2 MySQL MySQL memcached 1 memcached 1 master slave
    • Высокие требования к сети, связностьсерверов друг с другом SQL-балансировщик База данных MySQL База данных MySQL База данных MySQL База данных MySQL MASTER SLAVE 1 SLAVE … SLAVE N
    • Аварии на уровне целого датацентра илиинтернет-канала Балансировщик (клиентские запросы по HTTP) Веб-сервер 1 Веб-сервер 2 MySQL MySQL memcached 1 memcached 1 master slave
    • Резервирование на уровне ДЦ Чтобы избежать «холостой» работы половины ресурсов, каждый ДЦ обслуживает свою группу клиентов Elastic Load Balancing Elastic Load Balancing CloudWatch CloudWatch Web 1 Web 2 + Web N Web 1 Web 2 + Web N … … AutoScaling AutoScaling mysqld mysqld master-master replication mysqld mysqld mysqld mysqld mysqld master-master replication mysqld mysqld mysqld mysqld mysqld mysqld mysqldcontrol cache: memcached control cache: memcached master-master replication mysqld mysqld control cache: memcached control cache: memcached mysqld mysqld control cache: memcached control cache: memcached
    • Не бывает «почти круглосуточно»Технические работы должныпроходить незаметно дляклиентов: Сервисные работы Замена оборудования Обновления системного ПО Обновления приложений
    • Посчитаем стоимость «новойИТ-системы» Оборот за 2012 год - $132 млн. (Digital Guru) 7 суток простоя – около $2.5 млн.А что с поиском?
    • Real Time мониторинг – какузнавать о проблемах? Можно – так…
    • Real Time мониторинг – какузнавать о проблемах? Или – так…
    • С чего начать? Внешние системы: http://host-tracker.com/ Яндекс.Метрика И т.д.Зачастую можно найти бесплатные варианты.Вы быстро узнаете об отказах, но не будете знать, гдеони произошли и почему.
    • Организация системымониторинга Дежурная смена и/или мгновенные уведомления (да, это будет стоить дополнительных денег). Необходимо автоматизировать типовые действия при авариях. Иначе сайт будет простаивать до реакции админа. Мониторить – всё. Необходимо составить список всех критических точек в системе и отслеживать их состояние. Мониторить не только состояние серверов – сроки регистрации доменов, SSL сертификатов и т.п.
    • 18 февраля 2013 Оборот за 2012 год - $379 млн. До суток простоя – более $1 млн.
    • Аналитика – со стороныпользователя Мало знать «среднюю температуру по больнице» и мониторить только главную страницу сайта Гистограммы распределения времени хитов, кодов ответа и т.п. – из логов (awk-скрипт), pinba или других инструментов
    • Ключевые страницы – не толькодоступные, но и быстрые Замедление загрузки страницы на 1 секунду снижает конверсию на 7%, а количество просмотров - на 11%.
    • Не забывайте «сохраняться»Исследование Strategic Research Institute 30% предпринимателей после утраты данных прекращают предпринимательскую деятельность в течение года. 60% предпринимателей, потерявших ВСЕ данные, прекращают предпринимательскую деятельность в течение 6 месяцев после этого.
    • Резюме Ваш сайт должен быть максимально доступен – в разумных пределах• Резервируйте критичные узлы – исходя из необходимости и экономики• Важно не только запустить проект, но и грамотно его эксплуатировать – иметь систему мониторинга• Доступность проекта зависит не только от инфраструктуры, но и от кода, внешних сервисов и т.п.• Имейте резервные копии и умейте быстро из них восстанавливаться
    • Спасибо за внимание!Вопросы?Александр Демидовdemidov@1c-bitrix.ru+7-926-521-3700 @demidovhttp://www.1c-bitrix.ru