Your SlideShare is downloading. ×
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Hl2009 Pr
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
246
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
8
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Организация отказоустойчивой инфраструктуры на примере баннерной сети Артем Вольфтруб Денис Елданди
  • 2. Надежность системы определяет
    • Отказоустойчивость
    • Масштабируемость
    • Легкость поддержки
  • 3.
    • 300 000 000 регистрируемых событий
    • 100 000 партнерских площадок
    • 4000 показов в секунду
    • 500 запросов к порталу в секунду
    Стартовые параметры
  • 4. Основные компоненты системы
    • Баннерные сервера
    • Портал
    • Статистика
  • 5. Основные компоненты системы
  • 6. Архитектура баннерных серверов
  • 7. Архитектура портала
  • 8.
    • Размер запроса 2 KB
    • Размер баннера 25 KB
    • X 300 000 000 показов =
      • 7500 GB трафик баннеров
      • 700 GB трафик запросов
    Расчет нагрузки на сеть (на самом деле меньше)
  • 9. Топология сети
    • Trunk 1 GB каналов
    • 1 GB до Edge switches
    • 100 MB до серверов
  • 10. Использование DSR
  • 11. Что дает мониторинг
    • Прогнозирование нагрузки
    • Диагностика проблем на ранней стадии
    • Выявление типовых проблем - > разработка универсальных решений
  • 12. Виды мониторинга
    • Физический уровень
    • Уровень приложения
    • Бизнес уровень
  • 13. Мониторинг на физическом уровне
    • Сеть
    • Доступность сервера
    • CPU
    • Память
    • IO
    • Свободное место на дисках
  • 14. Мониторинг на уровне приложения
    • HTTP Errors
    • Response Time
    • Актуальность баннеров
    • Актуальность статистики
  • 15. Мониторинг на бизнес уровне
    • Число зарегистрированных событий за период
    • Число непринятых кликов
    • Число непринятых транзакций
    • Динамика рекламных кампаний
  • 16. Система мониторинга
  • 17. Чем измеряем
    • Критериальная система Nagios
    • Тренды Cacti
    • Журналы Tenshi
  • 18. В результате
  • 19. Число регистрируемых событий
  • 20.
    • 600 000 000 регистрируемых событий
    • 200 000 партнерских площадок
    • 7000 показов в секунду
    • 1500 запросов к порталу в секунду
    Данные по нагрузке
  • 21. Чем достигается отказоустойчивость
    • Дублирование компонентов
    • Ранняя диагностика проблем
    • Независимость ключевых компонентов
  • 22. Чем достигается масштабируемость
    • Слабые связи между компонентами
    • Легкость кластеризации «тяжелых компонент»
    • Отложенная обработка данных в фоновом режиме
  • 23. Чем достигается легкость поддержки
    • Налаженная система мониторинга
    • Наличие готовых лекарств
    • Простота архитектуры
  • 24. Вопросы? Артем Вольфтруб / artem @gramant.ru Денис Елданди / [email_address]

×