Hl2009 Pr V2

1,609 views

Published on

Published in: Technology, Design
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,609
On SlideShare
0
From Embeds
0
Number of Embeds
1,044
Actions
Shares
0
Downloads
44
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Hl2009 Pr V2

  1. 1. Организация отказоустойчивой инфраструктуры на примере баннерной сети Артем Вольфтруб Денис Елданди
  2. 2. Надежность системы определяет <ul><li>Отказоустойчивость </li></ul><ul><li>Масштабируемость </li></ul><ul><li>Легкость поддержки </li></ul>
  3. 3. <ul><li>300 000 000 регистрируемых событий </li></ul><ul><li>100 000 партнерских площадок </li></ul><ul><li>4000 показов в секунду </li></ul><ul><li>500 запросов к порталу в секунду </li></ul>Стартовые параметры
  4. 4. Основные компоненты системы <ul><li>Баннерные сервера </li></ul><ul><li>Портал </li></ul><ul><li>Статистика </li></ul>
  5. 5. Основные компоненты системы
  6. 6. Архитектура баннерных серверов
  7. 7. Архитектура портала
  8. 8. <ul><li>Размер запроса 2 KB </li></ul><ul><li>Размер баннера 25 KB </li></ul><ul><li>X 300 000 000 показов = </li></ul><ul><ul><li>7500 GB трафик баннеров </li></ul></ul><ul><ul><li>700 GB трафик запросов </li></ul></ul>Расчет нагрузки на сеть (на самом деле меньше)
  9. 9. Топология сети <ul><li>Trunk 1 GB каналов </li></ul><ul><li>1 GB до Edge switches </li></ul><ul><li>100 MB до серверов </li></ul>
  10. 10. Использование DSR
  11. 11. Что дает мониторинг <ul><li>Прогнозирование нагрузки </li></ul><ul><li>Диагностика проблем на ранней стадии </li></ul><ul><li>Выявление типовых проблем - > разработка универсальных решений </li></ul>
  12. 12. Виды мониторинга <ul><li>Физический уровень </li></ul><ul><li>Уровень приложения </li></ul><ul><li>Бизнес уровень </li></ul>
  13. 13. Мониторинг на физическом уровне <ul><li>Сеть </li></ul><ul><li>Доступность сервера </li></ul><ul><li>CPU </li></ul><ul><li>Память </li></ul><ul><li>IO </li></ul><ul><li>Свободное место на дисках </li></ul>
  14. 14. Мониторинг на уровне приложения <ul><li>HTTP Errors </li></ul><ul><li>Response Time </li></ul><ul><li>Актуальность баннеров </li></ul><ul><li>Актуальность статистики </li></ul>
  15. 15. Мониторинг на бизнес уровне <ul><li>Число зарегистрированных событий за период </li></ul><ul><li>Число непринятых кликов </li></ul><ul><li>Число непринятых транзакций </li></ul><ul><li>Динамика рекламных кампаний </li></ul>
  16. 16. Система мониторинга
  17. 17. Чем измеряем <ul><li>Критериальная система Nagios </li></ul><ul><li>Тренды Cacti </li></ul><ul><li>Журналы Tenshi </li></ul>
  18. 18. В результате
  19. 19. Число регистрируемых событий
  20. 20. <ul><li>600 000 000 регистрируемых событий </li></ul><ul><li>200 000 партнерских площадок </li></ul><ul><li>7000 показов в секунду </li></ul><ul><li>1500 запросов к порталу в секунду </li></ul>Данные по нагрузке
  21. 21. Чем достигается отказоустойчивость <ul><li>Дублирование компонентов </li></ul><ul><li>Ранняя диагностика проблем </li></ul><ul><li>Независимость ключевых компонентов </li></ul>
  22. 22. Чем достигается масштабируемость <ul><li>Слабые связи между компонентами </li></ul><ul><li>Легкость кластеризации «тяжелых компонент» </li></ul><ul><li>Отложенная обработка данных в фоновом режиме </li></ul>
  23. 23. Чем достигается легкость поддержки <ul><li>Налаженная система мониторинга </li></ul><ul><li>Наличие готовых лекарств </li></ul><ul><li>Простота архитектуры </li></ul>
  24. 24. Вопросы? Артем Вольфтруб / artem @gramant.ru Денис Елданди / [email_address]

×