SlideShare a Scribd company logo
Как устроен мониторинг
в
Badoo
Илья Аблеев
Badoo
2девел-площадки
80
data
~3Kсерверов
4
дата-центра
2релиза в день
>200
разработчиков
2
офиса
>300Mпользователей
в цифрах
(копия продакшена)
круглосуточный
7 человек в сменах
уведомляет о проблемах ответственных лиц
Мониторинг
системные ошибки (кончилось место, завис хост, …)
софтверные ошибки (выложили плохой демон / код / патч)
false positives проверок мониторинга
С какими проблемами сталкиваемся?
админы:
ночной и дневной дежурный, круглосуточная связь
разработчики:
1 ответственный на проблему + запасной на экстренный случай
эскалация лиду
всем:
общая рассылка и групповые чаты
Как уведомляем?
очевидное решение
четкая инструкция
техническая импровизация
Уведомляем или решаем сами?
голова
Zabbix ❤
автоматизация
дополнительные инструменты
Что используем?
мониторинг точно знает, с чего начать, это у него “в крови”
всегда начеку
может проанализировать, как часто случаются подобного рода проблемы
всегда знает, кому и как эскалировать
Голова?
Наши основные требования к софту:
• показать список проблем – ✅
• отправить уведомления – ✅
софт, который вы используете в работе – почти не влияет на
результат
P.S. https://www.meetup.com/Zabbix-Moscow-Meetup/
Zabbix ?
Нет, не покажем, сильно заточен под нас
Зачем свой? Нужно отображать список проблем так, как нам и удобно
И удобно с ними работать
Требования (наши):
• комментарии к алертам
• скрыть проблему на сутки/неделю/месяц/навсегда
• позвонить + связать звонок с инцидентом
• завести тикет
• быстро перейти в другие системы – ssh, grafana, …
Инструменты: дашборд?
Нет, не покажем, сильно заточен под нас
Инструменты: дашборд?
Про людей?
три типа смен: 9-16, 16-23, 23-9
учитываем пожелания ребят
можно меняться
в 1 день - 1 смена
на “посту” всегда кто-то есть
Смены / график / расписание?
раньше: 5 человек в смены, без дневного дежурного
осознание 1: нужно 6 человек
безболезненная ротация
осознание 2: днём нужны дополнительные руки / глаза
в дневной смене 2, в ночной 1
Болезни / отпуска?
с 11 до 20 – очень много изменений на продакшене
один человек может не справиться
ночью всё тихо / спокойно (никто ничего не ломает)
Дневной / ночной дежурный?
Как все устроено?
обычная смена в отделе мониторинга :)
Вопросы?
ableev@corp.badoo.com
https://t.me/ableev
https://habrahabr.ru/company/badoo/

More Related Content

Similar to Как устроен мониторинг в Badoo

доктор веб: информационная безопасность. типичные ошибки
доктор веб: информационная безопасность. типичные ошибки   доктор веб: информационная безопасность. типичные ошибки
доктор веб: информационная безопасность. типичные ошибки
Expolink
 
Администрирование небольших сервисов или один за всех и 100 на одного. Роман ...
Администрирование небольших сервисов или один за всех и 100 на одного. Роман ...Администрирование небольших сервисов или один за всех и 100 на одного. Роман ...
Администрирование небольших сервисов или один за всех и 100 на одного. Роман ...
yaevents
 
Денис Чернилевский - Вы кто вообще такие
Денис Чернилевский - Вы кто вообще такиеДенис Чернилевский - Вы кто вообще такие
Денис Чернилевский - Вы кто вообще такие
Yandex
 
Бинарные уязвимости и эксплойты: технологии и перспективы
Бинарные уязвимости и эксплойты: технологии и перспективыБинарные уязвимости и эксплойты: технологии и перспективы
Бинарные уязвимости и эксплойты: технологии и перспективы
d_olex
 
Доктор Веб. Вячеслав Медведев. "Как избавиться от шифровальщиков"
Доктор Веб. Вячеслав Медведев. "Как избавиться от шифровальщиков"Доктор Веб. Вячеслав Медведев. "Как избавиться от шифровальщиков"
Доктор Веб. Вячеслав Медведев. "Как избавиться от шифровальщиков"
Expolink
 

Similar to Как устроен мониторинг в Badoo (20)

Облегчаем процесс разработки с помощью статического анализа кода: Наш опыт
Облегчаем процесс разработки с помощью статического анализа кода: Наш опытОблегчаем процесс разработки с помощью статического анализа кода: Наш опыт
Облегчаем процесс разработки с помощью статического анализа кода: Наш опыт
 
вирусы и антивирусы
вирусы и антивирусывирусы и антивирусы
вирусы и антивирусы
 
Информационная Безопасность. Современные угрозы и области компетенций
Информационная Безопасность. Современные угрозы и области компетенцийИнформационная Безопасность. Современные угрозы и области компетенций
Информационная Безопасность. Современные угрозы и области компетенций
 
Zabbix в badoo, от lld к super discovery
Zabbix в badoo, от lld к super discoveryZabbix в badoo, от lld к super discovery
Zabbix в badoo, от lld к super discovery
 
доктор веб: информационная безопасность. типичные ошибки
доктор веб: информационная безопасность. типичные ошибки   доктор веб: информационная безопасность. типичные ошибки
доктор веб: информационная безопасность. типичные ошибки
 
Администрирование небольших сервисов или один за всех и 100 на одного. Роман ...
Администрирование небольших сервисов или один за всех и 100 на одного. Роман ...Администрирование небольших сервисов или один за всех и 100 на одного. Роман ...
Администрирование небольших сервисов или один за всех и 100 на одного. Роман ...
 
Денис Чернилевский - Вы кто вообще такие
Денис Чернилевский - Вы кто вообще такиеДенис Чернилевский - Вы кто вообще такие
Денис Чернилевский - Вы кто вообще такие
 
Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015
Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015
Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015
 
Как мы админа увольняли, или тонкости организации корпоративной безопасности ...
Как мы админа увольняли, или тонкости организации корпоративной безопасности ...Как мы админа увольняли, или тонкости организации корпоративной безопасности ...
Как мы админа увольняли, или тонкости организации корпоративной безопасности ...
 
Отдела мониторинга в тестировании
Отдела мониторинга в тестированииОтдела мониторинга в тестировании
Отдела мониторинга в тестировании
 
Бинарные уязвимости и эксплойты: технологии и перспективы
Бинарные уязвимости и эксплойты: технологии и перспективыБинарные уязвимости и эксплойты: технологии и перспективы
Бинарные уязвимости и эксплойты: технологии и перспективы
 
почему болеет комп
почему болеет комппочему болеет комп
почему болеет комп
 
Сколько надо SOC?
Сколько надо SOC?Сколько надо SOC?
Сколько надо SOC?
 
Обнаружение необнаруживаемого
Обнаружение необнаруживаемогоОбнаружение необнаруживаемого
Обнаружение необнаруживаемого
 
Cisco. Лукацкий Алексей. "Обнаружение необнаруживаемого. Как идентифицировать...
Cisco. Лукацкий Алексей. "Обнаружение необнаруживаемого. Как идентифицировать...Cisco. Лукацкий Алексей. "Обнаружение необнаруживаемого. Как идентифицировать...
Cisco. Лукацкий Алексей. "Обнаружение необнаруживаемого. Как идентифицировать...
 
Доктор Веб. Вячеслав Медведев. "Как избавиться от шифровальщиков"
Доктор Веб. Вячеслав Медведев. "Как избавиться от шифровальщиков"Доктор Веб. Вячеслав Медведев. "Как избавиться от шифровальщиков"
Доктор Веб. Вячеслав Медведев. "Как избавиться от шифровальщиков"
 
Борьба с вредоносным кодом: от базовых мер к целостной стратегии
Борьба с вредоносным кодом: от базовых мер к целостной стратегииБорьба с вредоносным кодом: от базовых мер к целостной стратегии
Борьба с вредоносным кодом: от базовых мер к целостной стратегии
 
Вячеслав Медведев (Доктор Веб) "ИБ: типичные ошибки"
Вячеслав Медведев (Доктор Веб) "ИБ: типичные ошибки"Вячеслав Медведев (Доктор Веб) "ИБ: типичные ошибки"
Вячеслав Медведев (Доктор Веб) "ИБ: типичные ошибки"
 
Free RvSIEM. Intro (Rus)
Free RvSIEM. Intro (Rus)Free RvSIEM. Intro (Rus)
Free RvSIEM. Intro (Rus)
 
Автоматизация управления проектами в постпродакшен и визуальных эффектах
 Автоматизация управления проектами в постпродакшен и визуальных эффектах Автоматизация управления проектами в постпродакшен и визуальных эффектах
Автоматизация управления проектами в постпродакшен и визуальных эффектах
 

More from Uptime Community

More from Uptime Community (6)

Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...
Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...
Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...
 
Эффективная техподдержка 24х7: инструкция по применению
Эффективная техподдержка 24х7: инструкция по применениюЭффективная техподдержка 24х7: инструкция по применению
Эффективная техподдержка 24х7: инструкция по применению
 
Мониторинг, когда не тестируешь
Мониторинг, когда не тестируешьМониторинг, когда не тестируешь
Мониторинг, когда не тестируешь
 
Типовое внедрение мониторинга
Типовое внедрение мониторингаТиповое внедрение мониторинга
Типовое внедрение мониторинга
 
Стриминг мониторинга
Стриминг мониторингаСтриминг мониторинга
Стриминг мониторинга
 
Изобретая колесо: как мы писали свой мониторинг
Изобретая колесо: как мы писали свой мониторингИзобретая колесо: как мы писали свой мониторинг
Изобретая колесо: как мы писали свой мониторинг
 

Как устроен мониторинг в Badoo