"Incremental rollouts and rollbacks with business metrics control at every stage", Kyrylo Melnychuk

Інкрементальні
ролаути та ролбеки
з контролем бізнес-метрик
на кожному етапі
Kyrylo Melnychuk
CTO @

Про мене
Кирило Мельничук, CTO
Собаковод
20 років в IT
20 відтінків волосся
Люблю вигадувати
роботу

Про що це все?
Як ми прийшли до
інкрементальних
ролаутів
Які проблеми хотіли
вирішити
Що вийшло
І що ж там далі?

Трошки про нас
Український стартап, нам 1 рік
3500+ клієнтів
Startup of the Year 2023
62 мікросервіса
3500+ деплойментів за рік
PHP/Golang/Typescript
3 EKS кластера

Еволюція деплоїв

“Давайте не релізити
по пʼятницях”
Джейсон Стетхем

10 релізів на день*
Одразу на всіх клієнтів
* і це ми ще не починали

Проблематика
Дуже важко контролювати
Релізи накладаються на релізи
Stage != prod
Різні мови, різні умови
QA не встигають
Лише ручний контроль

Що ми хочемо?
Зробити деплої
безпечнішими
Зняти навантаження
з людей
Зменшити можливість
помилки

Наш шлях
на Канари

Як було
ArgoCD
GitOps
Мерж в мейн -> деплой на всіх
Мерж по 3 апрувах
Ручний автомоніторинг помилок і аномалій після релізу
Ручний відкат за потреби

Що розглядали
Flagger
CodeFresh
Jenkins
Spinnaker
Старі добрі костилі
Argo rollouts

Чому ArgoRollouts?
входить в екосистему (але можна юзати і в
голому кубі)
вбудовані CRD для роботи в kubernetes
система плагінів аналізатора (god bless you)
підтримка різних інгрес-контролерів
Для початку, в нас був ArgoCD =)

Що таке ArgoRollout?
Картинка нагло взята з документації

Доступні аналітики
Prometheus
Datadog / NewRelic / Wavefront
Kubernetes Job (opens a door to heaven!)
Web
CloudWatch
Graphite / InfluxDB
And a lot more (+ plugins!)

Приклади аналізаторів

Що ми використовуємо?
Github actions
Uspacy chat (так, у нас нема слака =)
ArgoCD
ELK (точніше, Opensearch)
Prometheus
Datadog
Custom metrics (про них далі)

Правила ролбеків
Загальні (в темплейтах) та посервісні
% зміни error/access логів
сrashloop
кількість 5xx over time
метрики БД сервісу (CPUUtilization, slow queries)
Datadog: anomalies, response time
Бізнес-метрики: кількість нових реєстрацій

Висновки та майбутнє

Приємності
Дуже важко контролювати
Релізи накладаються на релізи
Stage != prod
Різні мови, різні умови
QA не встигають
Лише ручний контроль

Проблеми і складності
Виділені Canary-домени – не з коробки
False-positive та false-negative ролаути/ролбеки
Правила можуть сильно різнитися
Бізнес-метрики постійно змінюються

Що далі?
Інтеграція argo workflows, argo events, argo cd,
argo rollouts.
Автоматизувати апдейт порогів метрик
Динамічні стейджі
Управління процесом з чату
Дашборд релізів

Дякую! Питання?
uspacy.com
fb.com/imnightwriter

"Incremental rollouts and rollbacks with business metrics control at every stage", Kyrylo Melnychuk

Recommended

Recommended

More Related Content

Similar to "Incremental rollouts and rollbacks with business metrics control at every stage", Kyrylo Melnychuk

Similar to "Incremental rollouts and rollbacks with business metrics control at every stage", Kyrylo Melnychuk (20)

More from Fwdays

More from Fwdays (20)

"Incremental rollouts and rollbacks with business metrics control at every stage", Kyrylo Melnychuk