В современном живом проекте у каждой команды стоит огромное количество задач. Какие-то из них критически важны, какие-то могут подождать, а какие-то вообще можно не делать. Какие-то задачи требуют вовлечения всей команды на пару недель, какие-то требуют внимания одного инженера на 3 минуты. Первых мало, последних - бесконечный поток. Как определить, что должен делать каждый инженер сейчас? Что должна сделать команда в ближайшее время? Что необходимо сделать за ближайшие 6 месяцев? Мой рассказ о том, как моя команда решает эти вопросы.
2. • SaaS-платформа для интернет-
магазинов.
• > 1 000 000 клиентов по всему миру.
• ~ 130 000 000 посетителей в месяц.
• > 110 человек в команде.
• Ульяновск, Самара, Казань, San
Diego.
ECWID
3. Команда Operations отвечает за
качественную работу Ecwid. В других
командах таких людей могут называть
Ops'ами, DevOps'ами, SRE и т.п.
• Доступность
• Надежность
• Безопасность
OPERATIONS TEAM
5. • Задачи бывают разного размера
• Одни требуют 3 минуты от одного инженера
• Другие выливаются в месяцы работы всей
команды
На входе команды бесконечный поток мелких задач:
выдать доступ, поменять настройку базы.
И много крупных задач: интегрировать Auto-Scale
Group’ы, сделать релиз в одну кнопку.
ЗАЧЕМ OPS’АМ WORKFLOW?
9. Есть разные уровни планирования
работы команды: тактическое и
оперативное.
• Quarterly planning
• Bi-weekly planning
• Daily meeting
УРОВНИ ПЛАНИРОВАНИЯ
10. • Рассматриваются крупные задачи.
• Проекты обсуждаются со stake
holder'ами.
• Обычно не более одной задачи на
инженера.
QUARTERLY PLANNING
11. Примеры:
• Пересмотреть систему поиска
аномалий в логах;
• Реализовать релиз новой версии, не
требующий Ops-инженера;
• Развернуть новый кластер в Европе.
QUARTERLY PLANNING
12. • Пересмотр состояния команды.
• Выбираем следующий шаг из задач.
• Приглашаем другие команды.
BI-WEEKLY PLANNING & RETROSPECTIVE
13. Примеры:
• Скоординировать пентестинг с AWS;
• Добавить поддержку consul в
скрипты деплоя;
• Сделать надежные VPN-тунели
между регионами.
BI-WEEKLY PLANNING & RETROSPECTIVE