SlideShare a Scribd company logo
1 of 31
Методика
определения неоптимально используемых ресурсов
Мирошниченко Дмитрий
Инженер по автоматизации
dmiroshnichenko@ptsecurity.com
Как появилась идея
История проблемы
2012 2015 2016 2017
История
Проблемы
Завис сервис
Не стартует VM
Сборочный сервер тормозит
Кончилось место на сторе
ПричинаПроблема
Disk, CPU, MEM
Disk
CPU, MEM
Disk
Цель разработки Методики
1. Решить проблему постоянной нехватки ресурсов
инфраструктуры R&D не путем наращивания
машинных ресурсов, а оптимизацией потребления
этих ресурсов
2. Подтвердить гипотезу, что значительная часть
данных ресурсов используется неоптимально
DoD
1. Сформулированы критерии неоптимальности
использования ресурсов
2. Разработана методика определения неиспользуемых
ресурсов инфраструктруры, без необходимости ручных
действий
3. Разработан скрипт, реализующий эту методику, который
можно передать вне отдела DevOps
Инфраструктура
HW
HW
HW
Clouds
• Двадцать команд
• Десятки проектов
• Тысячи VM
Первичная оптимизация
• Рассылка сообщений в команде
• Ручная отпимизация
Реализация
Первичный анализ
•VMware operations manager
•OpenStack
Метрики
•Owner
•TTL
•TTL Action
•ESX_swap
•Snapshot_count
•CPU_usage_avg
•MEM_usage_avg
•Disk_type
TTL
TTL — дата, по достижению которой с VM производится
действие
Требуемые значения: ISO 8601 (Basic) или -1
Пример: 20171030
Триггер: выполняем действие из TTL Action
Несоответствие требуемым значениям: отправляем письмо
owner'у
TTL
TTL Action
TTL Action — действие, которое производится с VM по
достижению даты в TTL
Требуемые значения: ключевые слова
Пример — выключение: shutdown || halt
Пример — удаление: remove || delete || destroy
Пример — перемещение: archive || mv
Триггер: вспомогательный атрибут
Несоответствие требуемым значениям: отправляем письмо
owner'у
Owner
Owner — владелец или ответственный за VM
Требуемые значения: имя доменной учетки или
группа рассылки, допустимо несколько значений
Пример — dmiroshnichenko || isimqa; knikolaev
Триггер: вспомогательный атрибут
Несоответствие требуемым значениям: контактируем с
лидами и находим исполнителя который заполнит значения 
ESX_swap
ESX_swap — объем памяти, которую Vmkernel перевел на диск
Требуемое значение: 0 MB
Триггер: превышение требуемого значения
Несоответствие требуемому значению: отправляем письмо
owner'у. Перезагружаем/выключаем ВМ
Snapshot_count
Snapshot_count — число снапшотов у VM
Требуемое значение: 0
Триггер: превышение требуемого значения
Несоответствие требуемому значению: отправляем письмо
owner'у с просьбой удалить снапшоты
CPU_usage_avg & MEM_usage_avg
*_usage_avg — cреднее значение по загрузке за 4 часа
Рекомендованные значения: загрузка > 60%
Триггер: превышение рекомендованного значения
Несоответствие рекомендованным значениям: оповещаем
owner'а о чрезмерном потреблении ресурсов
Disk_type
Disk_type — тип диска
Требуемые значения: Thick Provision Lazy/Eager Zeroed
Триггер: превышение допустимого значения
Несоответствие требуемым значениям: отправляем письмо
owner'у с просьбой конвертировать диск и количеством
«неправильных» дисков
Данные: создаем и наполняем
Zabbix
•Items
•Triggers
•Logic
Items & Triggers
Оповещения
Выводы
Положительные результаты
• DoD достигнут: критерии неоптимальности определены,
методика и скрипты разработаны
• Переходим на парадигму Infrastructure as Code
• Единые сборочные пулы
• Навели порядок и сэкономили 
• Приблизились к созданию единого ресурсного пула
Единый вычислительный пул
HW
HW
HW
Clouds
Что не получилось
•Disk_type
•CPU_usage_avg
•MEM_usage_avg
CPU_usage_avg & MEM_usage_avg
Как представляли:
Что дальше
Планы
• Построение цикла жизни VM
• Дополнительные проверки перед созданием VM
• Агрегация VM по Load class
• UI
• Оповещения об «осиротевших» VM
github.com/devopshq
Спасибо!
Вопросы?
Мирошниченко Дмитрий
Инженер по автоматизации
dmiroshnichenko@ptsecurity.com

More Related Content

What's hot

Javascript-фреймворки:
 должен остаться только один
Javascript-фреймворки:
 должен остаться только одинJavascript-фреймворки:
 должен остаться только один
Javascript-фреймворки:
 должен остаться только один
Sergey Xek
 
Как показывать 200 миллионов баннеров ежедневно и быть готовым показать милли...
Как показывать 200 миллионов баннеров ежедневно и быть готовым показать милли...Как показывать 200 миллионов баннеров ежедневно и быть готовым показать милли...
Как показывать 200 миллионов баннеров ежедневно и быть готовым показать милли...
Evgeny Kokovikhin
 
Kubasov 1 7_deploy
Kubasov 1 7_deployKubasov 1 7_deploy
Kubasov 1 7_deploy
kuchinskaya
 
сергей спиридонов
сергей спиридоновсергей спиридонов
сергей спиридонов
kuchinskaya
 
температура мира
температура миратемпература мира
температура мира
HighLoad2009
 
Оптимизация одного из топовых приложений для социальной сети ВКонтакте: 1000 ...
Оптимизация одного из топовых приложений для социальной сети ВКонтакте: 1000 ...Оптимизация одного из топовых приложений для социальной сети ВКонтакте: 1000 ...
Оптимизация одного из топовых приложений для социальной сети ВКонтакте: 1000 ...
Fuenteovejuna
 
специализированные http-демона (Сергей Боченков, Александр Панков)
специализированные http-демона (Сергей Боченков, Александр Панков)специализированные http-демона (Сергей Боченков, Александр Панков)
специализированные http-демона (Сергей Боченков, Александр Панков)
Ontico
 
Адаптивная оптимизация запросов в реляционных СУБД / Олег Иванов (Postgres Pr...
Адаптивная оптимизация запросов в реляционных СУБД / Олег Иванов (Postgres Pr...Адаптивная оптимизация запросов в реляционных СУБД / Олег Иванов (Postgres Pr...
Адаптивная оптимизация запросов в реляционных СУБД / Олег Иванов (Postgres Pr...
Ontico
 

What's hot (18)

Javascript-фреймворки:
 должен остаться только один
Javascript-фреймворки:
 должен остаться только одинJavascript-фреймворки:
 должен остаться только один
Javascript-фреймворки:
 должен остаться только один
 
Как показывать 200 миллионов баннеров ежедневно и быть готовым показать милли...
Как показывать 200 миллионов баннеров ежедневно и быть готовым показать милли...Как показывать 200 миллионов баннеров ежедневно и быть готовым показать милли...
Как показывать 200 миллионов баннеров ежедневно и быть готовым показать милли...
 
HighLoad Junior '16 Как сравнить и выбрать хостинг-провайдера
HighLoad Junior '16 Как сравнить и выбрать хостинг-провайдераHighLoad Junior '16 Как сравнить и выбрать хостинг-провайдера
HighLoad Junior '16 Как сравнить и выбрать хостинг-провайдера
 
Kubasov 1 7_deploy
Kubasov 1 7_deployKubasov 1 7_deploy
Kubasov 1 7_deploy
 
сергей спиридонов
сергей спиридоновсергей спиридонов
сергей спиридонов
 
Сервер «Аллодов Онлайн». Архитектура и особенности разработки.
Сервер «Аллодов Онлайн». Архитектура и особенности разработки. Сервер «Аллодов Онлайн». Архитектура и особенности разработки.
Сервер «Аллодов Онлайн». Архитектура и особенности разработки.
 
Highload 2011-demona
Highload 2011-demonaHighload 2011-demona
Highload 2011-demona
 
температура мира
температура миратемпература мира
температура мира
 
Быстрый рендеринг с DOM шаблонизаторами / Борис Каплуновский (aviasales.ru)
Быстрый рендеринг с DOM шаблонизаторами / Борис Каплуновский (aviasales.ru)Быстрый рендеринг с DOM шаблонизаторами / Борис Каплуновский (aviasales.ru)
Быстрый рендеринг с DOM шаблонизаторами / Борис Каплуновский (aviasales.ru)
 
Web performance 101 [GDG nsk webdev meetup #3]
Web performance 101 [GDG nsk webdev meetup #3]Web performance 101 [GDG nsk webdev meetup #3]
Web performance 101 [GDG nsk webdev meetup #3]
 
Оптимизация одного из топовых приложений для социальной сети ВКонтакте: 1000 ...
Оптимизация одного из топовых приложений для социальной сети ВКонтакте: 1000 ...Оптимизация одного из топовых приложений для социальной сети ВКонтакте: 1000 ...
Оптимизация одного из топовых приложений для социальной сети ВКонтакте: 1000 ...
 
специализированные http-демона (Сергей Боченков, Александр Панков)
специализированные http-демона (Сергей Боченков, Александр Панков)специализированные http-демона (Сергей Боченков, Александр Панков)
специализированные http-демона (Сергей Боченков, Александр Панков)
 
2021.09.04 PHP FWDays. Our experience of transferring Laravel microservices t...
2021.09.04 PHP FWDays. Our experience of transferring Laravel microservices t...2021.09.04 PHP FWDays. Our experience of transferring Laravel microservices t...
2021.09.04 PHP FWDays. Our experience of transferring Laravel microservices t...
 
#7 "Многообещающий JavaScript – Promises" Денис Речкунов
#7 "Многообещающий JavaScript – Promises" Денис Речкунов#7 "Многообещающий JavaScript – Promises" Денис Речкунов
#7 "Многообещающий JavaScript – Promises" Денис Речкунов
 
Адаптивная оптимизация запросов в реляционных СУБД / Олег Иванов (Postgres Pr...
Адаптивная оптимизация запросов в реляционных СУБД / Олег Иванов (Postgres Pr...Адаптивная оптимизация запросов в реляционных СУБД / Олег Иванов (Postgres Pr...
Адаптивная оптимизация запросов в реляционных СУБД / Олег Иванов (Postgres Pr...
 
Неочевидные детали при запуске HTTPS в OK.Ru / Андрей Домась (Одноклассники)
Неочевидные детали при запуске HTTPS в OK.Ru / Андрей Домась (Одноклассники)Неочевидные детали при запуске HTTPS в OK.Ru / Андрей Домась (Одноклассники)
Неочевидные детали при запуске HTTPS в OK.Ru / Андрей Домась (Одноклассники)
 
Rubt on Rails: 1000 запросов в секунду
Rubt on Rails: 1000 запросов в секундуRubt on Rails: 1000 запросов в секунду
Rubt on Rails: 1000 запросов в секунду
 
Кругом обман или использование стандартных протоколов для нестандартных вещей
Кругом обман или использование стандартных протоколов для нестандартных вещейКругом обман или использование стандартных протоколов для нестандартных вещей
Кругом обман или использование стандартных протоколов для нестандартных вещей
 

Similar to Методика определения неиспользуемых ресурсов виртуальных машин и автоматизация действий с ними

Опыт эксплуатации большого проекта на Ruby
Опыт эксплуатации большого проекта на RubyОпыт эксплуатации большого проекта на Ruby
Опыт эксплуатации большого проекта на Ruby
Alex Chistyakov
 
Git in Sky presentation @ HighLoad++ 2013
Git in Sky presentation @ HighLoad++ 2013Git in Sky presentation @ HighLoad++ 2013
Git in Sky presentation @ HighLoad++ 2013
Serguei Gitinsky
 
Windows Azure & NodeJS Microsoft SWIT 2012
Windows Azure & NodeJS Microsoft SWIT 2012 Windows Azure & NodeJS Microsoft SWIT 2012
Windows Azure & NodeJS Microsoft SWIT 2012
Dmytro Mindra
 
NodeJS в HighLoad проекте / Акрицкий Владимир (iAge Engineering)
NodeJS в HighLoad проекте / Акрицкий Владимир (iAge Engineering)NodeJS в HighLoad проекте / Акрицкий Владимир (iAge Engineering)
NodeJS в HighLoad проекте / Акрицкий Владимир (iAge Engineering)
Ontico
 
Dynamic Memory в Windows Server 2008 R2 SP1
Dynamic Memory в Windows Server 2008 R2 SP1Dynamic Memory в Windows Server 2008 R2 SP1
Dynamic Memory в Windows Server 2008 R2 SP1
Andrey Beshkov
 
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo Development
 
Javascript-фреймворки: должен остаться только один / Аверин Сергей (Acronis)
Javascript-фреймворки: должен остаться только один / Аверин Сергей (Acronis)Javascript-фреймворки: должен остаться только один / Аверин Сергей (Acronis)
Javascript-фреймворки: должен остаться только один / Аверин Сергей (Acronis)
Ontico
 
Экономика проекта с точки зрения IT
Экономика проекта с точки зрения ITЭкономика проекта с точки зрения IT
Экономика проекта с точки зрения IT
oleg.bunin
 
Developmentmanage1.0
Developmentmanage1.0Developmentmanage1.0
Developmentmanage1.0
HighLoad2009
 
Developmentmanage3.0
Developmentmanage3.0Developmentmanage3.0
Developmentmanage3.0
WRider
 

Similar to Методика определения неиспользуемых ресурсов виртуальных машин и автоматизация действий с ними (20)

Software craftsmanship 12 online highload systems
Software craftsmanship 12 online highload systemsSoftware craftsmanship 12 online highload systems
Software craftsmanship 12 online highload systems
 
Dev & test на windows azure
Dev & test на windows azureDev & test на windows azure
Dev & test на windows azure
 
Опыт эксплуатации большого проекта на Ruby
Опыт эксплуатации большого проекта на RubyОпыт эксплуатации большого проекта на Ruby
Опыт эксплуатации большого проекта на Ruby
 
Git in Sky presentation @ HighLoad++ 2013
Git in Sky presentation @ HighLoad++ 2013Git in Sky presentation @ HighLoad++ 2013
Git in Sky presentation @ HighLoad++ 2013
 
SmartOS/Solaris app tuning tools/technologies on HL++ 2013
SmartOS/Solaris app tuning tools/technologies on HL++ 2013SmartOS/Solaris app tuning tools/technologies on HL++ 2013
SmartOS/Solaris app tuning tools/technologies on HL++ 2013
 
Windows Azure & NodeJS Microsoft SWIT 2012
Windows Azure & NodeJS Microsoft SWIT 2012 Windows Azure & NodeJS Microsoft SWIT 2012
Windows Azure & NodeJS Microsoft SWIT 2012
 
NodeJS в HighLoad проекте / Акрицкий Владимир (iAge Engineering)
NodeJS в HighLoad проекте / Акрицкий Владимир (iAge Engineering)NodeJS в HighLoad проекте / Акрицкий Владимир (iAge Engineering)
NodeJS в HighLoad проекте / Акрицкий Владимир (iAge Engineering)
 
Oblachnye vychisleniya -_ponyatiya_i_tehnologii
Oblachnye vychisleniya -_ponyatiya_i_tehnologiiOblachnye vychisleniya -_ponyatiya_i_tehnologii
Oblachnye vychisleniya -_ponyatiya_i_tehnologii
 
Dynamic Memory в Windows Server 2008 R2 SP1
Dynamic Memory в Windows Server 2008 R2 SP1Dynamic Memory в Windows Server 2008 R2 SP1
Dynamic Memory в Windows Server 2008 R2 SP1
 
Nikita Galkin "5 production Node.js stories"
Nikita Galkin "5 production Node.js stories"Nikita Galkin "5 production Node.js stories"
Nikita Galkin "5 production Node.js stories"
 
Windows Azure and node js
Windows Azure and node jsWindows Azure and node js
Windows Azure and node js
 
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
 
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
 
Zabbix в сервисной компании  ОНЛАНТА - Zabbix Meetup Moscow
Zabbix в сервисной компании  ОНЛАНТА -  Zabbix Meetup Moscow Zabbix в сервисной компании  ОНЛАНТА -  Zabbix Meetup Moscow
Zabbix в сервисной компании  ОНЛАНТА - Zabbix Meetup Moscow
 
Javascript-фреймворки: должен остаться только один / Аверин Сергей (Acronis)
Javascript-фреймворки: должен остаться только один / Аверин Сергей (Acronis)Javascript-фреймворки: должен остаться только один / Аверин Сергей (Acronis)
Javascript-фреймворки: должен остаться только один / Аверин Сергей (Acronis)
 
Экономика проекта с точки зрения IT
Экономика проекта с точки зрения ITЭкономика проекта с точки зрения IT
Экономика проекта с точки зрения IT
 
Xp days 2019 - Why startups need SRE practices
Xp days 2019 - Why startups need SRE practicesXp days 2019 - Why startups need SRE practices
Xp days 2019 - Why startups need SRE practices
 
Developmentmanage1.0
Developmentmanage1.0Developmentmanage1.0
Developmentmanage1.0
 
Sivko
SivkoSivko
Sivko
 
Developmentmanage3.0
Developmentmanage3.0Developmentmanage3.0
Developmentmanage3.0
 

More from Positive Hack Days

Мастер-класс «Трущобы Application Security»
Мастер-класс «Трущобы Application Security»Мастер-класс «Трущобы Application Security»
Мастер-класс «Трущобы Application Security»
Positive Hack Days
 
Эвристические методы защиты приложений
Эвристические методы защиты приложенийЭвристические методы защиты приложений
Эвристические методы защиты приложений
Positive Hack Days
 
Уязвимое Android-приложение: N проверенных способов наступить на грабли
Уязвимое Android-приложение: N проверенных способов наступить на граблиУязвимое Android-приложение: N проверенных способов наступить на грабли
Уязвимое Android-приложение: N проверенных способов наступить на грабли
Positive Hack Days
 
Механизмы предотвращения атак в ASP.NET Core
Механизмы предотвращения атак в ASP.NET CoreМеханизмы предотвращения атак в ASP.NET Core
Механизмы предотвращения атак в ASP.NET Core
Positive Hack Days
 

More from Positive Hack Days (20)

Инструмент ChangelogBuilder для автоматической подготовки Release Notes
Инструмент ChangelogBuilder для автоматической подготовки Release NotesИнструмент ChangelogBuilder для автоматической подготовки Release Notes
Инструмент ChangelogBuilder для автоматической подготовки Release Notes
 
Как мы собираем проекты в выделенном окружении в Windows Docker
Как мы собираем проекты в выделенном окружении в Windows DockerКак мы собираем проекты в выделенном окружении в Windows Docker
Как мы собираем проекты в выделенном окружении в Windows Docker
 
Типовая сборка и деплой продуктов в Positive Technologies
Типовая сборка и деплой продуктов в Positive TechnologiesТиповая сборка и деплой продуктов в Positive Technologies
Типовая сборка и деплой продуктов в Positive Technologies
 
Аналитика в проектах: TFS + Qlik
Аналитика в проектах: TFS + QlikАналитика в проектах: TFS + Qlik
Аналитика в проектах: TFS + Qlik
 
Использование анализатора кода SonarQube
Использование анализатора кода SonarQubeИспользование анализатора кода SonarQube
Использование анализатора кода SonarQube
 
Развитие сообщества Open DevOps Community
Развитие сообщества Open DevOps CommunityРазвитие сообщества Open DevOps Community
Развитие сообщества Open DevOps Community
 
Автоматизация построения правил для Approof
Автоматизация построения правил для ApproofАвтоматизация построения правил для Approof
Автоматизация построения правил для Approof
 
Мастер-класс «Трущобы Application Security»
Мастер-класс «Трущобы Application Security»Мастер-класс «Трущобы Application Security»
Мастер-класс «Трущобы Application Security»
 
Формальные методы защиты приложений
Формальные методы защиты приложенийФормальные методы защиты приложений
Формальные методы защиты приложений
 
Эвристические методы защиты приложений
Эвристические методы защиты приложенийЭвристические методы защиты приложений
Эвристические методы защиты приложений
 
Теоретические основы Application Security
Теоретические основы Application SecurityТеоретические основы Application Security
Теоретические основы Application Security
 
От экспериментального программирования к промышленному: путь длиной в 10 лет
От экспериментального программирования к промышленному: путь длиной в 10 летОт экспериментального программирования к промышленному: путь длиной в 10 лет
От экспериментального программирования к промышленному: путь длиной в 10 лет
 
Уязвимое Android-приложение: N проверенных способов наступить на грабли
Уязвимое Android-приложение: N проверенных способов наступить на граблиУязвимое Android-приложение: N проверенных способов наступить на грабли
Уязвимое Android-приложение: N проверенных способов наступить на грабли
 
Требования по безопасности в архитектуре ПО
Требования по безопасности в архитектуре ПОТребования по безопасности в архитектуре ПО
Требования по безопасности в архитектуре ПО
 
Формальная верификация кода на языке Си
Формальная верификация кода на языке СиФормальная верификация кода на языке Си
Формальная верификация кода на языке Си
 
Механизмы предотвращения атак в ASP.NET Core
Механизмы предотвращения атак в ASP.NET CoreМеханизмы предотвращения атак в ASP.NET Core
Механизмы предотвращения атак в ASP.NET Core
 
SOC для КИИ: израильский опыт
SOC для КИИ: израильский опытSOC для КИИ: израильский опыт
SOC для КИИ: израильский опыт
 
Honeywell Industrial Cyber Security Lab & Services Center
Honeywell Industrial Cyber Security Lab & Services CenterHoneywell Industrial Cyber Security Lab & Services Center
Honeywell Industrial Cyber Security Lab & Services Center
 
Credential stuffing и брутфорс-атаки
Credential stuffing и брутфорс-атакиCredential stuffing и брутфорс-атаки
Credential stuffing и брутфорс-атаки
 
Доклад SiteSecure
Доклад SiteSecureДоклад SiteSecure
Доклад SiteSecure
 

Методика определения неиспользуемых ресурсов виртуальных машин и автоматизация действий с ними

Editor's Notes

  1. Рассказать о целях
  2. Года сделать анимацией В начале 12-13 столкнулись с нехваткой ресурсов порядке 100 ВМ. Написали скрипт который по апи собирал информацию по загрузке и на выходе выдавал статические страницы (автор Арсен Адамян сегодня здесь). Продвижением тулзы никто не занимался, с уходом Арсена она загнулась. Начало 2015 – начали писать новую систему тестирования для Макспторол, увеличилось количество тестовых машин. проекты АИ, ВАФ, вебенжин начали активно тестироваться. Проблема опять проявилась. Пришлось докупать железо (в каждую команду отдельно). 2016 Проблема никуда не делась  Железо мониторится департаментом ИТ, наладили оповещения о нехватки места на сторах. В конце 2016 была четко сформулированая задча.
  3. Дать определение Методики Методика определения неиспользуемых ресурсов инфраструктруры: Это последовательность действий: Python-скрипт, запускаемый автоматически, выполняет сбор метрик Python-скрипт выполняет проверку каждой метрики на превышение значений В случае несоответствия фактических значений метрики допустимым уровням, выполняются действия, указанные в Таблице 1. Периодичность запуска проверки и сбора метрик - еженочно
  4. 20 комманд, исторически у каждой свое железо, все хотели не зависеть от соседей, чтобы ничего не тормозило. Тысячи ВМ. IaaS сопровождается департаментом ИТ ВМ не имеют жизненого цикла (собираются вручную, не обновляются, могут удалятся из инвентори, но занимать место на диске). Отсутствует жизненый цикл ВМ Часть проектов живет в облаке. Раньше был Крок, сейчас переходим на cloud4y, но все это не удобно после AWS и Azure
  5. Рассылка писем в команде через Outlook – с просьбой выключить не используемые ВМ. Миграция через сферу. Из-за разности в железе не всегда можно собрать кластер, для атоматической миграции.
  6. vmware operations manager -- vRealize Operations
  7. Критерии неоптимальности используемых ресурсов на Сфере: В ячейках таблицы указаны граничные критерии, после превышения которых работа машины будет считаться неоптимальной и несоответствующей текущему TTL, после чего будут предприняты действия. Превышение показателей по метрикам для различных классов по Uptime, является критерием неоптимальности использования.
  8. Человек или группа людей, которые будут получать уведомления о десвтиях производимых с ВМ
  9. Файл свапа лежит в директории с VM Это плохо, т.к. он не знает (в отличие от ОС), какие страницы нужно складывать в своп, поэтому кладет все подряд.
  10. В качестве примера можно привести тот факт, что при аллокации блоков снапшота происходит блокировка LUN (в этом режиме он доступен только одному хосту, остальные ждут). Когда снапшот делается - машина подвисает из-за сброса памяти на диск. Куча ограничений по атоматизации при наличии снапшота. На сервере VMware vCenter можно настроить алармы на снапшоты виртуальных машин. Veeam Backup бывает создает невидимые в vSphere Client снапшоты (Helpers) которые остаются на хранилище По словам Best practices for using snapshots in the vSphere environment (1025279), большое колл-во снапшотов ведет к падению производительности ВМ и стора. Кулл стори про гитлаб и 255 снапшотов вимбэкапа
  11. Есть тимплейт который цепляется к тимплейтам вмвари тимплейтов от забикса Под каждую метрику есть айтемы и тригры Переделать картинки, оставить по 3 строчки из тригеров и айтемов, за счет челог увеличатся Про логику тут (слайд со скриптами удалил)
  12. У писем есть маркер [vmvalidator]
  13. Обязательно сделать Выводы: 1) Помогла ли Методика решить проблемы, озвученные во введении? После внедрения Методики: при первичной диагностике (уточнить сколько ВМ подключено) мы обнаружили, что у большинства ВМ выделено чрезмерно CPU и Memory, нашли бесхозные ВМ (уточнить количество), нашли ВМ с большим числом снапшотов (количество?), начали вовлекать команды в решение общей проблемы с ресурсами, а также Методика стала точкой соприкосновения с ИТ по вопросам консолидации ресурсов. 2) как людям применять Методику? Внешним сказать, что скрипты скоро будут выложены в DevOpsHQ(ссылку на слайде)
  14. В крупных задачах не видно конца, только следующий шаг.
  15. Единый вычислительный пул (цпу, мем), сторы отдельно
  16. Не учли оптимизации на сторах. Ругаемся, если Thin Provision, т.к. такие диски наименее производительны (выделение нового блока и его очистка), однако наиболее оптимальны со стороны экономии пространства на системе хранения данных, что оказалось важнее.
  17. Не осилили написать свой оркестратор :D
  18. Создание ВМ через наш UI (смотрим, что есть(pt-virt или внешние проекты) или пишем свое (фронт + salt-cloud как бэк)) Как пользоваться Методикой: Скрипты выложим в паблик, дать ссылку на девопсHQ