Внедрение системы мониторинга

          «ZABBIX»

       для платформы

           «SDP»
Преимущества
     Текущая система мониторинга (недостатки)                      Будущая система мониторинга ZABBIX (преимущества)
•    Данные обновляются раз в семь минут. Нет возможности      •    Обновление от 10 секунд на метрику. Метрики могут обновляться с
     обновлять метрики с разными интервалами времени                разными интервалами, за счет чего оптимизируется нагрузка и
                                                                    повышается информативность.

•    Нет возможности горизонтального масштабирования           •    Есть возможность создать кластер, если нагрузка на хост
                                                                    мониторинга будет чрезмерной.

•    Пороги оповещения срабатывают по примитивному             •    Есть возможность настроить сложные триггеры, формировать
     алгоритму. Высок процент ложного срабатывания                  комплексные метрики, строить зависимости в оповещениях
     оповещения. Пороговые значения множества данных                проблем. Низкий процент ложного срабатывания оповещения.
     отслеживается только в ручном режиме.                          Следствие – можно предупреждать аварии, а не оповещать о факте
                                                                    их обнаружения.

•    Нет возможности детально проанализировать метрику. Нет    •    Просмотр отдельной метрики и масштабирование до необходимого
     масштабирования данных по произвольному интервалу              уровня за весь период сбора и хранения метрики (6-12 месяцев).
     времени.

•    Новые метрики заводятся по запросу в компанию Teligent,   •    Новые метрики заводятся быстро, по факту появления
     крайне не оперативно.                                          необходимости.

•    Набор отображаемых данных недостаточен.                   •    Возможность видеть новые полезные метрики.


    Текущая система мониторинга (преимущества)                      Будущая система мониторинга ZABBIX (недостатки)


•    Мониторинг находится на обслуживании компании Teligent.   •    Для поддержания и развития мониторинга требуется специалист
     Не требуются ресурсы для его поддержания и развития            внутри компании МТС.

•    Для мониторинга нового функционала достаточно завести     •    Для мониторинга нового функционала платформы требуется
     задачу в Teligent                                              согласовать с разработчиками механизм мониторинга




                                                                                                                              2
Цель по мониторингу

• Иметь актуальную информацию о состоянии платформы

• Предупреждать об аварии до ее появления

• Хранить необходимую статистику для анализа аварийных ситуаций

• Сократить время выявления проблемной зоны в аварийной ситуации

• Сократить время реагирования администратора в аварийной
  ситуации

• Хранить статистические данные о тарификации, трафике, обработке
  промежуточных CDR файлов и т.д.




                                                                    3
Техническое решение



                            Доступность хостов по сети
                            Доступность хостов по сети
      Мониторинг
      Мониторинг
                                                         Мониторинг интерфейсов
                                                         Мониторинг интерфейсов
      транзакций
      транзакций
                                                         сопряжения с соседними
                                                         сопряжения с соседними
  основных элементов
  основных элементов
                                                              платформами
                                                              платформами
      платформы
      платформы



  Загрузка
  Загрузка                         Мониторинг ::
                                   Мониторинг
CPU, memory,
CPU, memory,                   Запрос – обработка –
                               Запрос – обработка –
 file system,
 file system,                  анализ – оповещение
                               анализ – оповещение
                                                                    Мониторинг
                                                                    Мониторинг
  interfaces
   interfaces
                                                                    баз данных
                                                                    баз данных
                                                                    по основным
                                                                    по основным
                                                                    параметрам
                                                                     параметрам

        Мониторинг загрузки
        Мониторинг загрузки              Парсинг CDR, EDR файлов
                                         Парсинг CDR, EDR файлов
        основных элементов
        основных элементов                   для мониторинга
                                             для мониторинга
                платформы
                платформы               статистической информации
                                        статистической информации


                                                                                  4
Техническое решение




                                                                                                 МР Москва , МР СЗ , МР ПЮВ , МР ПСЗ ,
                                                                                                                                         МР Юг , МРСибирь , МРУрал , МРДВ
             SMP         RTC      LBAS         SPDSAS       SDF        LDB      PDB       SURV


     Опрос

  Хостов в МР

для снятия метрик


                                                                                Хосты хранения
                               Опрос                                               CDR/EDR
                                                   ZABBIX
                          ZABBIX PROXY                                                файлов
                                                   PROXY
                            по регионам
                                                                  Парсинг EDR

  Хранение данных




                                                                                                                                  МР Москва
      статистики

                                                                                         PROV
                                                  ZABBIX
                         ZABBIX DB


                                                                  Парсинг CDR
          Хранение

      временных данных            ZABBIX STAT
                                                                                        PROVDB
   Для статистики CDR/EDR                 DB


                                                                                                                    5
Результаты сегодня



•   Установлено 377 хостов на мониторинг /
    снимается 8895 метрик с платформы /
    настроено 3136 различных оповещений с
    различными приоритетами


•   Настроено отображение аварийных зон на
    географической карте . Подсвечивание группы
    хостов в соответствии с приоритетом аварии .


•   Настроены отображения классических и
    комплексных графиков по хостам или группам
    хостов .


•   Обеспечена возможность видеть последние лог -
    файлы , запущенные процессы или доступность
    хоста с помощью интерфейса мониторинга




                                               6
Развитие
Планы развития мониторинга Zabbix:

• Обеспечить отказоустойчивость системы мониторинга и базы данных
  мониторинга (IVQ2012)

• Добавить загрузку/работоспособность компонент платформы p90e
  (SDP) на хостах всех МР и настроить соответствующие оповещения
  (IVQ2012)

• Добавить на мониторинг доступность/загруженность интерфейсов
  между группами хостов платформы по всем МР и настроить
  соответствующие оповещения (IVQ2012)

• Настроить сбор метрик в разрезе планирования capacity (IQ2013)

• Установить zabbix-proxy в каждом МР для снятия нагрузки с
  центрального хоста zabbix (IVQ2012)




                                                                    7

Zabbix v2

  • 1.
    Внедрение системы мониторинга «ZABBIX» для платформы «SDP»
  • 2.
    Преимущества Текущая система мониторинга (недостатки) Будущая система мониторинга ZABBIX (преимущества) • Данные обновляются раз в семь минут. Нет возможности • Обновление от 10 секунд на метрику. Метрики могут обновляться с обновлять метрики с разными интервалами времени разными интервалами, за счет чего оптимизируется нагрузка и повышается информативность. • Нет возможности горизонтального масштабирования • Есть возможность создать кластер, если нагрузка на хост мониторинга будет чрезмерной. • Пороги оповещения срабатывают по примитивному • Есть возможность настроить сложные триггеры, формировать алгоритму. Высок процент ложного срабатывания комплексные метрики, строить зависимости в оповещениях оповещения. Пороговые значения множества данных проблем. Низкий процент ложного срабатывания оповещения. отслеживается только в ручном режиме. Следствие – можно предупреждать аварии, а не оповещать о факте их обнаружения. • Нет возможности детально проанализировать метрику. Нет • Просмотр отдельной метрики и масштабирование до необходимого масштабирования данных по произвольному интервалу уровня за весь период сбора и хранения метрики (6-12 месяцев). времени. • Новые метрики заводятся по запросу в компанию Teligent, • Новые метрики заводятся быстро, по факту появления крайне не оперативно. необходимости. • Набор отображаемых данных недостаточен. • Возможность видеть новые полезные метрики. Текущая система мониторинга (преимущества) Будущая система мониторинга ZABBIX (недостатки) • Мониторинг находится на обслуживании компании Teligent. • Для поддержания и развития мониторинга требуется специалист Не требуются ресурсы для его поддержания и развития внутри компании МТС. • Для мониторинга нового функционала достаточно завести • Для мониторинга нового функционала платформы требуется задачу в Teligent согласовать с разработчиками механизм мониторинга 2
  • 3.
    Цель по мониторингу •Иметь актуальную информацию о состоянии платформы • Предупреждать об аварии до ее появления • Хранить необходимую статистику для анализа аварийных ситуаций • Сократить время выявления проблемной зоны в аварийной ситуации • Сократить время реагирования администратора в аварийной ситуации • Хранить статистические данные о тарификации, трафике, обработке промежуточных CDR файлов и т.д. 3
  • 4.
    Техническое решение Доступность хостов по сети Доступность хостов по сети Мониторинг Мониторинг Мониторинг интерфейсов Мониторинг интерфейсов транзакций транзакций сопряжения с соседними сопряжения с соседними основных элементов основных элементов платформами платформами платформы платформы Загрузка Загрузка Мониторинг :: Мониторинг CPU, memory, CPU, memory, Запрос – обработка – Запрос – обработка – file system, file system, анализ – оповещение анализ – оповещение Мониторинг Мониторинг interfaces interfaces баз данных баз данных по основным по основным параметрам параметрам Мониторинг загрузки Мониторинг загрузки Парсинг CDR, EDR файлов Парсинг CDR, EDR файлов основных элементов основных элементов для мониторинга для мониторинга платформы платформы статистической информации статистической информации 4
  • 5.
    Техническое решение МР Москва , МР СЗ , МР ПЮВ , МР ПСЗ , МР Юг , МРСибирь , МРУрал , МРДВ SMP RTC LBAS SPDSAS SDF LDB PDB SURV Опрос Хостов в МР для снятия метрик Хосты хранения Опрос CDR/EDR ZABBIX ZABBIX PROXY файлов PROXY по регионам Парсинг EDR Хранение данных МР Москва статистики PROV ZABBIX ZABBIX DB Парсинг CDR Хранение временных данных ZABBIX STAT PROVDB Для статистики CDR/EDR DB 5
  • 6.
    Результаты сегодня • Установлено 377 хостов на мониторинг / снимается 8895 метрик с платформы / настроено 3136 различных оповещений с различными приоритетами • Настроено отображение аварийных зон на географической карте . Подсвечивание группы хостов в соответствии с приоритетом аварии . • Настроены отображения классических и комплексных графиков по хостам или группам хостов . • Обеспечена возможность видеть последние лог - файлы , запущенные процессы или доступность хоста с помощью интерфейса мониторинга 6
  • 7.
    Развитие Планы развития мониторингаZabbix: • Обеспечить отказоустойчивость системы мониторинга и базы данных мониторинга (IVQ2012) • Добавить загрузку/работоспособность компонент платформы p90e (SDP) на хостах всех МР и настроить соответствующие оповещения (IVQ2012) • Добавить на мониторинг доступность/загруженность интерфейсов между группами хостов платформы по всем МР и настроить соответствующие оповещения (IVQ2012) • Настроить сбор метрик в разрезе планирования capacity (IQ2013) • Установить zabbix-proxy в каждом МР для снятия нагрузки с центрального хоста zabbix (IVQ2012) 7