SlideShare a Scribd company logo
HA-платформа управления для
программно-конфигурируемых сетей
Пашков Василий,
программист-разработчик ЦПИКС
Высокая доступность (High Availability, HA)
23.09.2015 vpashkov@arccn.ru 2
• Сеть работает в режиме 365/24/7.
• Платформа управления ПКС должна работать непрерывно.
• Цель обеспечения высокой готовности – поддержание
непрерывной работоспособности платформы управления,
сетевых приложений.
• Причины простоя: обслуживание, программные и
аппаратные ошибки, отказы оборудования, атаки,
отключение электроэнергии, аварии.
Коэффициент готовности, % Время простоя за год
99,999 5 минут
99,99 52 минуты
99,9 8,7 часов
99 3,7 дней
Угрозы
23.09.2015 vpashkov@arccn.ru 3
Отказ контроллера
Перегрузка контроллера
Потеря соединения
коммутатора с контроллером
Стратегии резервирования /1
23.09.2015 vpashkov@arccn.ru 4
Active/Standby
(Passive) стратегии:
• Холодное
[без синхронизации]
• Теплое
[периодическая
синхронизация]
• Горячее
[постоянная
синхронизация]
Восстановление после отказа контроллера для
случая горячего резервирования RUNOS
23.09.2015 vpashkov@arccn.ru 5
Особенности решения:
• OpenFlow ≥ 1.0
• Корпоративные сети.
• Не масштабируется
• Не полная утилизация
вычислительных
ресурсов
Одиночный отказ контроллера+
- Потеря соединения коммутатора с контроллером
- Перегрузка контроллера
Стратегии резервирования /2
23.09.2015 vpashkov@arccn.ru 6
• Стратегии резервирования Active/Active
– Ассиметричная
– Симметричная
• Высокая сложность [Требуется координация контроллеров,
поддержка глобального состояния]
• Высокая доступность [минимальное время простоя]
• Высокая утилизация вычислительных ресурсов
Возможности протокола OpenFlow
23.09.2015 vpashkov@arccn.ru 7
• Протокол OpenFlow 1.2:
– Множество контроллеров
– Механизм ролей
– Роли: Master, Slave, Equal
– По умолчанию:
контроллер находится в
роли Equal для
коммутаторов.
– Смена роли:
OFPT_ROLE_REQUEST
– Распределение ролей:
возложено на
контроллеры.
OpenFlow 1.0, 1.1
OpenFlow 1.2 – 1.5
Модель платформы управления
23.09.2015 vpashkov@arccn.ru 8
Задачи:
1. Как синхронизовать
контроллеры?
2. Как определить начальное
распределение
коммутаторов по
контроллерам?
3. Как перераспределить
управление коммутаторами
при одиночном отказе
контроллера?
4. Как восстановить
управление коммутатором
при потере соединения с
контроллером?
5. Как предотвратить
перегрузку контроллера в
платформе управления?
Предположения модели
Предположения:
• Все контроллеры имеют одинаковую производительность.
• Контроллер устанавливает правила только на те
коммутаторы, для которых он является Master
контроллером.
• Инфраструктура доступа обеспечивает связь
коммутаторов с каждым контроллером.
Условие корректности решения:
• В каждый момент времени для каждого коммутатора в
сети должен быть определен только один Master
контроллер.
23.09.2015 vpashkov@arccn.ru 9
Задача 1: Синхронизация контроллеров
• На основе Multi-Paxos
• Обеспечивает одновременное одинаковое выполнение команд
контроллеров
• Команды: изменение Network View, установление новых потоков (чтение
NV), изменение ролей контроллеров.
23.09.2015 vpashkov@arccn.ru 10
Add NodeAdd Flow...
Журнал событий
In-memory
хранилище
ДКА
Контроллер
[MASTER]
Сервис синхронизации
Событие
Add NodeAdd Flow...
Журнал событий
ДКА
Контроллер
[SLAVE]
Сервис синхронизации
Add NodeAdd Flow...
Журнал событий
ДКА
Контроллер
[SLAVE]
Сервис синхронизации
Сегмент
Network 1
Сегмент
Network 2
Сегмент
Network 3
Состояние
Network View 1
In-memory
хранилище
Состояние
Network View 1
In-memory
хранилище
Состояние
Network View 1
Proposer Acceptor Acceptor Acceptor
Задача 2: Начальное распределение
коммутаторов по контроллерам
23.09.2015 vpashkov@arccn.ru 11
• Критерий определения Master-контроллера:
– Задержка от коммутатора до контроллера, как мера
близости.
• Ограничение:
на количество
коммутаторов в сегменте
контроллера.
• Решение:
Жадный алгоритм по
значению задержки от
коммутатора до
контроллеров.
Задача 3: Выработка и представление
сценариев восстановления
23.09.2015 vpashkov@arccn.ru 12
• Проактивная разработка
сценариев восстановления
• Критерий выбора нового
распределения: задержка
от коммутатора до
контроллера
• Алгоритм Балаша.
• Результат: перечень
сценариев для каждого
контроллера платформы
управления.
Задача 3: Использование сценария для
восстановления ПУ после отказа контроллера
23.09.2015 vpashkov@arccn.ru 13
1. Оставшимися
контроллерами
фиксируется факт отказа
контроллера и CID.
2. Каждый контроллер
выбирает сценарий
восстановления,
соответствующий отказу
контроллера CID.
3. В соответствии со
сценарием каждый
контроллер изменяет
свою роль на
коммутаторах.
4. Каждый контроллера
информирует остальные
контроллеры о
завершении выполнения
сценария
восстановления.
Задача 4: Восстановление при потере
соединения коммутатора с контроллером
23.09.2015 vpashkov@arccn.ru 14
1. Фиксируется отключение
коммутатора Master-
контроллером.
2. Инициируется проверка
присутствия коммутатора
в сети.
3. Осуществляется
измерении задержки
контроллерами,
поддерживающими связь
с коммутатором.
4. Master-контроллером
становится контроллер с
минимальной задержкой
до коммутатора.
5. Новый Master-контроллер
устанавливает свою роль
на коммутаторе.
Отказ
коммутатора
или потеря
соединения?
??
Задача 5: Предотвращение перегрузки
контроллера платформы управления
23.09.2015 vpashkov@arccn.ru 15
Для обнаружения перегрузки:
• Устанавливаются пороговые значения
параметров загрузки контроллеров.
• Осуществляется постоянный мониторинг
загрузки контроллеров
[количество коммутаторов, количество packet-
in запросов в секунду, CPU, память]
• Факт перегрузки фиксируется при
обнаружении превышения порогового
значения.
Задача перераспределения коммутаторов по контроллерам: Необходимо
перераспределить коммутаторы так, чтобы:
1. Нагрузка на каждый из контроллеров не превышала его производительности
2. Использовалось минимальное количество контроллеров.
3. При перестроении управления сетью было проведено минимальное
количество передач управления коммутаторами.
Задача 5: Передача управления
коммутатором
23.09.2015 vpashkov@arccn.ru 16
• Свойство живучести: В любой
момент времени для
коммутатора существует
контроллер, работающий в
режиме Master. Для любой
асинхронной команды,
контроллер, который ее
отправил, остается активным до
тех пор, пока коммутатор не
закончит ее обработку.
• Свойство безопасности: Ровно
один контроллер обрабатывает
каждое асинхронное
сообщение от коммутатора.
Задача 5: Распределение
коммутаторов по группам
23.09.2015 vpashkov@arccn.ru 17
• Входные данные:
– Топология сети
– Количество новых потоков с каждого коммутатора
– Максимально допустимая нагрузка на контроллер P
• Алгоритм разбиения графа на компоненты
связности, чтобы суммарная нагрузка компоненты
связности не превышала P.
• Выходные данные:
– Матрица, определяющая Master-контроллеры для
коммутаторов и сегменты управления для каждого
контроллера.
Задача 5: Распределение
групп коммутаторов по контроллерам
23.09.2015 vpashkov@arccn.ru 18
• Входные данные:
– Текущая матрица распределения управления
коммутаторами по контроллерам.
– Желаемая матрица распределения управления
коммутаторами.
• Алгоритм: жадный алгоритм, минимизирующий
количество передач управления коммутаторами
между контроллерами платформы управления.
• Выходные данные:
– Список операций по передаче управления отдельными
коммутаторами.
Выводы
23.09.2015 vpashkov@arccn.ru 19
• Проект RUNOS (C++, OF 1.3)
https://github.com/ARCCN/runos
• RUNOS с поддержкой Active/Standby стратегии
горячего резервирования для небольших сетей
[в открытый доступ]
• RUNOS с поддержкой стратегии Active/Active
 Оптимизация разработанных алгоритмов
 Разработка распределенных приложений
Спасибо за внимание!
vpashkov@arccn.ru
23.09.2015 vpashkov@arccn.ru 20

More Related Content

What's hot

Внедрение SDN в сети телеком-оператора
Внедрение SDN в сети телеком-оператораВнедрение SDN в сети телеком-оператора
Внедрение SDN в сети телеком-оператора
ARCCN
 
Импортозамещение. Отечественное ПО на основе сетей нового поколения: SDN&NFV
Импортозамещение. Отечественное ПО на основе сетей нового поколения:  SDN&NFV Импортозамещение. Отечественное ПО на основе сетей нового поколения:  SDN&NFV
Импортозамещение. Отечественное ПО на основе сетей нового поколения: SDN&NFV
ARCCN
 
RUNOS OpenFlow controller (ru)
RUNOS OpenFlow controller (ru)RUNOS OpenFlow controller (ru)
RUNOS OpenFlow controller (ru)
Alexander Shalimov
 
SDN & NFV: от абонента до Internet eXchange
SDN & NFV: от абонента до Internet eXchangeSDN & NFV: от абонента до Internet eXchange
SDN & NFV: от абонента до Internet eXchange
ARCCN
 
Управление корпоративной сетью на основе SDN-технологий
Управление корпоративной сетью на основе SDN-технологий Управление корпоративной сетью на основе SDN-технологий
Управление корпоративной сетью на основе SDN-технологий
ARCCN
 
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...
ARCCN
 
Об одном подходе переноса функциональности CPE устройств в ЦОД телеком оператора
Об одном подходе переноса функциональности CPE устройств в ЦОД телеком оператораОб одном подходе переноса функциональности CPE устройств в ЦОД телеком оператора
Об одном подходе переноса функциональности CPE устройств в ЦОД телеком оператора
ARCCN
 
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...
ARCCN
 
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...
ARCCN
 
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchangeПрактическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange
ARCCN
 
SDN and NFV в банковской сфере
SDN and NFV в банковской сфереSDN and NFV в банковской сфере
SDN and NFV в банковской сфере
Victoria Kalinina
 
Mininet CE
Mininet CEMininet CE
Mininet CEARCCN
 
Разработки ЦПИКС в области SDN и NFV
Разработки ЦПИКС в области SDN и NFV Разработки ЦПИКС в области SDN и NFV
Разработки ЦПИКС в области SDN и NFV ARCCN
 
SDN&NFV: новые горизонты
SDN&NFV: новые горизонтыSDN&NFV: новые горизонты
SDN&NFV: новые горизонты
ARCCN
 
Проблематика создания OpenFlow контроллеров для SDN
Проблематика создания OpenFlow контроллеров для SDNПроблематика создания OpenFlow контроллеров для SDN
Проблематика создания OpenFlow контроллеров для SDNARCCN
 
Построение сетевых сервисов из виртуальных сетевых функций
Построение сетевых сервисов из виртуальных сетевых функцийПостроение сетевых сервисов из виртуальных сетевых функций
Построение сетевых сервисов из виртуальных сетевых функций
ARCCN
 
Решения Brocade для построения IP сетей будущего
Решения Brocade для построения IP сетей будущегоРешения Brocade для построения IP сетей будущего
Решения Brocade для построения IP сетей будущего
ARCCN
 
GRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network InitiativeGRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network Initiative
ARCCN
 
Развитие технологий построения распределенных ЦОД
Развитие технологий построения распределенных ЦОДРазвитие технологий построения распределенных ЦОД
Развитие технологий построения распределенных ЦОД
Cisco Russia
 
EZchip Open Flow switch by ARCCN
EZchip Open Flow switch by ARCCN  EZchip Open Flow switch by ARCCN
EZchip Open Flow switch by ARCCN
ARCCN
 

What's hot (20)

Внедрение SDN в сети телеком-оператора
Внедрение SDN в сети телеком-оператораВнедрение SDN в сети телеком-оператора
Внедрение SDN в сети телеком-оператора
 
Импортозамещение. Отечественное ПО на основе сетей нового поколения: SDN&NFV
Импортозамещение. Отечественное ПО на основе сетей нового поколения:  SDN&NFV Импортозамещение. Отечественное ПО на основе сетей нового поколения:  SDN&NFV
Импортозамещение. Отечественное ПО на основе сетей нового поколения: SDN&NFV
 
RUNOS OpenFlow controller (ru)
RUNOS OpenFlow controller (ru)RUNOS OpenFlow controller (ru)
RUNOS OpenFlow controller (ru)
 
SDN & NFV: от абонента до Internet eXchange
SDN & NFV: от абонента до Internet eXchangeSDN & NFV: от абонента до Internet eXchange
SDN & NFV: от абонента до Internet eXchange
 
Управление корпоративной сетью на основе SDN-технологий
Управление корпоративной сетью на основе SDN-технологий Управление корпоративной сетью на основе SDN-технологий
Управление корпоративной сетью на основе SDN-технологий
 
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...
 
Об одном подходе переноса функциональности CPE устройств в ЦОД телеком оператора
Об одном подходе переноса функциональности CPE устройств в ЦОД телеком оператораОб одном подходе переноса функциональности CPE устройств в ЦОД телеком оператора
Об одном подходе переноса функциональности CPE устройств в ЦОД телеком оператора
 
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...
 
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...
 
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchangeПрактическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange
 
SDN and NFV в банковской сфере
SDN and NFV в банковской сфереSDN and NFV в банковской сфере
SDN and NFV в банковской сфере
 
Mininet CE
Mininet CEMininet CE
Mininet CE
 
Разработки ЦПИКС в области SDN и NFV
Разработки ЦПИКС в области SDN и NFV Разработки ЦПИКС в области SDN и NFV
Разработки ЦПИКС в области SDN и NFV
 
SDN&NFV: новые горизонты
SDN&NFV: новые горизонтыSDN&NFV: новые горизонты
SDN&NFV: новые горизонты
 
Проблематика создания OpenFlow контроллеров для SDN
Проблематика создания OpenFlow контроллеров для SDNПроблематика создания OpenFlow контроллеров для SDN
Проблематика создания OpenFlow контроллеров для SDN
 
Построение сетевых сервисов из виртуальных сетевых функций
Построение сетевых сервисов из виртуальных сетевых функцийПостроение сетевых сервисов из виртуальных сетевых функций
Построение сетевых сервисов из виртуальных сетевых функций
 
Решения Brocade для построения IP сетей будущего
Решения Brocade для построения IP сетей будущегоРешения Brocade для построения IP сетей будущего
Решения Brocade для построения IP сетей будущего
 
GRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network InitiativeGRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network Initiative
 
Развитие технологий построения распределенных ЦОД
Развитие технологий построения распределенных ЦОДРазвитие технологий построения распределенных ЦОД
Развитие технологий построения распределенных ЦОД
 
EZchip Open Flow switch by ARCCN
EZchip Open Flow switch by ARCCN  EZchip Open Flow switch by ARCCN
EZchip Open Flow switch by ARCCN
 

Viewers also liked

блок 2
блок 2блок 2
блок 2
Alexander Babich
 
5 i2c spi
5 i2c spi5 i2c spi
5 i2c spi
Sergey Savkin
 
Solaris 11 новые возможности. а. павленко. зал 2
Solaris 11   новые возможности. а. павленко. зал 2Solaris 11   новые возможности. а. павленко. зал 2
Solaris 11 новые возможности. а. павленко. зал 2rit2011
 
Materinskie_platy
Materinskie_platyMaterinskie_platy
Materinskie_platy
Andrey_Ivanilov
 
Илья Щербак, Eltex
Илья Щербак, EltexИлья Щербак, Eltex
Илья Щербак, Eltex
Ontico
 
Тюним память и сетевой стек в Linux: история перевода высоконагруженных сер...
Тюним память  и сетевой стек в Linux: история перевода высоконагруженных  сер...Тюним память  и сетевой стек в Linux: история перевода высоконагруженных  сер...
Тюним память и сетевой стек в Linux: история перевода высоконагруженных сер...
Dmitry Samsonov
 
презентация7
презентация7презентация7
презентация7student_kai
 

Viewers also liked (9)

Chipset
ChipsetChipset
Chipset
 
блок 2
блок 2блок 2
блок 2
 
5 i2c spi
5 i2c spi5 i2c spi
5 i2c spi
 
Solaris 11 новые возможности. а. павленко. зал 2
Solaris 11   новые возможности. а. павленко. зал 2Solaris 11   новые возможности. а. павленко. зал 2
Solaris 11 новые возможности. а. павленко. зал 2
 
VMware VSphere 5.0
VMware VSphere 5.0VMware VSphere 5.0
VMware VSphere 5.0
 
Materinskie_platy
Materinskie_platyMaterinskie_platy
Materinskie_platy
 
Илья Щербак, Eltex
Илья Щербак, EltexИлья Щербак, Eltex
Илья Щербак, Eltex
 
Тюним память и сетевой стек в Linux: история перевода высоконагруженных сер...
Тюним память  и сетевой стек в Linux: история перевода высоконагруженных  сер...Тюним память  и сетевой стек в Linux: история перевода высоконагруженных  сер...
Тюним память и сетевой стек в Linux: история перевода высоконагруженных сер...
 
презентация7
презентация7презентация7
презентация7
 

Similar to Проблематика создания высокодоступной сетевой операционной системы для SDN-сетей

Надежность World of Tanks Server
Надежность World of Tanks ServerНадежность World of Tanks Server
Надежность World of Tanks Server
Levon Avakyan
 
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...
ForkConf
 
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)
AvitoTech
 
Другая виртуализация
Другая виртуализацияДругая виртуализация
Другая виртуализация
Yandex
 
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Fwdays
 
Веб-сервер Phantom
Веб-сервер PhantomВеб-сервер Phantom
Веб-сервер Phantom
yaevents
 
владивосток форум производительность_ha
владивосток форум производительность_haвладивосток форум производительность_ha
владивосток форум производительность_ha
Elena Ometova
 
«Механизмы обновления платформы и окружений пользователей в Jelastic»
«Механизмы обновления платформы и окружений пользователей в Jelastic»«Механизмы обновления платформы и окружений пользователей в Jelastic»
«Механизмы обновления платформы и окружений пользователей в Jelastic»
Nata_Churda
 
Средства обеспечения высокой доступности сервисов в RHEL
Средства обеспечения высокой доступности сервисов в RHELСредства обеспечения высокой доступности сервисов в RHEL
Средства обеспечения высокой доступности сервисов в RHELAndrey Markelov
 
Building deployment pipeline - DevOps way
Building deployment pipeline - DevOps wayBuilding deployment pipeline - DevOps way
Building deployment pipeline - DevOps wayAndrey Rebrov
 
Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)
Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)
Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)
Ontico
 
Объединенная вычислительная система Cisco UCS. Часть 1.
Объединенная вычислительная система Cisco UCS. Часть 1.Объединенная вычислительная система Cisco UCS. Часть 1.
Объединенная вычислительная система Cisco UCS. Часть 1.Cisco Russia
 
Оптимизация сервера потокового видеовещания (Дмитрий Шатров)
Оптимизация сервера потокового видеовещания (Дмитрий Шатров)Оптимизация сервера потокового видеовещания (Дмитрий Шатров)
Оптимизация сервера потокового видеовещания (Дмитрий Шатров)Ontico
 
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)
Ontico
 
Практика внедрения виртуализированной сетевой инфраструктуры
Практика внедрения виртуализированной сетевой инфраструктуры Практика внедрения виртуализированной сетевой инфраструктуры
Практика внедрения виртуализированной сетевой инфраструктуры Cisco Russia
 
Пакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностей
Пакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностейПакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностей
Пакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностей
Cisco Russia
 
Распределенная система тестирования машинного перевода
Распределенная система тестирования машинного переводаРаспределенная система тестирования машинного перевода
Распределенная система тестирования машинного перевода
yaevents
 
Модификации KVM для работы в кластере, Андрей Шетухин
Модификации KVM для работы в кластере, Андрей ШетухинМодификации KVM для работы в кластере, Андрей Шетухин
Модификации KVM для работы в кластере, Андрей Шетухин
Ontico
 

Similar to Проблематика создания высокодоступной сетевой операционной системы для SDN-сетей (20)

Treukhov mclags
Treukhov mclagsTreukhov mclags
Treukhov mclags
 
Надежность World of Tanks Server
Надежность World of Tanks ServerНадежность World of Tanks Server
Надежность World of Tanks Server
 
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...
 
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)
 
Другая виртуализация
Другая виртуализацияДругая виртуализация
Другая виртуализация
 
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
 
Веб-сервер Phantom
Веб-сервер PhantomВеб-сервер Phantom
Веб-сервер Phantom
 
владивосток форум производительность_ha
владивосток форум производительность_haвладивосток форум производительность_ha
владивосток форум производительность_ha
 
«Механизмы обновления платформы и окружений пользователей в Jelastic»
«Механизмы обновления платформы и окружений пользователей в Jelastic»«Механизмы обновления платформы и окружений пользователей в Jelastic»
«Механизмы обновления платформы и окружений пользователей в Jelastic»
 
Средства обеспечения высокой доступности сервисов в RHEL
Средства обеспечения высокой доступности сервисов в RHELСредства обеспечения высокой доступности сервисов в RHEL
Средства обеспечения высокой доступности сервисов в RHEL
 
Building deployment pipeline - DevOps way
Building deployment pipeline - DevOps wayBuilding deployment pipeline - DevOps way
Building deployment pipeline - DevOps way
 
Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)
Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)
Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)
 
ПК КВГ
ПК КВГПК КВГ
ПК КВГ
 
Объединенная вычислительная система Cisco UCS. Часть 1.
Объединенная вычислительная система Cisco UCS. Часть 1.Объединенная вычислительная система Cisco UCS. Часть 1.
Объединенная вычислительная система Cisco UCS. Часть 1.
 
Оптимизация сервера потокового видеовещания (Дмитрий Шатров)
Оптимизация сервера потокового видеовещания (Дмитрий Шатров)Оптимизация сервера потокового видеовещания (Дмитрий Шатров)
Оптимизация сервера потокового видеовещания (Дмитрий Шатров)
 
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)
 
Практика внедрения виртуализированной сетевой инфраструктуры
Практика внедрения виртуализированной сетевой инфраструктуры Практика внедрения виртуализированной сетевой инфраструктуры
Практика внедрения виртуализированной сетевой инфраструктуры
 
Пакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностей
Пакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностейПакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностей
Пакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностей
 
Распределенная система тестирования машинного перевода
Распределенная система тестирования машинного переводаРаспределенная система тестирования машинного перевода
Распределенная система тестирования машинного перевода
 
Модификации KVM для работы в кластере, Андрей Шетухин
Модификации KVM для работы в кластере, Андрей ШетухинМодификации KVM для работы в кластере, Андрей Шетухин
Модификации KVM для работы в кластере, Андрей Шетухин
 

More from ARCCN

Построение транспортных SDN сетей для операторов связи
Построение транспортных SDN сетей для операторов связиПостроение транспортных SDN сетей для операторов связи
Построение транспортных SDN сетей для операторов связи
ARCCN
 
Магистерская программа «Распределённые системы и компьютерные сети»
Магистерская программа «Распределённые системы и компьютерные сети»Магистерская программа «Распределённые системы и компьютерные сети»
Магистерская программа «Распределённые системы и компьютерные сети»
ARCCN
 
Особенности интеграции сторонних сервисов в облачную MANO платформу
Особенности интеграции сторонних сервисов в облачную MANO платформуОсобенности интеграции сторонних сервисов в облачную MANO платформу
Особенности интеграции сторонних сервисов в облачную MANO платформу
ARCCN
 
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...
ARCCN
 
Перспективы развития SDN  в МИЭТ на базе кафедры ТКС
Перспективы развития SDN  в МИЭТ на базе кафедры ТКСПерспективы развития SDN  в МИЭТ на базе кафедры ТКС
Перспективы развития SDN  в МИЭТ на базе кафедры ТКС
ARCCN
 
MetaCloud Computing Environment
MetaCloud Computing EnvironmentMetaCloud Computing Environment
MetaCloud Computing Environment
ARCCN
 
A Perspective on the Future of Computer Architecture
A Perspective on the  Future of Computer ArchitectureA Perspective on the  Future of Computer Architecture
A Perspective on the Future of Computer Architecture
ARCCN
 
Radical step in computer architecture
Radical step in computer architectureRadical step in computer architecture
Radical step in computer architecture
ARCCN
 
Типовые сервисы региональной сети передачи данных
Типовые сервисы региональной сети передачи данныхТиповые сервисы региональной сети передачи данных
Типовые сервисы региональной сети передачи данных
ARCCN
 
Разработка OpenFlow-коммутатора на базе сетевого процессора EZchip
Разработка OpenFlow-коммутатора на базе сетевого процессора EZchipРазработка OpenFlow-коммутатора на базе сетевого процессора EZchip
Разработка OpenFlow-коммутатора на базе сетевого процессора EZchip
ARCCN
 
Исследования SDN в Оренбургском государственном университете: сетевая безопас...
Исследования SDN в Оренбургском государственном университете: сетевая безопас...Исследования SDN в Оренбургском государственном университете: сетевая безопас...
Исследования SDN в Оренбургском государственном университете: сетевая безопас...
ARCCN
 
Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...
Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...
Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...
ARCCN
 
SDN и защищенные квантовые коммуникации
SDN и защищенные квантовые коммуникацииSDN и защищенные квантовые коммуникации
SDN и защищенные квантовые коммуникации
ARCCN
 
Отчет по проектах ЦПИКС
Отчет по проектах ЦПИКСОтчет по проектах ЦПИКС
Отчет по проектах ЦПИКС
ARCCN
 
Учебно-методическая работа по тематике ПКС и ВСС
Учебно-методическая работа по тематике ПКС и ВССУчебно-методическая работа по тематике ПКС и ВСС
Учебно-методическая работа по тематике ПКС и ВСС
ARCCN
 
Сети доставки контента и их место в архитектуре SDN/NFV
Сети доставки контента и их место в архитектуре SDN/NFVСети доставки контента и их место в архитектуре SDN/NFV
Сети доставки контента и их место в архитектуре SDN/NFV
ARCCN
 
Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...
Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...
Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...
ARCCN
 

More from ARCCN (17)

Построение транспортных SDN сетей для операторов связи
Построение транспортных SDN сетей для операторов связиПостроение транспортных SDN сетей для операторов связи
Построение транспортных SDN сетей для операторов связи
 
Магистерская программа «Распределённые системы и компьютерные сети»
Магистерская программа «Распределённые системы и компьютерные сети»Магистерская программа «Распределённые системы и компьютерные сети»
Магистерская программа «Распределённые системы и компьютерные сети»
 
Особенности интеграции сторонних сервисов в облачную MANO платформу
Особенности интеграции сторонних сервисов в облачную MANO платформуОсобенности интеграции сторонних сервисов в облачную MANO платформу
Особенности интеграции сторонних сервисов в облачную MANO платформу
 
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...
 
Перспективы развития SDN  в МИЭТ на базе кафедры ТКС
Перспективы развития SDN  в МИЭТ на базе кафедры ТКСПерспективы развития SDN  в МИЭТ на базе кафедры ТКС
Перспективы развития SDN  в МИЭТ на базе кафедры ТКС
 
MetaCloud Computing Environment
MetaCloud Computing EnvironmentMetaCloud Computing Environment
MetaCloud Computing Environment
 
A Perspective on the Future of Computer Architecture
A Perspective on the  Future of Computer ArchitectureA Perspective on the  Future of Computer Architecture
A Perspective on the Future of Computer Architecture
 
Radical step in computer architecture
Radical step in computer architectureRadical step in computer architecture
Radical step in computer architecture
 
Типовые сервисы региональной сети передачи данных
Типовые сервисы региональной сети передачи данныхТиповые сервисы региональной сети передачи данных
Типовые сервисы региональной сети передачи данных
 
Разработка OpenFlow-коммутатора на базе сетевого процессора EZchip
Разработка OpenFlow-коммутатора на базе сетевого процессора EZchipРазработка OpenFlow-коммутатора на базе сетевого процессора EZchip
Разработка OpenFlow-коммутатора на базе сетевого процессора EZchip
 
Исследования SDN в Оренбургском государственном университете: сетевая безопас...
Исследования SDN в Оренбургском государственном университете: сетевая безопас...Исследования SDN в Оренбургском государственном университете: сетевая безопас...
Исследования SDN в Оренбургском государственном университете: сетевая безопас...
 
Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...
Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...
Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...
 
SDN и защищенные квантовые коммуникации
SDN и защищенные квантовые коммуникацииSDN и защищенные квантовые коммуникации
SDN и защищенные квантовые коммуникации
 
Отчет по проектах ЦПИКС
Отчет по проектах ЦПИКСОтчет по проектах ЦПИКС
Отчет по проектах ЦПИКС
 
Учебно-методическая работа по тематике ПКС и ВСС
Учебно-методическая работа по тематике ПКС и ВССУчебно-методическая работа по тематике ПКС и ВСС
Учебно-методическая работа по тематике ПКС и ВСС
 
Сети доставки контента и их место в архитектуре SDN/NFV
Сети доставки контента и их место в архитектуре SDN/NFVСети доставки контента и их место в архитектуре SDN/NFV
Сети доставки контента и их место в архитектуре SDN/NFV
 
Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...
Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...
Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...
 

Проблематика создания высокодоступной сетевой операционной системы для SDN-сетей

  • 1. HA-платформа управления для программно-конфигурируемых сетей Пашков Василий, программист-разработчик ЦПИКС
  • 2. Высокая доступность (High Availability, HA) 23.09.2015 vpashkov@arccn.ru 2 • Сеть работает в режиме 365/24/7. • Платформа управления ПКС должна работать непрерывно. • Цель обеспечения высокой готовности – поддержание непрерывной работоспособности платформы управления, сетевых приложений. • Причины простоя: обслуживание, программные и аппаратные ошибки, отказы оборудования, атаки, отключение электроэнергии, аварии. Коэффициент готовности, % Время простоя за год 99,999 5 минут 99,99 52 минуты 99,9 8,7 часов 99 3,7 дней
  • 3. Угрозы 23.09.2015 vpashkov@arccn.ru 3 Отказ контроллера Перегрузка контроллера Потеря соединения коммутатора с контроллером
  • 4. Стратегии резервирования /1 23.09.2015 vpashkov@arccn.ru 4 Active/Standby (Passive) стратегии: • Холодное [без синхронизации] • Теплое [периодическая синхронизация] • Горячее [постоянная синхронизация]
  • 5. Восстановление после отказа контроллера для случая горячего резервирования RUNOS 23.09.2015 vpashkov@arccn.ru 5 Особенности решения: • OpenFlow ≥ 1.0 • Корпоративные сети. • Не масштабируется • Не полная утилизация вычислительных ресурсов Одиночный отказ контроллера+ - Потеря соединения коммутатора с контроллером - Перегрузка контроллера
  • 6. Стратегии резервирования /2 23.09.2015 vpashkov@arccn.ru 6 • Стратегии резервирования Active/Active – Ассиметричная – Симметричная • Высокая сложность [Требуется координация контроллеров, поддержка глобального состояния] • Высокая доступность [минимальное время простоя] • Высокая утилизация вычислительных ресурсов
  • 7. Возможности протокола OpenFlow 23.09.2015 vpashkov@arccn.ru 7 • Протокол OpenFlow 1.2: – Множество контроллеров – Механизм ролей – Роли: Master, Slave, Equal – По умолчанию: контроллер находится в роли Equal для коммутаторов. – Смена роли: OFPT_ROLE_REQUEST – Распределение ролей: возложено на контроллеры. OpenFlow 1.0, 1.1 OpenFlow 1.2 – 1.5
  • 8. Модель платформы управления 23.09.2015 vpashkov@arccn.ru 8 Задачи: 1. Как синхронизовать контроллеры? 2. Как определить начальное распределение коммутаторов по контроллерам? 3. Как перераспределить управление коммутаторами при одиночном отказе контроллера? 4. Как восстановить управление коммутатором при потере соединения с контроллером? 5. Как предотвратить перегрузку контроллера в платформе управления?
  • 9. Предположения модели Предположения: • Все контроллеры имеют одинаковую производительность. • Контроллер устанавливает правила только на те коммутаторы, для которых он является Master контроллером. • Инфраструктура доступа обеспечивает связь коммутаторов с каждым контроллером. Условие корректности решения: • В каждый момент времени для каждого коммутатора в сети должен быть определен только один Master контроллер. 23.09.2015 vpashkov@arccn.ru 9
  • 10. Задача 1: Синхронизация контроллеров • На основе Multi-Paxos • Обеспечивает одновременное одинаковое выполнение команд контроллеров • Команды: изменение Network View, установление новых потоков (чтение NV), изменение ролей контроллеров. 23.09.2015 vpashkov@arccn.ru 10 Add NodeAdd Flow... Журнал событий In-memory хранилище ДКА Контроллер [MASTER] Сервис синхронизации Событие Add NodeAdd Flow... Журнал событий ДКА Контроллер [SLAVE] Сервис синхронизации Add NodeAdd Flow... Журнал событий ДКА Контроллер [SLAVE] Сервис синхронизации Сегмент Network 1 Сегмент Network 2 Сегмент Network 3 Состояние Network View 1 In-memory хранилище Состояние Network View 1 In-memory хранилище Состояние Network View 1 Proposer Acceptor Acceptor Acceptor
  • 11. Задача 2: Начальное распределение коммутаторов по контроллерам 23.09.2015 vpashkov@arccn.ru 11 • Критерий определения Master-контроллера: – Задержка от коммутатора до контроллера, как мера близости. • Ограничение: на количество коммутаторов в сегменте контроллера. • Решение: Жадный алгоритм по значению задержки от коммутатора до контроллеров.
  • 12. Задача 3: Выработка и представление сценариев восстановления 23.09.2015 vpashkov@arccn.ru 12 • Проактивная разработка сценариев восстановления • Критерий выбора нового распределения: задержка от коммутатора до контроллера • Алгоритм Балаша. • Результат: перечень сценариев для каждого контроллера платформы управления.
  • 13. Задача 3: Использование сценария для восстановления ПУ после отказа контроллера 23.09.2015 vpashkov@arccn.ru 13 1. Оставшимися контроллерами фиксируется факт отказа контроллера и CID. 2. Каждый контроллер выбирает сценарий восстановления, соответствующий отказу контроллера CID. 3. В соответствии со сценарием каждый контроллер изменяет свою роль на коммутаторах. 4. Каждый контроллера информирует остальные контроллеры о завершении выполнения сценария восстановления.
  • 14. Задача 4: Восстановление при потере соединения коммутатора с контроллером 23.09.2015 vpashkov@arccn.ru 14 1. Фиксируется отключение коммутатора Master- контроллером. 2. Инициируется проверка присутствия коммутатора в сети. 3. Осуществляется измерении задержки контроллерами, поддерживающими связь с коммутатором. 4. Master-контроллером становится контроллер с минимальной задержкой до коммутатора. 5. Новый Master-контроллер устанавливает свою роль на коммутаторе. Отказ коммутатора или потеря соединения? ??
  • 15. Задача 5: Предотвращение перегрузки контроллера платформы управления 23.09.2015 vpashkov@arccn.ru 15 Для обнаружения перегрузки: • Устанавливаются пороговые значения параметров загрузки контроллеров. • Осуществляется постоянный мониторинг загрузки контроллеров [количество коммутаторов, количество packet- in запросов в секунду, CPU, память] • Факт перегрузки фиксируется при обнаружении превышения порогового значения. Задача перераспределения коммутаторов по контроллерам: Необходимо перераспределить коммутаторы так, чтобы: 1. Нагрузка на каждый из контроллеров не превышала его производительности 2. Использовалось минимальное количество контроллеров. 3. При перестроении управления сетью было проведено минимальное количество передач управления коммутаторами.
  • 16. Задача 5: Передача управления коммутатором 23.09.2015 vpashkov@arccn.ru 16 • Свойство живучести: В любой момент времени для коммутатора существует контроллер, работающий в режиме Master. Для любой асинхронной команды, контроллер, который ее отправил, остается активным до тех пор, пока коммутатор не закончит ее обработку. • Свойство безопасности: Ровно один контроллер обрабатывает каждое асинхронное сообщение от коммутатора.
  • 17. Задача 5: Распределение коммутаторов по группам 23.09.2015 vpashkov@arccn.ru 17 • Входные данные: – Топология сети – Количество новых потоков с каждого коммутатора – Максимально допустимая нагрузка на контроллер P • Алгоритм разбиения графа на компоненты связности, чтобы суммарная нагрузка компоненты связности не превышала P. • Выходные данные: – Матрица, определяющая Master-контроллеры для коммутаторов и сегменты управления для каждого контроллера.
  • 18. Задача 5: Распределение групп коммутаторов по контроллерам 23.09.2015 vpashkov@arccn.ru 18 • Входные данные: – Текущая матрица распределения управления коммутаторами по контроллерам. – Желаемая матрица распределения управления коммутаторами. • Алгоритм: жадный алгоритм, минимизирующий количество передач управления коммутаторами между контроллерами платформы управления. • Выходные данные: – Список операций по передаче управления отдельными коммутаторами.
  • 19. Выводы 23.09.2015 vpashkov@arccn.ru 19 • Проект RUNOS (C++, OF 1.3) https://github.com/ARCCN/runos • RUNOS с поддержкой Active/Standby стратегии горячего резервирования для небольших сетей [в открытый доступ] • RUNOS с поддержкой стратегии Active/Active  Оптимизация разработанных алгоритмов  Разработка распределенных приложений

Editor's Notes

  1. Решение с горячим резервированием не масштабируется, Можно использовать для небольших корпоративных сетей, сетей предприятий
  2. Почему не масштабируется Решение с горячим резервированием не масштабируется, Можно использовать для небольших корпоративных сетей, сетей предприятий В реальных проектах мы используем эту схему резервирования для небольших сетей.