Создание и развитие отечественной платформы с открытым программным кодом для ...ARCCN
Доклад в рамках Международной конференции «Управление сетями электросвязи. Программно-конфигурируемые сети и виртуализация сетевых функций – SDN&NFV Russia 2016».
Отечественные решения на базе SDN и NFV для телеком-операторовARCCN
Доклад Р.Л. Смелянского на секции "Инновационные информационно-телекоммуникационные технологии в вооруженных силах Российской Федерации. Программно-конфигурируемые сети (SDN). Области применения и особенности внедрения" Форума Армия-2016
Возможности импортозамещения коммутационного оборудования в сетях нового пок...ARCCN
Доклад Вячеслава Васина, директор департамента сетевых решений ЦПИКС, на конференции "Локализация производства и импортозамещение коммуникационного и радиоэлектронного оборудования, приборов и устройств для ИКТ отрасли России", 15 февраля 2017 года.
Open Ethernet - открытый подход к построению Ethernet сетейARCCN
В рамках вебинара системный инженер Mellanox Technologies Александр Петровский представил доклад на тему "Open Ethernet - открытый подход к построению Ethernet сетей". Он рассказал об инициативе Mellanox Open Ethernet, которая привносит принципы Open Source в мир сетей и позволяет выбирать лучшее аппаратное и программное обеспечение для построения сетевой инфраструктуры на базе открытых протоколов и технологий, предоставляя заказчикам новые возможности управления сетями в рамках концепции SDN.
Доклад Виталия Антоненко (ЦПИКС) на семинаре Консорциума университетов по изучению и развитию передовых технологий в сфере компьютерных сетей. 20 октября 2016 года
Создание и развитие отечественной платформы с открытым программным кодом для ...ARCCN
Доклад в рамках Международной конференции «Управление сетями электросвязи. Программно-конфигурируемые сети и виртуализация сетевых функций – SDN&NFV Russia 2016».
Отечественные решения на базе SDN и NFV для телеком-операторовARCCN
Доклад Р.Л. Смелянского на секции "Инновационные информационно-телекоммуникационные технологии в вооруженных силах Российской Федерации. Программно-конфигурируемые сети (SDN). Области применения и особенности внедрения" Форума Армия-2016
Возможности импортозамещения коммутационного оборудования в сетях нового пок...ARCCN
Доклад Вячеслава Васина, директор департамента сетевых решений ЦПИКС, на конференции "Локализация производства и импортозамещение коммуникационного и радиоэлектронного оборудования, приборов и устройств для ИКТ отрасли России", 15 февраля 2017 года.
Open Ethernet - открытый подход к построению Ethernet сетейARCCN
В рамках вебинара системный инженер Mellanox Technologies Александр Петровский представил доклад на тему "Open Ethernet - открытый подход к построению Ethernet сетей". Он рассказал об инициативе Mellanox Open Ethernet, которая привносит принципы Open Source в мир сетей и позволяет выбирать лучшее аппаратное и программное обеспечение для построения сетевой инфраструктуры на базе открытых протоколов и технологий, предоставляя заказчикам новые возможности управления сетями в рамках концепции SDN.
Доклад Виталия Антоненко (ЦПИКС) на семинаре Консорциума университетов по изучению и развитию передовых технологий в сфере компьютерных сетей. 20 октября 2016 года
This talk (in Russian) is about RUNOS OpenFlow controller publicly available at https://github.com/ARCCN/runos. Feel free to contact me if you have questions.
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...ARCCN
Руслан Леонидович Смелянский выступил на Пленарном заседании ИнфоФорума в г. Орёл в качестве независимого эксперта и представил доклад на тему «Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (SDN&NFV): новые возможности для импортозамещения в телекоммуникациях». В рамках своего доклада он рассказал об экономике эксплуатации и проблемах современных компьютерных сетей операторов, остановился на необходимости изменения бизнес-модели в новых реалиях, а также представил своё видение того, какие возможности открывает использование технологий SDN и NFV для импортозамещения.
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...ARCCN
Доклад Александра Герасимова и Евгения Лашманова, Московский государственный технический университет радиотехники, электроники и автоматики (МГТУ МИРЭА), на ежегодном собрании участников Консорциума по SDN технологиям, мая 2017 года
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchangeARCCN
Сергей Монин — руководитель Центра Тестирования решений в области SDN/NFV компании Центр прикладных исследований компьютерных сетей (ЦПИКС) с докладом «Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange»
Руслан Смелянский — директор ЦПИКС, профессор МГУ им. Ломоносова, д.ф-м.н., член-корр. РАН — «SDN&NFV: новые горизонты»:
— Изменение бизнес-модели ИТ
— Симбиоз SDN и NFV
— Transport SDN
— Оптические сети
— Mobile SDN
— SDN-безопастность
— Конвергентная сеть
— Новые ниши для SDN И NFV
Построение сетевых сервисов из виртуальных сетевых функцийARCCN
Виталий Антоненко, ЦПИКС, рассказал о построении виртуального сетевого сервиса (цепочек сетевых функций, VNF) в облачной инфраструктуре телеком-оператора. Был представлен способ организации спецификации виртуального сетевого сервиса (создания цепочек VNF), с возможностями гибкого управления, масштабирования и выстраивания четкой иерархии VNF между собой.
Инфраструктура телекома отличается от облачного центра обработки расположением потребителей сервиса и объектами обработки – это потоки трафика. Система управления и мониторинга облака внутри инфраструктуры телекома позволяет обеспечивать масштабируемость и доступность сервиса. Актуальным является вопрос управления процессом построения сетевого сервиса из VNF, а также управления инфраструктурой телекома при описании сетевого сервиса и повторного использования спецификаций уже составленных VNF.
Решения Brocade для построения IP сетей будущегоARCCN
Николай Аторин — технический эксперт Brocade — о своем видении сетей будущего, как они будут строиться и работать в ближайшее время, что является двигателем таких изменений и какие решения уже сегодня существуют у производителей.
This talk (in Russian) is about RUNOS OpenFlow controller publicly available at https://github.com/ARCCN/runos. Feel free to contact me if you have questions.
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...ARCCN
Руслан Леонидович Смелянский выступил на Пленарном заседании ИнфоФорума в г. Орёл в качестве независимого эксперта и представил доклад на тему «Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (SDN&NFV): новые возможности для импортозамещения в телекоммуникациях». В рамках своего доклада он рассказал об экономике эксплуатации и проблемах современных компьютерных сетей операторов, остановился на необходимости изменения бизнес-модели в новых реалиях, а также представил своё видение того, какие возможности открывает использование технологий SDN и NFV для импортозамещения.
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...ARCCN
Доклад Александра Герасимова и Евгения Лашманова, Московский государственный технический университет радиотехники, электроники и автоматики (МГТУ МИРЭА), на ежегодном собрании участников Консорциума по SDN технологиям, мая 2017 года
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchangeARCCN
Сергей Монин — руководитель Центра Тестирования решений в области SDN/NFV компании Центр прикладных исследований компьютерных сетей (ЦПИКС) с докладом «Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange»
Руслан Смелянский — директор ЦПИКС, профессор МГУ им. Ломоносова, д.ф-м.н., член-корр. РАН — «SDN&NFV: новые горизонты»:
— Изменение бизнес-модели ИТ
— Симбиоз SDN и NFV
— Transport SDN
— Оптические сети
— Mobile SDN
— SDN-безопастность
— Конвергентная сеть
— Новые ниши для SDN И NFV
Построение сетевых сервисов из виртуальных сетевых функцийARCCN
Виталий Антоненко, ЦПИКС, рассказал о построении виртуального сетевого сервиса (цепочек сетевых функций, VNF) в облачной инфраструктуре телеком-оператора. Был представлен способ организации спецификации виртуального сетевого сервиса (создания цепочек VNF), с возможностями гибкого управления, масштабирования и выстраивания четкой иерархии VNF между собой.
Инфраструктура телекома отличается от облачного центра обработки расположением потребителей сервиса и объектами обработки – это потоки трафика. Система управления и мониторинга облака внутри инфраструктуры телекома позволяет обеспечивать масштабируемость и доступность сервиса. Актуальным является вопрос управления процессом построения сетевого сервиса из VNF, а также управления инфраструктурой телекома при описании сетевого сервиса и повторного использования спецификаций уже составленных VNF.
Решения Brocade для построения IP сетей будущегоARCCN
Николай Аторин — технический эксперт Brocade — о своем видении сетей будущего, как они будут строиться и работать в ближайшее время, что является двигателем таких изменений и какие решения уже сегодня существуют у производителей.
Пятое занятие курса по программированию микроконтроллеров stm32. На занятии рассказано про два популярных протокола обмена информацией. I2C с подключением акселерометра, температурного датчика и гироскопа. SPI с подключением RFID модуля.
Тюним память и сетевой стек в Linux: история перевода высоконагруженных сер...Dmitry Samsonov
В процессе обновления высоконагруженных серверов раздачи видео (40Gbit/s с каждого сервера) со старого OpenSuSE 10.2 на новый CentOS 7 (время между релизами - 7 лет) мы столкнулись с рядом проблем - необъяснимый свопинг и запуски OOM killer, неравномерное распределение нагрузки по ядрам, обрывы соединений, скачки системной нагрузки на CPU.
В докладе будет рассказано о том, как мы боролись с этими проблемами и какие технологии для этого использовали.
В докладе я расскажу, как выглядит World of Tanks Server (кластер кластеров) со всеми веб-сервисами, которые существуют вокруг. Какие узкие места с точки зрения отказоустойчивости есть внутри кластера, между кластерами, во взаимодействии с внешними веб-сервисами. Как мы решаем возникающие проблемы технически, процессно, проектно.
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)AvitoTech
Порой в процессе развития высоконагруженного проекта наступает момент, когда необходимо масштабирование. Возможно, ваш проект впервые упёрся в производительность железа (и таким образом перешёл в разряд высоконагруженных); возможно, это уже не первое масштабирование — не важно. Какие же проблемы могут возникнуть?
Во-первых, если вы увеличиваете количество бэкенд-серверов, и, соответственно, количество рабочих процессов, то с ростом количества одновременных клиентских подключений вырастают и накладные расходы на базах данных.
Во-вторых, достаточно быстро может кончиться ресурс in-memory баз данных. Потребуется создать (либо увеличить) кластер, а это каждый раз влечёт за собой необходимость модифицировать логику приложения.
В-третьих, чем больше серверов, тем больше вероятность, что один из них выйдет из строя. Поэтому неплохо задуматься о том, как обеспечить отказоустойчивость, а это, опять же, потребует модифицировать логику приложения.
В этом докладе я расскажу, как и какими инструментами можно легко решить все вышеперечисленные проблемы: уменьшить накладные расходы от большого количества подключений к базам данных, создать/модифицировать кластер БД прозрачно для приложения, а также прозрачно добавить устойчивость к падениям серверов БД.
Модным ныне словом «виртуализация» сейчас называют различные обёртки аппаратной виртуализации, однако этот термин намного старше и более всеохватывающий. На уровне ознакомления с технологией мы поговорим о виртуализации ресурсов в кластере и на примере pacemaker.
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"Fwdays
- как ошибка выбора идентификатора пользователя, обнаруженная после запуска проекта, чуть не стоила 2 лет разработки
- как мы боролись с перегруженным mysql когда даже включение binlog убивает сервер
- почистил партицию mysql под нагрузкой - получи мертвый сервер
- как верстальщик поменял верстку серча и уложил продукт на 4 часа
- ошибка в ядре php которая привела даунтайм на несколько часов
- как незнание особенностей работы GC у redis обошлось в $50к чистой прибыли
- добавлением или удалением серверов из пула memcached инвалидировали весь кэш (кривые настройки php клиента Memcache/Memcached)
- как поправив тест потерять 2 миллиона пользовательских писем
- как релиз одного проекта крэшил хелсчеки соседнего проекта
- самый большой фейл с системами очередей и статистикой: ивенты терялись годами
При проектировании нагруженных систем приходится сталкиваться с тем, что разные типы запросов к веб-серверам затрачивают разное количество ресурсов, выполняются за разное количество времени и имеют разные приоритеты выполнения. Некоторые запросы «стоят» мало и должны выполняться как можно быстрее. Некоторые «стоят» дорого, и главное, чтобы они не блокировали обработку быстрых запросов. Существующие схемы приоритезации показались нам громоздкими и неудобными – при росте количества типов запросов конфигурация системы усложнялась в разы. Поэтому, чтобы решить эту проблему, а также для того, чтобы сделать ответы на запросы еще более быстрыми, мы написали свой веб-сервер – Phantom. Я расскажу вам, как он устроен, покажу, какие задачи можно решать с его помощью, а в завершение покажу на практике, как работает приоритезация разных типов запросов, используя для этого инструмент нагрузочного тестирования, основанный на Phantom.
Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)Ontico
Порой в процессе развития высоконагруженного проекта наступает момент, когда необходимо масштабирование. Возможно, ваш проект впервые упёрся в производительность железа (и таким образом перешёл в разряд высоконагруженных); возможно, это уже не первое масштабирование — не важно. Какие же проблемы могут возникнуть?
Во-первых, если вы увеличиваете количество бэкенд-серверов, и, соответственно, количество рабочих процессов, то с ростом количества одновременных клиентских подключений вырастают и накладные расходы на базах данных.
Во-вторых, достаточно быстро может кончиться ресурс in-memory баз данных. Потребуется создать (либо увеличить) кластер, а это каждый раз влечёт за собой необходимость модифицировать логику приложения.
В-третьих, чем больше серверов, тем больше вероятность, что один из них выйдет из строя. Поэтому неплохо задуматься о том, как обеспечить отказоустойчивость, а это, опять же, потребует модифицировать логику приложения.
В этом докладе я расскажу, как и какими инструментами можно легко решить все вышеперечисленные проблемы: уменьшить накладные расходы от большого количества подключений к базам данных, создать/модифицировать кластер БД прозрачно для приложения, а также прозрачно добавить устойчивость к падениям серверов БД.
План доклада:
- Введение. Методы масштабирования БД: репликация, шардирование.
- Создаём шардированные кластеры in-memory БД прозрачно для приложений: Twemproxy, Redis-proxy, Mcrouter.
- Уменьшаем накладные расходы от большого количества одновременных подключений на PostgreSQL с помощью PgBouncer.
- Создаём шардированный кластер PostgreSQL с помощью PL/Proxy.
- Добавляем прозрачную для приложения отказо�
Распределенная система тестирования машинного переводаyaevents
В докладе рассмотрены принципы построения распределенных систем на примере системы тестирования машинного перевода. Под распределенной системой понимается система использующая большое количество компьютеров для решения задач, требующих очень большого количества процессорного времени. Особое внимание уделено вопросам отказоустойчивости и масштабируемости системы.
Магистерская программа «Распределённые системы и компьютерные сети»ARCCN
Доклад Смелянского Руслана Леонидовича, чл.-корр. РАН, профессор, д.ф.-м-.н., МГУ им. М.В.Ломоносова, факультет ВМК, Кафедра АСВК, Лаборатория Вычислительных Комплексов, на ежегодном заседании участников Консорциума университетов по SDN технологиям, май 2017
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...ARCCN
Доклад Перепелкина Дмитрия, к.т.н., доцент кафедры САПР ВС Рязанский государственный радиотехнический университет, Центр инновационных сетевых и облачных технологий, на ежегодном заседании Участников Косорциума университетов по SDN технологиям, май 2017 года
The document summarizes the MC2E (MetaCloud Computing Environment) project, which aims to create a unified cloud computing platform that interconnects different data centers and heterogeneous computing resources. It describes the main components of the MC2E platform, including a meta-orchestrator, orchestrators, service managers, and a web portal. It also outlines the service lifecycle management process and discusses cooperation with international partners to further develop the MC2E platform and its capabilities.
A Perspective on the Future of Computer ArchitectureARCCN
The document discusses the challenges with today's superscalar computer architectures and proposes ideas for future computer architectures. It summarizes the author's experience building real computers in the past, including some of the first implementations of out-of-order execution and VLIW. It then outlines drawbacks of the superscalar paradigm and discusses moving towards an algorithmically oriented post-superscalar era. The author proposes designing an unconstrained "best possible" new architecture first before adding constraints for compatibility.
The document describes several radical steps in computer architecture that were implemented by the author's team before the industry, including carry save arithmetic in 1954 and the Elbrus computer architecture in 1978. It discusses drawbacks of current superscalar architectures and outlines the principles of a proposed "best possible computer system" with support for high-level programming, fine-grained parallelism, dynamic data types, and full security through capability features. Key aspects are a new universal programming language, a compiler with full algorithm and hardware information, and hardware designed for optimization rather than artificial constraints.
Типовые сервисы региональной сети передачи данныхARCCN
Доклад Вячеслава Васина (ЦПИКС) на семинаре Консорциума университетов по изучению и развитию передовых технологий в сфере компьютерных сетей. 20 октября 2016 года
Разработка OpenFlow-коммутатора на базе сетевого процессора EZchipARCCN
Доклад Васина Вячеслава (ЦПИКС) на семинаре Консорциума университетов по изучению и развитию передовых технологий в сфере компьютерных сетей. 20 октября 2016 года
Исследования SDN в Оренбургском государственном университете: сетевая безопас...ARCCN
Доклад Шухмана А.Е. (ОГУ) на семинаре Консорциума университетов по изучению и развитию передовых технологий в сфере компьютерных сетей. 20 октября 2016 года
Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...ARCCN
Доклад Бахтина А.А. (МИЭТ) на семинаре Консорциума университетов по изучению и развитию передовых технологий в сфере компьютерных сетей. 20 октября 2016 года
Доклад Садова О.Л. (ИТМО) на семинаре Консорциума университетов по изучению и развитию передовых технологий в сфере компьютерных сетей. 20 октября 2016 года
Доклад Смелянского Р.Л. на семинаре Консорциума университетов по изучению и развитию передовых технологий в сфере компьютерных сетей. 20 октября 2016 года
Учебно-методическая работа по тематике ПКС и ВССARCCN
Доклад Смелянского Р.Л. на семинаре Консорциума университетов по изучению и развитию передовых технологий в сфере компьютерных сетей. 20 октября 2016 года
Сети доставки контента и их место в архитектуре SDN/NFVARCCN
Ярослав Городецкий, генеральный директор CDNvideo, рассказал о принципе устройства и классификации сетей доставки контента (CDN), о состояние рынка услуг CDN и месте на нем телекоммуникационных операторов, а также о возможностях и перспективах применения сетей архитектуры SDN/NFV для оказания услуг доставки контента.
Компания CDNvideo – ведущий провайдер услуг сети доставки контента (CDN) в России и СНГ. Проект CDNvideo позволяет распространять контент через географически-распределенную сеть, тем самым решая проблему качественной и надежной доставки интернет-видео. В рамках исследований, проведенных компанией CDNvideo был найден алгоритм распределения нагрузки между распределенными серверами, позволяющий распространять интернет-видео в наилучшем качестве максимальному числу интернет-пользователей.
Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...ARCCN
Эдуард Василенко — директор по развитию решений SDN/NFV компании Huawei с докладом «Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных направлений: услуги, бизнес-процессы, технологии»
2. Высокая доступность (High Availability, HA)
23.09.2015 vpashkov@arccn.ru 2
• Сеть работает в режиме 365/24/7.
• Платформа управления ПКС должна работать непрерывно.
• Цель обеспечения высокой готовности – поддержание
непрерывной работоспособности платформы управления,
сетевых приложений.
• Причины простоя: обслуживание, программные и
аппаратные ошибки, отказы оборудования, атаки,
отключение электроэнергии, аварии.
Коэффициент готовности, % Время простоя за год
99,999 5 минут
99,99 52 минуты
99,9 8,7 часов
99 3,7 дней
5. Восстановление после отказа контроллера для
случая горячего резервирования RUNOS
23.09.2015 vpashkov@arccn.ru 5
Особенности решения:
• OpenFlow ≥ 1.0
• Корпоративные сети.
• Не масштабируется
• Не полная утилизация
вычислительных
ресурсов
Одиночный отказ контроллера+
- Потеря соединения коммутатора с контроллером
- Перегрузка контроллера
6. Стратегии резервирования /2
23.09.2015 vpashkov@arccn.ru 6
• Стратегии резервирования Active/Active
– Ассиметричная
– Симметричная
• Высокая сложность [Требуется координация контроллеров,
поддержка глобального состояния]
• Высокая доступность [минимальное время простоя]
• Высокая утилизация вычислительных ресурсов
7. Возможности протокола OpenFlow
23.09.2015 vpashkov@arccn.ru 7
• Протокол OpenFlow 1.2:
– Множество контроллеров
– Механизм ролей
– Роли: Master, Slave, Equal
– По умолчанию:
контроллер находится в
роли Equal для
коммутаторов.
– Смена роли:
OFPT_ROLE_REQUEST
– Распределение ролей:
возложено на
контроллеры.
OpenFlow 1.0, 1.1
OpenFlow 1.2 – 1.5
8. Модель платформы управления
23.09.2015 vpashkov@arccn.ru 8
Задачи:
1. Как синхронизовать
контроллеры?
2. Как определить начальное
распределение
коммутаторов по
контроллерам?
3. Как перераспределить
управление коммутаторами
при одиночном отказе
контроллера?
4. Как восстановить
управление коммутатором
при потере соединения с
контроллером?
5. Как предотвратить
перегрузку контроллера в
платформе управления?
9. Предположения модели
Предположения:
• Все контроллеры имеют одинаковую производительность.
• Контроллер устанавливает правила только на те
коммутаторы, для которых он является Master
контроллером.
• Инфраструктура доступа обеспечивает связь
коммутаторов с каждым контроллером.
Условие корректности решения:
• В каждый момент времени для каждого коммутатора в
сети должен быть определен только один Master
контроллер.
23.09.2015 vpashkov@arccn.ru 9
10. Задача 1: Синхронизация контроллеров
• На основе Multi-Paxos
• Обеспечивает одновременное одинаковое выполнение команд
контроллеров
• Команды: изменение Network View, установление новых потоков (чтение
NV), изменение ролей контроллеров.
23.09.2015 vpashkov@arccn.ru 10
Add NodeAdd Flow...
Журнал событий
In-memory
хранилище
ДКА
Контроллер
[MASTER]
Сервис синхронизации
Событие
Add NodeAdd Flow...
Журнал событий
ДКА
Контроллер
[SLAVE]
Сервис синхронизации
Add NodeAdd Flow...
Журнал событий
ДКА
Контроллер
[SLAVE]
Сервис синхронизации
Сегмент
Network 1
Сегмент
Network 2
Сегмент
Network 3
Состояние
Network View 1
In-memory
хранилище
Состояние
Network View 1
In-memory
хранилище
Состояние
Network View 1
Proposer Acceptor Acceptor Acceptor
11. Задача 2: Начальное распределение
коммутаторов по контроллерам
23.09.2015 vpashkov@arccn.ru 11
• Критерий определения Master-контроллера:
– Задержка от коммутатора до контроллера, как мера
близости.
• Ограничение:
на количество
коммутаторов в сегменте
контроллера.
• Решение:
Жадный алгоритм по
значению задержки от
коммутатора до
контроллеров.
12. Задача 3: Выработка и представление
сценариев восстановления
23.09.2015 vpashkov@arccn.ru 12
• Проактивная разработка
сценариев восстановления
• Критерий выбора нового
распределения: задержка
от коммутатора до
контроллера
• Алгоритм Балаша.
• Результат: перечень
сценариев для каждого
контроллера платформы
управления.
13. Задача 3: Использование сценария для
восстановления ПУ после отказа контроллера
23.09.2015 vpashkov@arccn.ru 13
1. Оставшимися
контроллерами
фиксируется факт отказа
контроллера и CID.
2. Каждый контроллер
выбирает сценарий
восстановления,
соответствующий отказу
контроллера CID.
3. В соответствии со
сценарием каждый
контроллер изменяет
свою роль на
коммутаторах.
4. Каждый контроллера
информирует остальные
контроллеры о
завершении выполнения
сценария
восстановления.
14. Задача 4: Восстановление при потере
соединения коммутатора с контроллером
23.09.2015 vpashkov@arccn.ru 14
1. Фиксируется отключение
коммутатора Master-
контроллером.
2. Инициируется проверка
присутствия коммутатора
в сети.
3. Осуществляется
измерении задержки
контроллерами,
поддерживающими связь
с коммутатором.
4. Master-контроллером
становится контроллер с
минимальной задержкой
до коммутатора.
5. Новый Master-контроллер
устанавливает свою роль
на коммутаторе.
Отказ
коммутатора
или потеря
соединения?
??
15. Задача 5: Предотвращение перегрузки
контроллера платформы управления
23.09.2015 vpashkov@arccn.ru 15
Для обнаружения перегрузки:
• Устанавливаются пороговые значения
параметров загрузки контроллеров.
• Осуществляется постоянный мониторинг
загрузки контроллеров
[количество коммутаторов, количество packet-
in запросов в секунду, CPU, память]
• Факт перегрузки фиксируется при
обнаружении превышения порогового
значения.
Задача перераспределения коммутаторов по контроллерам: Необходимо
перераспределить коммутаторы так, чтобы:
1. Нагрузка на каждый из контроллеров не превышала его производительности
2. Использовалось минимальное количество контроллеров.
3. При перестроении управления сетью было проведено минимальное
количество передач управления коммутаторами.
16. Задача 5: Передача управления
коммутатором
23.09.2015 vpashkov@arccn.ru 16
• Свойство живучести: В любой
момент времени для
коммутатора существует
контроллер, работающий в
режиме Master. Для любой
асинхронной команды,
контроллер, который ее
отправил, остается активным до
тех пор, пока коммутатор не
закончит ее обработку.
• Свойство безопасности: Ровно
один контроллер обрабатывает
каждое асинхронное
сообщение от коммутатора.
17. Задача 5: Распределение
коммутаторов по группам
23.09.2015 vpashkov@arccn.ru 17
• Входные данные:
– Топология сети
– Количество новых потоков с каждого коммутатора
– Максимально допустимая нагрузка на контроллер P
• Алгоритм разбиения графа на компоненты
связности, чтобы суммарная нагрузка компоненты
связности не превышала P.
• Выходные данные:
– Матрица, определяющая Master-контроллеры для
коммутаторов и сегменты управления для каждого
контроллера.
18. Задача 5: Распределение
групп коммутаторов по контроллерам
23.09.2015 vpashkov@arccn.ru 18
• Входные данные:
– Текущая матрица распределения управления
коммутаторами по контроллерам.
– Желаемая матрица распределения управления
коммутаторами.
• Алгоритм: жадный алгоритм, минимизирующий
количество передач управления коммутаторами
между контроллерами платформы управления.
• Выходные данные:
– Список операций по передаче управления отдельными
коммутаторами.
19. Выводы
23.09.2015 vpashkov@arccn.ru 19
• Проект RUNOS (C++, OF 1.3)
https://github.com/ARCCN/runos
• RUNOS с поддержкой Active/Standby стратегии
горячего резервирования для небольших сетей
[в открытый доступ]
• RUNOS с поддержкой стратегии Active/Active
Оптимизация разработанных алгоритмов
Разработка распределенных приложений
Решение с горячим резервированием не масштабируется,
Можно использовать для небольших корпоративных сетей, сетей предприятий
Почему не масштабируется
Решение с горячим резервированием не масштабируется,
Можно использовать для небольших корпоративных сетей, сетей предприятий
В реальных проектах мы используем эту схему резервирования для небольших сетей.