«Большие данные» и вы 
Помогая заказчикам перейти от слов к делу и превратить данные в 
ключевую ценность организации 
Арутюн Аветисян, 
ученый секретарь, Институт системного программирования РАН 
Павел Борох, 
менеджер по маркетингу корпоративных решений Dell в России, 
Казахстане и Центральной Азии
Domains 
Websites 
E-mail 
Источник: Qmee July 2013, http://blog.qmee.com/qmee-nlinein-60-seconds/ 
Каждую 
минуту 
каждый день… 
THOUSAND 
post s every 
second
Превратить данные в информацию, 
влияющую на принятие решений 
Спасти жизни Снизить издержки Удержать 
Медицина: решения в клиентов 
Производство стали: 
реальном времени для 
оптимизация 
предотвращения 
мониторинга, отчетов и 
опасных инфекций 
управления процессом. 
после операций. 
Индивидуализирован- 
ные предложения от 
сервис-провайдера. 
Превратить данные в краеугольный камень конкурентоспособности! 
Dell Solutions Forum 2014 
#DST2014
Danske Bank: решение 
для персонализированного 
обслуживания заказчиков 
“… современная программная платформа с превосходной 
производительностью, которая к тому же прекрасно 
соседствует с существующими ИТ-средствами, стала 
ключевым элементом для генерирования как 
сиюминутной, так и долгосрочной отдачи.” 
Йенс Х. Ипсен 
первый вице-президент и менеджер по развитию 
Задача: создать быстрое и точное 
решение для управления рисками и 
ранжирования в больших объемах 
данных и быстроизменяющейся среде. 
Решение: анализ данных и 
прогностическое моделирование с 
помощью Dell StatSoft Statistica 
позволили ускорить создание и просчет 
моделей финансовых рисков. 
Dell Solutions Forum 2014
Большие данные – это непросто 
 Различные, иногда противоречивые требования: 
 долговременное хранение, 
 обработка массовых запросов, 
 обработка потоков данных в режиме реального времени, 
 поддержка транзакций и др. 
 Соответствующие технологии должны в первую очередь 
обеспечивать производительность и масштабируемость 
Dell Solutions Forum 2014 
#DellST14
Технологии для больших данных сегодня 
• Возможность обеспечить технологическую независимость и 
снизить риски как на уровне компаний, так и государства: 
• Программное обеспечение – нет «серебряной пули», но 
существуют зрелые Open Source технологии: 
– Hadoop (HDFS, Map/Reduce) 
– Spark (in memory Big Data) 
– GridGain, Infinispan (In Memory Data Grid) 
– Hazelcast (Distributed Key-Value storage) 
– … 
• Аппаратура – все из компонент общего назначения (commodity) 
Dell Solutions Forum 2014 
#DellST14
Технологии для больших данных сегодня 
• Большой разрыв между существующими 
технологическими возможностями и их реальным 
использованием в индустрии 
• Постоянная необходимость в инновациях: 
– разработка и внедрение новых технологий 
– адаптация и развитие существующих под специфику 
прикладных областей 
• Основная проблема – отсутствие/нехватка экспертизы, 
соответствующих команд 
Dell Solutions Forum 2014 
#DellST14
Требуется наладить взаимодействие 
бизнеса и ИТ 
Совместно 
определить 
цели, 
требования, 
метрики 
Обеспечить 
сращивание с 
существующими 
системами и ПО 
Дать 
возможность 
реализовать 
пилотные 
проекты 
Экспертиза и наработки 
Dell Solutions Forum 2014 
#DellST14
Лаборатория, созданная Dell и ИСП РАН 
Аппаратное обеспечение Dell: 
Серверы Dell PowerEdge 
коммутаторы Dell Networking 
системы хранения данных 
(PowerVault MD3820i) 
СПО: 
OpenStack, Hadoop, 
GridGain, Apache Spark, Infinispan, 
Terracotta, Ehcache и др. 
Dell Software: Boomi, StatSoft и др. 
Web-лаборатория BigDataOpenLab (на 
базе платформы UniHUB) 
Dell Solutions Forum 2014 
#DellST14
Big Data Open Lab 
• Центр компетенций – создан с целью продвижения передового опыта и 
развития технологий в области «больших данных» в интересах российских 
организаций 
• Экосистема поддержки инноваций в области «больших данных»: 
– Обеспечение доступа к современным аппаратно-программным платформам 
– Поддержка передовых исследований и разработок 
– Внедрение в индустрию 
– Поддержка сообщества пользователей и разработчиков 
– Консалтинг и обучение 
Dell Solutions Forum 2014 
#DellST14
Опыт ИСП РАН 
Технологическая платформа UniHUB 
 Создана технологическая платформа, реализующая в полном объеме 
концепцию web-ориентированных научно-производственных центров 
 Платформа полностью базируется на свободном ПО (основа 
OpenStack) 
 Платформа развернута в 
ЦОД ВЦ им. А.А. Дородницына РАН 
 Пользователи могут создавать и разворачивать свои собственные 
сервисы в рамках единой платформы, в том числе создавать web- 
ориентированные научно-производственные центры в конкретных 
предметных областях 
 Web-лаборатории: 
1) Механика сплошных сред (МСС) 
2) Системное программирование 
3) ГИС 
Dell Solutions Forum 2014 
#DellST14
Опыт ИСП РАН 
• Создан экспериментальный стенд для моделирования трафика до 100Гб/с (данные 
располагаются на HDD, используется iSCSI и собственное ПО). 
• Создана программная инфраструктура для хранения и обработки данных в задачах 
Dell Solutions Forum 2014 
#DellST14 
вычислительной биологии. 
• Сейчас реализована задача предсказания сайтов связывания транскрипционных факторов с 
геномом на основе коллекции мотивов ДНК HOCOMOCO (Xen, ZFS, Object storage, Redis, 
Varnish Cache) 
• Масштабируемая система для анализа текстов с открытым API (хранилище ключ-значение 
Redis, кэширующий сервер приложений Varnish Cache) 
• Исследование возможности использования свободного ПО для создания автоматизированной 
банковской системы (Infinispan, Hazelcast, GridGain) 
• Анализ результатов мат моделирования в задачах инженерного анализа (OpenFoam, Hadoop) 
• Ежегодная конференция “Облачные вычисления. Исследования, Разработки, Образование”
Dell для Big Data 
13 
Инфраструктура 
Нужные данные 
в нужном месте 
в нужное время 
Управление 
Повышение 
производи- 
тельности 
платформы 
Интеграция 
Движение 
данных в 
реальном 
времени 
Глубокая 
аналитика и БИ 
Превратите 
данные в 
знания и 
быстрые 
решения 
СХД, серверы, 
сетевое 
оборудование 
Hadoop, 
Toad 
Boomi 
Statistica, Toad Data 
Point, Kitenga 
Партнеры и платформы: Hadoop, Intel, Cloudera, Oracle, Microsoft, SAP и др. 
Услуги (готовность инфраструктуры, зрелость аналитики) 
и экспертные знания (протестированные комбинации технологий)
. 
Хотите превратить 
данные в первооснову 
вашего бизнеса? 
bigdataopenlab@ispras.ru

Big Data Open Lab

  • 1.
    «Большие данные» ивы Помогая заказчикам перейти от слов к делу и превратить данные в ключевую ценность организации Арутюн Аветисян, ученый секретарь, Институт системного программирования РАН Павел Борох, менеджер по маркетингу корпоративных решений Dell в России, Казахстане и Центральной Азии
  • 2.
    Domains Websites E-mail Источник: Qmee July 2013, http://blog.qmee.com/qmee-nlinein-60-seconds/ Каждую минуту каждый день… THOUSAND post s every second
  • 3.
    Превратить данные винформацию, влияющую на принятие решений Спасти жизни Снизить издержки Удержать Медицина: решения в клиентов Производство стали: реальном времени для оптимизация предотвращения мониторинга, отчетов и опасных инфекций управления процессом. после операций. Индивидуализирован- ные предложения от сервис-провайдера. Превратить данные в краеугольный камень конкурентоспособности! Dell Solutions Forum 2014 #DST2014
  • 4.
    Danske Bank: решение для персонализированного обслуживания заказчиков “… современная программная платформа с превосходной производительностью, которая к тому же прекрасно соседствует с существующими ИТ-средствами, стала ключевым элементом для генерирования как сиюминутной, так и долгосрочной отдачи.” Йенс Х. Ипсен первый вице-президент и менеджер по развитию Задача: создать быстрое и точное решение для управления рисками и ранжирования в больших объемах данных и быстроизменяющейся среде. Решение: анализ данных и прогностическое моделирование с помощью Dell StatSoft Statistica позволили ускорить создание и просчет моделей финансовых рисков. Dell Solutions Forum 2014
  • 5.
    Большие данные –это непросто  Различные, иногда противоречивые требования:  долговременное хранение,  обработка массовых запросов,  обработка потоков данных в режиме реального времени,  поддержка транзакций и др.  Соответствующие технологии должны в первую очередь обеспечивать производительность и масштабируемость Dell Solutions Forum 2014 #DellST14
  • 6.
    Технологии для большихданных сегодня • Возможность обеспечить технологическую независимость и снизить риски как на уровне компаний, так и государства: • Программное обеспечение – нет «серебряной пули», но существуют зрелые Open Source технологии: – Hadoop (HDFS, Map/Reduce) – Spark (in memory Big Data) – GridGain, Infinispan (In Memory Data Grid) – Hazelcast (Distributed Key-Value storage) – … • Аппаратура – все из компонент общего назначения (commodity) Dell Solutions Forum 2014 #DellST14
  • 7.
    Технологии для большихданных сегодня • Большой разрыв между существующими технологическими возможностями и их реальным использованием в индустрии • Постоянная необходимость в инновациях: – разработка и внедрение новых технологий – адаптация и развитие существующих под специфику прикладных областей • Основная проблема – отсутствие/нехватка экспертизы, соответствующих команд Dell Solutions Forum 2014 #DellST14
  • 8.
    Требуется наладить взаимодействие бизнеса и ИТ Совместно определить цели, требования, метрики Обеспечить сращивание с существующими системами и ПО Дать возможность реализовать пилотные проекты Экспертиза и наработки Dell Solutions Forum 2014 #DellST14
  • 9.
    Лаборатория, созданная Dellи ИСП РАН Аппаратное обеспечение Dell: Серверы Dell PowerEdge коммутаторы Dell Networking системы хранения данных (PowerVault MD3820i) СПО: OpenStack, Hadoop, GridGain, Apache Spark, Infinispan, Terracotta, Ehcache и др. Dell Software: Boomi, StatSoft и др. Web-лаборатория BigDataOpenLab (на базе платформы UniHUB) Dell Solutions Forum 2014 #DellST14
  • 10.
    Big Data OpenLab • Центр компетенций – создан с целью продвижения передового опыта и развития технологий в области «больших данных» в интересах российских организаций • Экосистема поддержки инноваций в области «больших данных»: – Обеспечение доступа к современным аппаратно-программным платформам – Поддержка передовых исследований и разработок – Внедрение в индустрию – Поддержка сообщества пользователей и разработчиков – Консалтинг и обучение Dell Solutions Forum 2014 #DellST14
  • 11.
    Опыт ИСП РАН Технологическая платформа UniHUB  Создана технологическая платформа, реализующая в полном объеме концепцию web-ориентированных научно-производственных центров  Платформа полностью базируется на свободном ПО (основа OpenStack)  Платформа развернута в ЦОД ВЦ им. А.А. Дородницына РАН  Пользователи могут создавать и разворачивать свои собственные сервисы в рамках единой платформы, в том числе создавать web- ориентированные научно-производственные центры в конкретных предметных областях  Web-лаборатории: 1) Механика сплошных сред (МСС) 2) Системное программирование 3) ГИС Dell Solutions Forum 2014 #DellST14
  • 12.
    Опыт ИСП РАН • Создан экспериментальный стенд для моделирования трафика до 100Гб/с (данные располагаются на HDD, используется iSCSI и собственное ПО). • Создана программная инфраструктура для хранения и обработки данных в задачах Dell Solutions Forum 2014 #DellST14 вычислительной биологии. • Сейчас реализована задача предсказания сайтов связывания транскрипционных факторов с геномом на основе коллекции мотивов ДНК HOCOMOCO (Xen, ZFS, Object storage, Redis, Varnish Cache) • Масштабируемая система для анализа текстов с открытым API (хранилище ключ-значение Redis, кэширующий сервер приложений Varnish Cache) • Исследование возможности использования свободного ПО для создания автоматизированной банковской системы (Infinispan, Hazelcast, GridGain) • Анализ результатов мат моделирования в задачах инженерного анализа (OpenFoam, Hadoop) • Ежегодная конференция “Облачные вычисления. Исследования, Разработки, Образование”
  • 13.
    Dell для BigData 13 Инфраструктура Нужные данные в нужном месте в нужное время Управление Повышение производи- тельности платформы Интеграция Движение данных в реальном времени Глубокая аналитика и БИ Превратите данные в знания и быстрые решения СХД, серверы, сетевое оборудование Hadoop, Toad Boomi Statistica, Toad Data Point, Kitenga Партнеры и платформы: Hadoop, Intel, Cloudera, Oracle, Microsoft, SAP и др. Услуги (готовность инфраструктуры, зрелость аналитики) и экспертные знания (протестированные комбинации технологий)
  • 14.
    . Хотите превратить данные в первооснову вашего бизнеса? bigdataopenlab@ispras.ru

Editor's Notes

  • #9 When big data projects run into roadblocks, it's usually because business objectives aren't clear or the right people haven't been granted access to the right data. Big Data projects must be driven by a desire to solve significant business challenges, whether there are clearly defined business questions or whether the business needs to explore answers to ill-formed or nonexistent questions. IT and business leaders must be committed to collaborating, and the right people need to be granted access to the right data.   Having the proper skills and analytics maturity, either in-house or from a service provider, and tying Big Data projects to measurable performance metrics, are also key success factors. Dell can assess your data environment, your infrastructure readiness, and your analytics maturity level and help you create a strategic plan that reduces trade-offs, adapts to your changing needs, maximizes your resources, and enhances collaboration with the business.   The key to success is having the choice and flexibility you need to prioritize and align Big Data initiatives on your terms.