SlideShare a Scribd company logo
1 of 34
Хранение и обработка больших объемов данных
EMC GREENPLUM
Александр Челебаев
Директор департамента информационных технологий
Нижний Новгород, 2013 год
2© Copyright 2012 EMC Corporation. All rights reserved.
Содержание
Основные технологические тренды в обработке
Больших Данных
Бизнес сценарии использования Больших Данных
 Технологические сценарии использования
Greenplum
Архитектура платформы EMC Greenplum
Примеры внедрений
3© Copyright 2012 EMC Corporation. All rights reserved.
Sources: “How Much Information?” Peter Lyman and Hal Varian, UC Berkeley,. 2011 IDC Digital Universe Study.
В 2000 ГОДУ ВО ВСЁМ МИРЕ
СОЗДАЁТСЯ
ДВА
ЭКЗАБАЙТА
НОВЫХ ДАННЫХ
4© Copyright 2012 EMC Corporation. All rights reserved.
В 2000 ГОДУ ВО ВСЁМ МИРЕ
СОЗДАЁТСЯ
ДВА
ЭКЗАБАЙТОВ
НОВЫХ ДАННЫХ
В ДЕНЬSources: “How Much Information?” Peter Lyman and Hal Varian, UC Berkeley,. 2011 IDC Digital Universe Study.
5© Copyright 2012 EMC Corporation. All rights reserved.
6© Copyright 2012 EMC Corporation. All rights reserved.
7© Copyright 2012 EMC Corporation. All rights reserved.
VOLUME
РАЗМЕР
VARIETY
МНОГООБРАЗИЕ
VELOCITY
ДИНАМИКА
Большие Данные:Больше чем данные
8© Copyright 2012 EMC Corporation. All rights reserved.
Приложения > Данные
ЦЕНТРОМ ПРИТЯЖЕНИЯ
ПРИЛОЖЕНИЯ
РАНЬШЕ БЫЛИ
9© Copyright 2012 EMC Corporation. All rights reserved.
Притяжение создало выделенную
инфраструктуру
10© Copyright 2012 EMC Corporation. All rights reserved.
Время перемещения данных на скорости 10GB/сек.
Перемещать данные непрактично
1TB 14
МИНУТ
10
ДНЕЙ
1PB
1GB 01
СЕК.
11© Copyright 2012 EMC Corporation. All rights reserved.
ДАННЫЕ
ЭТО НОВЫЙ
ЦЕНТР ПРИТЯЖЕНИЯ
Данные > Приложения
12© Copyright 2012 EMC Corporation. All rights reserved.
Данные стали разными
УСТРОЙСТВА
ДАННЫХ
Law
Enforcement
Media
Banks
Delivery
Services
Marketers
Government
Private
Investigators
/Lawyers
Individuals
Employers
Пользователи/
покупатели
данных
Analytic
Services
Advertising
Catalog
Co-ops
List
Brokers
Websites
Information
Brokers
Credit
BureausMedia
Archives
Агрегаторы
(накопители)
данных
FINANCIAL
GOVERNMENT
PHONE/
TV
INTERNETMEDICAL
RETAIL
13© Copyright 2012 EMC Corporation. All rights reserved.
Данные стали быстрыми
Данные
Корреляции и
паттерны
Причинные связи,
Предикторы
Реализация
Big Data позволяют находить
возможности о которых вы
раньше и не подозревали …
Fast Data позволяют
реагировать на эти
возможности пока они не
исчезли....
14© Copyright 2012 EMC Corporation. All rights reserved.
Лидеры рынка первыми начинают и
выигрывают….
15© Copyright 2012 EMC Corporation. All rights reserved.
Типовые бизнес-задачи для решения которых
используются Большие Данные
Клиентская аналитика
Target marketingchurncampaign
managementloyalty programs etc.
Отчетность и статистика
Противодействие мошенничеству
Прогностическое
моделирование  оценка рисков
16© Copyright 2012 EMC Corporation. All rights reserved.
Вызовы:
Развитие банковских систем - Обновление
систем с обеспечением возврата инвестиций.
Обслуживание клиентов – Увеличение
уровня удовлетворѐнности клиента, рост
прибыли благодаря более глубокому пониманию
потребностей клиента.
Комплексное управление рисками –
Целостный подход к управлению рисками по
всем линиям бизнеса для улучшения
финансового результата.
Платежи и службы обработки транзакций
Гибкие, эффективные и надѐжные системы для
платежей, управления ценными бумагами,
обеспечивающие снижение затрат.
Решения:
Рекомендации по использованию
продуктов Подготовка рекомендаций для
клиентов на основе данных предикативной
аналитики
Управление оттоком клиентов –
Предсказание склонности к оттоку и
различных факторов приводящих к отказу
клиента от продукта или услуги
Анализ социальных сетей –
Использование социальных сетей для
лучшего понимание клиента и общего
представления
Оценка клиентов 360 – Консолидация
данных по клиенту во всех аспектах
(ипотека, ценные бумаги, кредит) для
улучшенного таргетирования и создания
новых продуктов
Клиентская аналитика – вызовы и решения
17© Copyright 2012 EMC Corporation. All rights reserved.
Определение – Единый взгляд на прошлое, настоящее
и будущее в разрезе клиента, включая историю
покупок, текущие взаимодействия и возможности по
увеличению суммы покупки.
Особенности – информационная эра и развивающиеся
технологии, включая он-лайн и мобильные
приложения, обеспечили совершенно новые массивы
данных по клиенту.
Результат – Оценка клиентов 360˚ отошла от
использования исключительно транзакционных
данных и истории покупок, используются
предикативные методы, анализа предпочтений и
вероятности оттока.
РЕШЕНИЕ – Комбинирование персональных,
транзакционных, геолокационных, поведенческих,
демографических данных, кредитных рейтингов и
внешних источников
Основные причины:
1. Улучшение потребительского опыта
2. Потребность клиента в улучшении
уровня обслуживания
3. Рассогласование действий
клиентских служб Банка и общих
бизнес - целей
4. Неиспользованный потенциал
клиента по использованию
продуктов Банка
5. Недостаточная дифференциация
продуктов требует больших
сервисных затрат
Новый взгляд на клиента:Оценка 360
18© Copyright 2012 EMC Corporation. All rights reserved.
Определение – использование социальных сетей для более
глубокого понимания поведения клиента, повышения
уровня доверия и положительного опыта в кризисных
ситуациях
Особенности – популярность социальных сетей, таких, как
ВКонтакте, Одноклассники, Facebook, Twitter и LinkedIn
заставляет искать варианты включения этих каналов в
модель бизнеса Банка
Результат – мнения и оценки клиентов в социальных сетях
обладают потенциалом менять общественное мнение
РЕШЕНИЕ – использование текстовой аналитики для
понимания настроения клиента, мониторинг и участие в он-
лайн общении для предотвращения имиджевых потерь.
Улучшение узнаваемости бренда и завоевание
интеллектуального лидерства
Рост «Голоса клиента»
Сценарий: Банк предлагает он-лайн
сервисы. Они требуют многократных
сложных действий со стороны клиента.
Реакция клиентов – негативные оценки в
форумах и блогах. Банк не может
рассчитывать на традиционные формы
обратной связи, т.к. у большинства
клиентов не хватает терпения их
заполнять.
Призыв к действию: Банк начинает он-
лайн кампанию «Голос клиента»
используя методы анализа данных
социальных сетей, блогов и форумов.
Новое в клиентской аналитике:Социальные сети
19© Copyright 2012 EMC Corporation. All rights reserved.
Определение – Инструментарий кредитора для оценки и
минимизации риска, основанных на методах статистики
Особенности – Традиционные методы используют
транзакционные данные и данные систем информирования
о случаях мошенничества. Типичные для индустрии уровни
надѐжности методов 40% или 1 из 30 транзакций
Результат – Из-за постоянно возникающих новых сценариев
поведения клиентов и новых каналов платежей,
традиционный реактивный процесс предотвращения
мошенничества «один на все случаи» больше не работает
РЕШЕНИЕ – Минимизация случаев «ложного срабатывания» с
помощью применения комплекса предикативных моделей с
учѐтом географии, продукта, систем электронной торговли и
проприетарной информации.
***MasterCard Expert Monitoring
Solutions
Точки
взаимодействия
для оценки и
улучшения методов
противодействия
мошенничеству.
Противодействие мошенничеству
с кредитными картами
20© Copyright 2012 EMC Corporation. All rights reserved.
Технологические сценарии использования
СУБД Greenplum
21© Copyright 2012 EMC Corporation. All rights reserved.
Построение Корпоративного Хранилища Данных
(Enterprise Data Warehouse)
 На платформе Greenplum строиться центральное
хранилище компании, которое обслуживает все
системы отчетности и аналитики в компании.
 Обычно при таком сценарии проводят полную
миграцию с традиционных СУБД, которые не в
состоянии справиться с растущей нагрузкой и
предложить бизнес пользователям решение
аналитических задач в режиме он-лайн.
22© Copyright 2012 EMC Corporation. All rights reserved.
Построение Аналитического Хранилища Данных
(Analytical Data Warehouse)
 Построение на базе GP выделенных хранилищ
для решения наиболее выско-нагруженных
аналитических задач или тех задач, где
требуется он-лайн аналитика
 При таком подходе корпоративное хранилище
остаѐтся на традиционной платформе, а на
платформу Greenplum выносят наиболее
критичные, с точки зрения времени обработки,
аналитические приложения.
23© Copyright 2012 EMC Corporation. All rights reserved.
СУБД GREENPLUM
24© Copyright 2012 EMC Corporation. All rights reserved.
GREENPLUM это выбор и гибкость
25© Copyright 2012 EMC Corporation. All rights reserved.
Параметры
ПАК GREENPLUM
26© Copyright 2012 EMC Corporation. All rights reserved.
МПП архитектура
Архитектура shared-nothing на которой построена
Greenplum линейно масштабируема
• Т.е. мы можем вдвое увеличить
количество узлов, и вдвое же
увеличить скорость работы
запросов
• Так же мы можем вдвое увеличить
емкость системы, просто удвоив
количество узлов, при этом
оставляя скорость обработки все
такой же быстрой…
• Все это благодаря тому что мы
масштабируем одновременно
вычислительную мощность, объем
скорость вввода-вывода
• При этом система работает на
недорогом X86 оборудовании
SegmentSegment Segment Segment Segment
…
27© Copyright 2012 EMC Corporation. All rights reserved.
Масштабирование Greenplum
28© Copyright 2012 EMC Corporation. All rights reserved.
Примеры внедрений
платформы Greenplum
в крупнейших финансовых
компаниях мира
29© Copyright 2012 EMC Corporation. All rights reserved.
American Express выбирает Greenplum Hadoop
• Формирование профиля клиента на базе информации о платежах
• Повышение лояльности клиентов за счет программ поощрения
• Расширение методов борьбы с мошенничеством
Бизнесс-задачи:
Выбор :
После 6 месяцев тестирования открытых и коммерческих релизов
в финал вышли Cloudera и Greenplum MR
Причины:
 Поддержка корпоративного уровня
 Отказоустойчивость платформы
 Скорость обработки в 2 раза выше
2PB
30© Copyright 2012 EMC Corporation. All rights reserved.
Крупнейший банк Северной Америки
выбирает Greenplum DB
Бизнесс-задачи:
• Управление рисками
• Клиентский маркетинг
• Аналитика по пластиковым картам
 Отработанная миграция с традиционных СУБД
 Масштабируемость платформы
 Скорость обработки
 Интеграция в существующий ИТ ландшафт
Причины:
31© Copyright 2012 EMC Corporation. All rights reserved.
Один из крупнейших банков Китая
Более 140 000 000 кредитных карт
• Централизованное хранилище под карточную систему
• Целевой клиентский маркетинг
• Аналитика по пластиковым картам
Бизнесс-задачи:
Выбор платформы для Хранилища: DB2–Oracle 11g -Teradata14
 Самая высокая скорость загрузки данных
 Линейная масштабируемость платформы
 Открытая интеграция с другими решениями
 Лучший показатель цена/производительность
32© Copyright 2012 EMC Corporation. All rights reserved.
Почему заказчики выбирают Greenplum
 Высочайшая скорость загрузки и выполнения запросов
 Линейная многократная масштабируемость
 Интеграция c инструментами ETL,BI и аналитики
 Наличие отработанных методик и инструментов миграции с
традиционных платформ и СУБД
 Универсальная платформа обработки всех
типов данных и запросов
 Адекватные и предсказуемые затраты на
построение и развитие системы
33© Copyright 2012 EMC Corporation. All rights reserved.
Ключевые
партнеры
34© Copyright 2012 EMC Corporation. All rights reserved.
603140, Нижний Новгород, пер. Мотальный, д.8, «Бугров
Бизнес парк»
+7 831 467 8770, +7831 467 8771 (факс)
office@volga.croc.ru
www.croc.ru/volga
Спасибо за внимание!

More Related Content

Similar to А.Челебаев - Хранение и обработка больших объемов данных

Dell – Стратегия Роста
Dell – Стратегия РостаDell – Стратегия Роста
Dell – Стратегия РостаNick Turunov
 
Аналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboardАналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboardIpo Board
 
AlgoMost presentation
AlgoMost presentationAlgoMost presentation
AlgoMost presentationAlgoMost
 
Обеспечение и контроль качества услуг
Обеспечение и контроль качества услугОбеспечение и контроль качества услуг
Обеспечение и контроль качества услугCisco Russia
 
От больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связиОт больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связиElizaveta Alekseeva
 
От Больших данных к знаниям: преимущества для операторов связи
От Больших данных  к знаниям: преимущества  для операторов связиОт Больших данных  к знаниям: преимущества  для операторов связи
От Больших данных к знаниям: преимущества для операторов связиYuri Yashkin
 
Building Digital Strategy
Building Digital StrategyBuilding Digital Strategy
Building Digital StrategyAndrey Suslov
 
Юрий Гальчевский, Евгений Осинский: "Почему современному банку нужны облачные...
Юрий Гальчевский, Евгений Осинский: "Почему современному банку нужны облачные...Юрий Гальчевский, Евгений Осинский: "Почему современному банку нужны облачные...
Юрий Гальчевский, Евгений Осинский: "Почему современному банку нужны облачные...De Novo
 
OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015Ilya Gershanov
 
Май-Tech. Облачные технологии
Май-Tech. Облачные технологииМай-Tech. Облачные технологии
Май-Tech. Облачные технологииMay-Tech
 
Обеспечение бесперебойной работы корпоративных приложений в больших гетероген...
Обеспечение бесперебойной работы корпоративных приложений в больших гетероген...Обеспечение бесперебойной работы корпоративных приложений в больших гетероген...
Обеспечение бесперебойной работы корпоративных приложений в больших гетероген...Cisco Russia
 
Решение по управлению знаниями потребителя
Решение по управлению знаниями потребителяРешение по управлению знаниями потребителя
Решение по управлению знаниями потребителяsmm3
 
Informatica Пронет (v.0.3)
Informatica   Пронет (v.0.3)Informatica   Пронет (v.0.3)
Informatica Пронет (v.0.3)Natasha Zaverukha
 
Анализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов GoogleАнализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов GoogleNetpeak
 
Презентация DataScoring: Big Data и кредитный скоринг
Презентация DataScoring: Big Data и кредитный скорингПрезентация DataScoring: Big Data и кредитный скоринг
Презентация DataScoring: Big Data и кредитный скорингAnton Vokrug
 
Cloud Banking by Evgeniy Sen
Cloud Banking by Evgeniy SenCloud Banking by Evgeniy Sen
Cloud Banking by Evgeniy SenEvgeniy Sen
 
Project presentation
Project presentationProject presentation
Project presentationRoman Rezaev
 

Similar to А.Челебаев - Хранение и обработка больших объемов данных (20)

Dell – Стратегия Роста
Dell – Стратегия РостаDell – Стратегия Роста
Dell – Стратегия Роста
 
Аналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboardАналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboard
 
AlgoMost: about
AlgoMost: aboutAlgoMost: about
AlgoMost: about
 
AlgoMost presentation
AlgoMost presentationAlgoMost presentation
AlgoMost presentation
 
Обеспечение и контроль качества услуг
Обеспечение и контроль качества услугОбеспечение и контроль качества услуг
Обеспечение и контроль качества услуг
 
От больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связиОт больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связи
 
Ru v3.0 big_datascoring
Ru v3.0 big_datascoringRu v3.0 big_datascoring
Ru v3.0 big_datascoring
 
От Больших данных к знаниям: преимущества для операторов связи
От Больших данных  к знаниям: преимущества  для операторов связиОт Больших данных  к знаниям: преимущества  для операторов связи
От Больших данных к знаниям: преимущества для операторов связи
 
Building Digital Strategy
Building Digital StrategyBuilding Digital Strategy
Building Digital Strategy
 
Юрий Гальчевский, Евгений Осинский: "Почему современному банку нужны облачные...
Юрий Гальчевский, Евгений Осинский: "Почему современному банку нужны облачные...Юрий Гальчевский, Евгений Осинский: "Почему современному банку нужны облачные...
Юрий Гальчевский, Евгений Осинский: "Почему современному банку нужны облачные...
 
OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015
 
Май-Tech. Облачные технологии
Май-Tech. Облачные технологииМай-Tech. Облачные технологии
Май-Tech. Облачные технологии
 
Обеспечение бесперебойной работы корпоративных приложений в больших гетероген...
Обеспечение бесперебойной работы корпоративных приложений в больших гетероген...Обеспечение бесперебойной работы корпоративных приложений в больших гетероген...
Обеспечение бесперебойной работы корпоративных приложений в больших гетероген...
 
Решение по управлению знаниями потребителя
Решение по управлению знаниями потребителяРешение по управлению знаниями потребителя
Решение по управлению знаниями потребителя
 
BI Pre-Sale
BI Pre-SaleBI Pre-Sale
BI Pre-Sale
 
Informatica Пронет (v.0.3)
Informatica   Пронет (v.0.3)Informatica   Пронет (v.0.3)
Informatica Пронет (v.0.3)
 
Анализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов GoogleАнализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов Google
 
Презентация DataScoring: Big Data и кредитный скоринг
Презентация DataScoring: Big Data и кредитный скорингПрезентация DataScoring: Big Data и кредитный скоринг
Презентация DataScoring: Big Data и кредитный скоринг
 
Cloud Banking by Evgeniy Sen
Cloud Banking by Evgeniy SenCloud Banking by Evgeniy Sen
Cloud Banking by Evgeniy Sen
 
Project presentation
Project presentationProject presentation
Project presentation
 

More from Ekaterina Morozova

электронная демократия бастрыкин-нижний новгород 17.04.13
электронная демократия бастрыкин-нижний новгород 17.04.13электронная демократия бастрыкин-нижний новгород 17.04.13
электронная демократия бастрыкин-нижний новгород 17.04.13Ekaterina Morozova
 
цод нового поколения (It forum 2020 nn)
цод нового поколения (It forum 2020 nn)цод нового поколения (It forum 2020 nn)
цод нового поколения (It forum 2020 nn)Ekaterina Morozova
 
фролов круглый стол нпп
фролов   круглый стол нппфролов   круглый стол нпп
фролов круглый стол нппEkaterina Morozova
 
свободные цифровые технологии как механизм реформированиясистемы государствен...
свободные цифровые технологии как механизм реформированиясистемы государствен...свободные цифровые технологии как механизм реформированиясистемы государствен...
свободные цифровые технологии как механизм реформированиясистемы государствен...Ekaterina Morozova
 
расширенный доклад по вкц
расширенный доклад по вкцрасширенный доклад по вкц
расширенный доклад по вкцEkaterina Morozova
 
презентация полтава мфц
презентация полтава мфцпрезентация полтава мфц
презентация полтава мфцEkaterina Morozova
 
презентация Microsoft power point
презентация Microsoft power pointпрезентация Microsoft power point
презентация Microsoft power pointEkaterina Morozova
 
почта россии нновгород 16 17 апр 2013 г
почта россии нновгород 16 17 апр 2013 г почта россии нновгород 16 17 апр 2013 г
почта россии нновгород 16 17 апр 2013 г Ekaterina Morozova
 
основные проблемы и пути развития промышленности пфо гл.
основные проблемы и пути развития промышленности пфо гл.основные проблемы и пути развития промышленности пфо гл.
основные проблемы и пути развития промышленности пфо гл.Ekaterina Morozova
 
доклад гутянская
доклад гутянскаядоклад гутянская
доклад гутянскаяEkaterina Morozova
 

More from Ekaterina Morozova (20)

2
22
2
 
1
11
1
 
3
33
3
 
электронная демократия бастрыкин-нижний новгород 17.04.13
электронная демократия бастрыкин-нижний новгород 17.04.13электронная демократия бастрыкин-нижний новгород 17.04.13
электронная демократия бастрыкин-нижний новгород 17.04.13
 
цод нового поколения (It forum 2020 nn)
цод нового поколения (It forum 2020 nn)цод нового поколения (It forum 2020 nn)
цод нового поколения (It forum 2020 nn)
 
фролов круглый стол нпп
фролов   круглый стол нппфролов   круглый стол нпп
фролов круглый стол нпп
 
уэк чувашия
уэк чувашияуэк чувашия
уэк чувашия
 
свободные цифровые технологии как механизм реформированиясистемы государствен...
свободные цифровые технологии как механизм реформированиясистемы государствен...свободные цифровые технологии как механизм реформированиясистемы государствен...
свободные цифровые технологии как механизм реформированиясистемы государствен...
 
расширенный доклад по вкц
расширенный доклад по вкцрасширенный доклад по вкц
расширенный доклад по вкц
 
презентация полтава мфц
презентация полтава мфцпрезентация полтава мфц
презентация полтава мфц
 
презентация Microsoft power point
презентация Microsoft power pointпрезентация Microsoft power point
презентация Microsoft power point
 
почта россии нновгород 16 17 апр 2013 г
почта россии нновгород 16 17 апр 2013 г почта россии нновгород 16 17 апр 2013 г
почта россии нновгород 16 17 апр 2013 г
 
основные проблемы и пути развития промышленности пфо гл.
основные проблемы и пути развития промышленности пфо гл.основные проблемы и пути развития промышленности пфо гл.
основные проблемы и пути развития промышленности пфо гл.
 
нн 2013 chugunov_v 1
нн 2013 chugunov_v 1нн 2013 chugunov_v 1
нн 2013 chugunov_v 1
 
нглу курицынагв
нглу курицынагвнглу курицынагв
нглу курицынагв
 
лад
ладлад
лад
 
долгих
долгихдолгих
долгих
 
доклад гутянская
доклад гутянскаядоклад гутянская
доклад гутянская
 
бфт найченко
бфт найченкобфт найченко
бфт найченко
 
Sag
SagSag
Sag
 

А.Челебаев - Хранение и обработка больших объемов данных

  • 1. Хранение и обработка больших объемов данных EMC GREENPLUM Александр Челебаев Директор департамента информационных технологий Нижний Новгород, 2013 год
  • 2. 2© Copyright 2012 EMC Corporation. All rights reserved. Содержание Основные технологические тренды в обработке Больших Данных Бизнес сценарии использования Больших Данных  Технологические сценарии использования Greenplum Архитектура платформы EMC Greenplum Примеры внедрений
  • 3. 3© Copyright 2012 EMC Corporation. All rights reserved. Sources: “How Much Information?” Peter Lyman and Hal Varian, UC Berkeley,. 2011 IDC Digital Universe Study. В 2000 ГОДУ ВО ВСЁМ МИРЕ СОЗДАЁТСЯ ДВА ЭКЗАБАЙТА НОВЫХ ДАННЫХ
  • 4. 4© Copyright 2012 EMC Corporation. All rights reserved. В 2000 ГОДУ ВО ВСЁМ МИРЕ СОЗДАЁТСЯ ДВА ЭКЗАБАЙТОВ НОВЫХ ДАННЫХ В ДЕНЬSources: “How Much Information?” Peter Lyman and Hal Varian, UC Berkeley,. 2011 IDC Digital Universe Study.
  • 5. 5© Copyright 2012 EMC Corporation. All rights reserved.
  • 6. 6© Copyright 2012 EMC Corporation. All rights reserved.
  • 7. 7© Copyright 2012 EMC Corporation. All rights reserved. VOLUME РАЗМЕР VARIETY МНОГООБРАЗИЕ VELOCITY ДИНАМИКА Большие Данные:Больше чем данные
  • 8. 8© Copyright 2012 EMC Corporation. All rights reserved. Приложения > Данные ЦЕНТРОМ ПРИТЯЖЕНИЯ ПРИЛОЖЕНИЯ РАНЬШЕ БЫЛИ
  • 9. 9© Copyright 2012 EMC Corporation. All rights reserved. Притяжение создало выделенную инфраструктуру
  • 10. 10© Copyright 2012 EMC Corporation. All rights reserved. Время перемещения данных на скорости 10GB/сек. Перемещать данные непрактично 1TB 14 МИНУТ 10 ДНЕЙ 1PB 1GB 01 СЕК.
  • 11. 11© Copyright 2012 EMC Corporation. All rights reserved. ДАННЫЕ ЭТО НОВЫЙ ЦЕНТР ПРИТЯЖЕНИЯ Данные > Приложения
  • 12. 12© Copyright 2012 EMC Corporation. All rights reserved. Данные стали разными УСТРОЙСТВА ДАННЫХ Law Enforcement Media Banks Delivery Services Marketers Government Private Investigators /Lawyers Individuals Employers Пользователи/ покупатели данных Analytic Services Advertising Catalog Co-ops List Brokers Websites Information Brokers Credit BureausMedia Archives Агрегаторы (накопители) данных FINANCIAL GOVERNMENT PHONE/ TV INTERNETMEDICAL RETAIL
  • 13. 13© Copyright 2012 EMC Corporation. All rights reserved. Данные стали быстрыми Данные Корреляции и паттерны Причинные связи, Предикторы Реализация Big Data позволяют находить возможности о которых вы раньше и не подозревали … Fast Data позволяют реагировать на эти возможности пока они не исчезли....
  • 14. 14© Copyright 2012 EMC Corporation. All rights reserved. Лидеры рынка первыми начинают и выигрывают….
  • 15. 15© Copyright 2012 EMC Corporation. All rights reserved. Типовые бизнес-задачи для решения которых используются Большие Данные Клиентская аналитика Target marketingchurncampaign managementloyalty programs etc. Отчетность и статистика Противодействие мошенничеству Прогностическое моделирование оценка рисков
  • 16. 16© Copyright 2012 EMC Corporation. All rights reserved. Вызовы: Развитие банковских систем - Обновление систем с обеспечением возврата инвестиций. Обслуживание клиентов – Увеличение уровня удовлетворѐнности клиента, рост прибыли благодаря более глубокому пониманию потребностей клиента. Комплексное управление рисками – Целостный подход к управлению рисками по всем линиям бизнеса для улучшения финансового результата. Платежи и службы обработки транзакций Гибкие, эффективные и надѐжные системы для платежей, управления ценными бумагами, обеспечивающие снижение затрат. Решения: Рекомендации по использованию продуктов Подготовка рекомендаций для клиентов на основе данных предикативной аналитики Управление оттоком клиентов – Предсказание склонности к оттоку и различных факторов приводящих к отказу клиента от продукта или услуги Анализ социальных сетей – Использование социальных сетей для лучшего понимание клиента и общего представления Оценка клиентов 360 – Консолидация данных по клиенту во всех аспектах (ипотека, ценные бумаги, кредит) для улучшенного таргетирования и создания новых продуктов Клиентская аналитика – вызовы и решения
  • 17. 17© Copyright 2012 EMC Corporation. All rights reserved. Определение – Единый взгляд на прошлое, настоящее и будущее в разрезе клиента, включая историю покупок, текущие взаимодействия и возможности по увеличению суммы покупки. Особенности – информационная эра и развивающиеся технологии, включая он-лайн и мобильные приложения, обеспечили совершенно новые массивы данных по клиенту. Результат – Оценка клиентов 360˚ отошла от использования исключительно транзакционных данных и истории покупок, используются предикативные методы, анализа предпочтений и вероятности оттока. РЕШЕНИЕ – Комбинирование персональных, транзакционных, геолокационных, поведенческих, демографических данных, кредитных рейтингов и внешних источников Основные причины: 1. Улучшение потребительского опыта 2. Потребность клиента в улучшении уровня обслуживания 3. Рассогласование действий клиентских служб Банка и общих бизнес - целей 4. Неиспользованный потенциал клиента по использованию продуктов Банка 5. Недостаточная дифференциация продуктов требует больших сервисных затрат Новый взгляд на клиента:Оценка 360
  • 18. 18© Copyright 2012 EMC Corporation. All rights reserved. Определение – использование социальных сетей для более глубокого понимания поведения клиента, повышения уровня доверия и положительного опыта в кризисных ситуациях Особенности – популярность социальных сетей, таких, как ВКонтакте, Одноклассники, Facebook, Twitter и LinkedIn заставляет искать варианты включения этих каналов в модель бизнеса Банка Результат – мнения и оценки клиентов в социальных сетях обладают потенциалом менять общественное мнение РЕШЕНИЕ – использование текстовой аналитики для понимания настроения клиента, мониторинг и участие в он- лайн общении для предотвращения имиджевых потерь. Улучшение узнаваемости бренда и завоевание интеллектуального лидерства Рост «Голоса клиента» Сценарий: Банк предлагает он-лайн сервисы. Они требуют многократных сложных действий со стороны клиента. Реакция клиентов – негативные оценки в форумах и блогах. Банк не может рассчитывать на традиционные формы обратной связи, т.к. у большинства клиентов не хватает терпения их заполнять. Призыв к действию: Банк начинает он- лайн кампанию «Голос клиента» используя методы анализа данных социальных сетей, блогов и форумов. Новое в клиентской аналитике:Социальные сети
  • 19. 19© Copyright 2012 EMC Corporation. All rights reserved. Определение – Инструментарий кредитора для оценки и минимизации риска, основанных на методах статистики Особенности – Традиционные методы используют транзакционные данные и данные систем информирования о случаях мошенничества. Типичные для индустрии уровни надѐжности методов 40% или 1 из 30 транзакций Результат – Из-за постоянно возникающих новых сценариев поведения клиентов и новых каналов платежей, традиционный реактивный процесс предотвращения мошенничества «один на все случаи» больше не работает РЕШЕНИЕ – Минимизация случаев «ложного срабатывания» с помощью применения комплекса предикативных моделей с учѐтом географии, продукта, систем электронной торговли и проприетарной информации. ***MasterCard Expert Monitoring Solutions Точки взаимодействия для оценки и улучшения методов противодействия мошенничеству. Противодействие мошенничеству с кредитными картами
  • 20. 20© Copyright 2012 EMC Corporation. All rights reserved. Технологические сценарии использования СУБД Greenplum
  • 21. 21© Copyright 2012 EMC Corporation. All rights reserved. Построение Корпоративного Хранилища Данных (Enterprise Data Warehouse)  На платформе Greenplum строиться центральное хранилище компании, которое обслуживает все системы отчетности и аналитики в компании.  Обычно при таком сценарии проводят полную миграцию с традиционных СУБД, которые не в состоянии справиться с растущей нагрузкой и предложить бизнес пользователям решение аналитических задач в режиме он-лайн.
  • 22. 22© Copyright 2012 EMC Corporation. All rights reserved. Построение Аналитического Хранилища Данных (Analytical Data Warehouse)  Построение на базе GP выделенных хранилищ для решения наиболее выско-нагруженных аналитических задач или тех задач, где требуется он-лайн аналитика  При таком подходе корпоративное хранилище остаѐтся на традиционной платформе, а на платформу Greenplum выносят наиболее критичные, с точки зрения времени обработки, аналитические приложения.
  • 23. 23© Copyright 2012 EMC Corporation. All rights reserved. СУБД GREENPLUM
  • 24. 24© Copyright 2012 EMC Corporation. All rights reserved. GREENPLUM это выбор и гибкость
  • 25. 25© Copyright 2012 EMC Corporation. All rights reserved. Параметры ПАК GREENPLUM
  • 26. 26© Copyright 2012 EMC Corporation. All rights reserved. МПП архитектура Архитектура shared-nothing на которой построена Greenplum линейно масштабируема • Т.е. мы можем вдвое увеличить количество узлов, и вдвое же увеличить скорость работы запросов • Так же мы можем вдвое увеличить емкость системы, просто удвоив количество узлов, при этом оставляя скорость обработки все такой же быстрой… • Все это благодаря тому что мы масштабируем одновременно вычислительную мощность, объем скорость вввода-вывода • При этом система работает на недорогом X86 оборудовании SegmentSegment Segment Segment Segment …
  • 27. 27© Copyright 2012 EMC Corporation. All rights reserved. Масштабирование Greenplum
  • 28. 28© Copyright 2012 EMC Corporation. All rights reserved. Примеры внедрений платформы Greenplum в крупнейших финансовых компаниях мира
  • 29. 29© Copyright 2012 EMC Corporation. All rights reserved. American Express выбирает Greenplum Hadoop • Формирование профиля клиента на базе информации о платежах • Повышение лояльности клиентов за счет программ поощрения • Расширение методов борьбы с мошенничеством Бизнесс-задачи: Выбор : После 6 месяцев тестирования открытых и коммерческих релизов в финал вышли Cloudera и Greenplum MR Причины:  Поддержка корпоративного уровня  Отказоустойчивость платформы  Скорость обработки в 2 раза выше 2PB
  • 30. 30© Copyright 2012 EMC Corporation. All rights reserved. Крупнейший банк Северной Америки выбирает Greenplum DB Бизнесс-задачи: • Управление рисками • Клиентский маркетинг • Аналитика по пластиковым картам  Отработанная миграция с традиционных СУБД  Масштабируемость платформы  Скорость обработки  Интеграция в существующий ИТ ландшафт Причины:
  • 31. 31© Copyright 2012 EMC Corporation. All rights reserved. Один из крупнейших банков Китая Более 140 000 000 кредитных карт • Централизованное хранилище под карточную систему • Целевой клиентский маркетинг • Аналитика по пластиковым картам Бизнесс-задачи: Выбор платформы для Хранилища: DB2–Oracle 11g -Teradata14  Самая высокая скорость загрузки данных  Линейная масштабируемость платформы  Открытая интеграция с другими решениями  Лучший показатель цена/производительность
  • 32. 32© Copyright 2012 EMC Corporation. All rights reserved. Почему заказчики выбирают Greenplum  Высочайшая скорость загрузки и выполнения запросов  Линейная многократная масштабируемость  Интеграция c инструментами ETL,BI и аналитики  Наличие отработанных методик и инструментов миграции с традиционных платформ и СУБД  Универсальная платформа обработки всех типов данных и запросов  Адекватные и предсказуемые затраты на построение и развитие системы
  • 33. 33© Copyright 2012 EMC Corporation. All rights reserved. Ключевые партнеры
  • 34. 34© Copyright 2012 EMC Corporation. All rights reserved. 603140, Нижний Новгород, пер. Мотальный, д.8, «Бугров Бизнес парк» +7 831 467 8770, +7831 467 8771 (факс) office@volga.croc.ru www.croc.ru/volga Спасибо за внимание!

Editor's Notes

  1. In 2000, we generated 2 exabytes or 2000 PB of new information.
  2. Fast forward to 2011, the amount of information we’ve generated everyday is 2 exabytes! What’s behind this data deluge?
  3. Программные приложения были центром притяжения последние несколько десятилетий.
  4. Если мы посмотрим на вертикаль индустрии, то увидим, что приложения являются центром и определяют достаточно специфические конфигурации оборудования и ПО вокруг себя. Ларри Эллисон утверждает, что OracleDatabase работает на оборудовании Sun в два раза быстрее, чем на сравнимом оборудовании IBM POWER, и обещает 10 млн долл. любому, кто это опровергнет)))))
  5. С увеличением цифровых массивов увеличивается и их вязкость. При этом большой физический размер делает данные достаточно неповоротливым объектом. Даже несмотря на существующие высокопроизводительные сети со скоростью 10Gbe – потребуется до 10 дней , чтобы передать данные объемом 1 Петабайт.
  6. Каковы тенденции сегодняшнего дня? Данные становятся новым центром притяжения. Данные стали рассматриваться индивидуально.Повышение затрат на ИТ, бурный рост объемов данных и постоянно изменяющаяся конкурентная среда ускорили появление новых подходов к созданию эффективных систем анализа данных.
  7. Greenplum работает с удивительной группой клиентов, помогая имувеличивать свой бизнес за счет обработки аналитических данных и свободно чувствовать себя в эре Больших Данных. Эти промышленные лидеры и инновационные мыслители делают необыкновенные вещи с платформой Greenplum. Как вы можете видеть, EMC работает с компаниями в разных отраслях промышленности и вертикалей. Все, начиная от финансов, розничной торговли, связи , Интернет. Независимо от сектора, компании, использующие Greenplum открывают для себя новые пути развития в разных направлениях.
  8. Во первых, понятие Big Data – не уникально для любой конкретной отрасли, хотя отличия конечно присутствуют.Данный слайд показывает случаи, когда компании используют аналитическую обработку больших данных для получения бизнес преимуществ.Примеры:- К примеру, авиакомпания или телефонная компания предлагает Вам вознаграждение или скидку. Может быть, скорее всего, после того, как несколько дней назад Вы имели неприятный опыт на одном из своих рейсов. Как они это делают?- Ретейлер предлагает Вам продукцию со свойствами и по цене наиболее близкой к той какую бы Вы действительно хотели увидеть. По цене лучше, чем вы видели в магазине или на любимом вебсайте онлайн покупок. - Подразделение Вашей компании отвечающее за PR предоставляет Вам исчерпывающую информацию о клиентах и их возможной неудовлетворенности бизнес процессами.- Ваш врач не в состоянии предсказать как Вы лично будете реагировать на тот или иной курс лечения?- Вы видите все меньше и меньше пропущенных вызовов на своем мобильном телефоне?- Ваша энергетическая (домоуправляющая) компания предлагает точную оценку того насколько экономично вы используете ресурсы?А так же многое другое, что Вы не смогли бы увидеть или Вам не хотелось бы этим заниматься, но Вы хотели бы пользоваться преимуществами, при условии, что предоставляемый сервис не будет слишком навязчивым:How some stores are experimenting with video face recognition to present instantaneous ads to you as you shop their store?The broker who trades stocks for your mutual fund manager is “silently watching” that fund manager to assure he’s not setting up trades beyond “normal” behaviorВ случае, если вы берете кредит и соответствующими органами банка принимаются во внимание ваша кредитоспособность, последние банковские операции, социальные привычки, наклонности , факторы риска и тд. , вряд ли у человека дающего аппрув на разрешение той или иной финансовой транзакции, одобрение ипотечного кредита и т.д вызовет восторг факт вашего онлайн обсуждения последних совершенных прыжков с парашютом.Аналитика работает во всех сферах. Бизнес использующий силу комплексной аналитики на обширных полях информации – становится сильнее и гибче.
  9. Архитектура MPP может существовать в двух качествах – это sharednothing и sharedeverything. В первом случае, каждый узел не разделяет системные ресурсы с другими узлами, выделяя и используя необходимые ему ресурсы самостоятельно. Во втором случае узел использует разделяемые ресурсы, обращаясь к некоему механизму для получения необходимых ему ресурсов.