А.Челебаев - Хранение и обработка больших объемов данных
1. Хранение и обработка больших объемов данных
EMC GREENPLUM
Александр Челебаев
Директор департамента информационных технологий
Нижний Новгород, 2013 год
In 2000, we generated 2 exabytes or 2000 PB of new information.
Fast forward to 2011, the amount of information we’ve generated everyday is 2 exabytes! What’s behind this data deluge?
Программные приложения были центром притяжения последние несколько десятилетий.
Если мы посмотрим на вертикаль индустрии, то увидим, что приложения являются центром и определяют достаточно специфические конфигурации оборудования и ПО вокруг себя. Ларри Эллисон утверждает, что OracleDatabase работает на оборудовании Sun в два раза быстрее, чем на сравнимом оборудовании IBM POWER, и обещает 10 млн долл. любому, кто это опровергнет)))))
С увеличением цифровых массивов увеличивается и их вязкость. При этом большой физический размер делает данные достаточно неповоротливым объектом. Даже несмотря на существующие высокопроизводительные сети со скоростью 10Gbe – потребуется до 10 дней , чтобы передать данные объемом 1 Петабайт.
Каковы тенденции сегодняшнего дня? Данные становятся новым центром притяжения. Данные стали рассматриваться индивидуально.Повышение затрат на ИТ, бурный рост объемов данных и постоянно изменяющаяся конкурентная среда ускорили появление новых подходов к созданию эффективных систем анализа данных.
Greenplum работает с удивительной группой клиентов, помогая имувеличивать свой бизнес за счет обработки аналитических данных и свободно чувствовать себя в эре Больших Данных. Эти промышленные лидеры и инновационные мыслители делают необыкновенные вещи с платформой Greenplum. Как вы можете видеть, EMC работает с компаниями в разных отраслях промышленности и вертикалей. Все, начиная от финансов, розничной торговли, связи , Интернет. Независимо от сектора, компании, использующие Greenplum открывают для себя новые пути развития в разных направлениях.
Во первых, понятие Big Data – не уникально для любой конкретной отрасли, хотя отличия конечно присутствуют.Данный слайд показывает случаи, когда компании используют аналитическую обработку больших данных для получения бизнес преимуществ.Примеры:- К примеру, авиакомпания или телефонная компания предлагает Вам вознаграждение или скидку. Может быть, скорее всего, после того, как несколько дней назад Вы имели неприятный опыт на одном из своих рейсов. Как они это делают?- Ретейлер предлагает Вам продукцию со свойствами и по цене наиболее близкой к той какую бы Вы действительно хотели увидеть. По цене лучше, чем вы видели в магазине или на любимом вебсайте онлайн покупок. - Подразделение Вашей компании отвечающее за PR предоставляет Вам исчерпывающую информацию о клиентах и их возможной неудовлетворенности бизнес процессами.- Ваш врач не в состоянии предсказать как Вы лично будете реагировать на тот или иной курс лечения?- Вы видите все меньше и меньше пропущенных вызовов на своем мобильном телефоне?- Ваша энергетическая (домоуправляющая) компания предлагает точную оценку того насколько экономично вы используете ресурсы?А так же многое другое, что Вы не смогли бы увидеть или Вам не хотелось бы этим заниматься, но Вы хотели бы пользоваться преимуществами, при условии, что предоставляемый сервис не будет слишком навязчивым:How some stores are experimenting with video face recognition to present instantaneous ads to you as you shop their store?The broker who trades stocks for your mutual fund manager is “silently watching” that fund manager to assure he’s not setting up trades beyond “normal” behaviorВ случае, если вы берете кредит и соответствующими органами банка принимаются во внимание ваша кредитоспособность, последние банковские операции, социальные привычки, наклонности , факторы риска и тд. , вряд ли у человека дающего аппрув на разрешение той или иной финансовой транзакции, одобрение ипотечного кредита и т.д вызовет восторг факт вашего онлайн обсуждения последних совершенных прыжков с парашютом.Аналитика работает во всех сферах. Бизнес использующий силу комплексной аналитики на обширных полях информации – становится сильнее и гибче.
Архитектура MPP может существовать в двух качествах – это sharednothing и sharedeverything. В первом случае, каждый узел не разделяет системные ресурсы с другими узлами, выделяя и используя необходимые ему ресурсы самостоятельно. Во втором случае узел использует разделяемые ресурсы, обращаясь к некоему механизму для получения необходимых ему ресурсов.