SlideShare a Scribd company logo
1 of 46
Download to read offline
EMBARCADERO TECHNOLOGIES
Кросс-платформенные инструменты для работы с БД
Андрей Совцов
Embarcadero,Москва
email: Andrew.Sovtsov@embarcadero.com
Поддержка NoSQL и платформ Big Data:
MongoDB, Hive, Teradata и др.
EMBARCADERO TECHNOLOGIES
Темы
1. СУБД сегодня
2. Большие данные
3. NoSQL: категории СУБД
4. MongoDB
5. «Горизонтальное» масштабирование БД
6. Map Reduce, Hadoop, Hive
7. Проектирование NoSQL БД
8. ER/Studio и NoSQL (demo)
EMBARCADERO TECHNOLOGIES
Насколько велики «Big Data»
EMBARCADERO TECHNOLOGIES
Big Data 2014
Все более
значительная
часть ИТ
Применяется
• Инфраструктура
• Аналитика
• Приложения
5
EMBARCADERO TECHNOLOGIES
Проблемы «Больших данных» в картинках
EMBARCADERO TECHNOLOGIES
Что требуется от БД?
• Удобная для отображения моих данных
структура данных
• Скорость и возможность масштабирования
(верт. и гор. )
• Богатые и удобные средства доступа и
разработки приложений
EMBARCADERO TECHNOLOGIES
Что означает «масштабирование»?
• Перенос обработки как можно ближе к
данным
• Массивно-параллельная обработка
• Использование более дешевого,
стандартного оборудования, но в больших
количествах
• Оптимизация для:
запросов / чтения / вопросов / аналитики
EMBARCADERO TECHNOLOGIES
EMBARCADERO TECHNOLOGIES
Кроме шуток…
EMBARCADERO TECHNOLOGIES
NoSQL, не только SQL
Реляционные Графические Колоночные
Ключ-
значение
Документные Другие
EMBARCADERO TECHNOLOGIES
Терминология
ACID Atomic, Consistent, Isolated,
Durable
Атомарность, Согласованность,
Изолированность, Надежность
BASE Basically available, Soft state,
Eventual consistency
базовая доступность
гибкое состояние
согласованность в конечном счёте
Eventual consistency Согласованность в конечном счете
Schemaless Отсутствие схемы данных
Constraints / Have-to/ MUST / OBEY / Rigid /
Inflexible
Ограничения
EMBARCADERO TECHNOLOGIES
Мифы про «Большие данные»
• Отсутствие схемы данных
– При чтении мы все равно получаем структуру
– При записи мы можем использовать другую
• Лучше говорить о
«данных с множеством схем»
• Новая аппаратная база
• Новые технологии
EMBARCADERO TECHNOLOGIES
Schema для записи/ Schema на чтение
Schema для записи(RDBMS)
Директивное моделирование данных:
• Создать схему БД
• Загрузить данные в формате RDBMS
• Запросы к данным в формате RDBMS
Новые колонки должны быть добавлены ДО
ТОГО, как новые данные будут помещены в
систему.
Хорошо для Known Unknowns
(повторяемости)
14
Schema на чтение(Hadoop/NoSQL)
Описательное моделирование данных:
• Собрать данные в натуральном формате
• Создать схему
• Запросы к данным в натуральном
формате
Новые данные могут появляться в любое
время и появляться задним числом если
схема правильно описывает их
Хорошо для Unknown Unknowns
(исследования)
EMBARCADERO TECHNOLOGIES
EMBARCADERO TECHNOLOGIES
Колоночные (ключзначение)
• Хранение по колонкам (one-dimensional)
• Единица значения – BLOB
• Запросы только по ключу
• Некоторые СУБД поддерживают вторичные индексы
• Схема не существует
• Update запрещены – только перезапись
• Cassandra, Redis, MemcacheD, Riak, DynamoDB, Sybase IQ
EMBARCADERO TECHNOLOGIES
Apache Map Reduce
EMBARCADERO TECHNOLOGIES
Реляционные и документо-ориентированные
Реляционные
• Запросы по
любому полю
• Замена по месту
• Табличное хранение
• Каждое поле содержит
единственное значение
• «Жесткая» схема
• Нормализация приводит к
Joins «мелких» таблиц
• Oracle, MSSQL, MySQL,
PostgreSQL,DB2
Документные
• Многомерное
хранение
• В каждом поле
м.б. 0,1 или много
значений
• Запросы по любому полю
на любом уровне
• Гибкая изменяемая схема
• Замена значения по месту
• Требуется меньше индексов,
быстрее работает
• MongoDB, CouchDB, RethinkDB
EMBARCADERO TECHNOLOGIES
Реляционная модель требует нормализации
User
• Name
• Email
Address
Category
• Name
• Url
Article
• Name
• Slug
• Publish date
• Text
Tag
• Name
• Url
Comment
• Comment
• Date
• Author
User
• Name
• Email Address
Article
• Name
• Slug
• Publish date
• Text
• Author
Tag[]
• Value
Comment[]
• Comment
• Date
• Author
Category[]
• Value
В базе данных MongoDB хранятся документы
EMBARCADERO TECHNOLOGIES
MongoDB
Горизонтальная масштабируемость
{ author : “steve”,
date : new Date(),
text : “About MongoDB...”,
tags : [“tech”, “database”]}
Хранит
документы
Приложение
Высокая
производительность
Целостные
данные
EMBARCADERO TECHNOLOGIES
Пример документа о вебинаре
{ "_id" : ObjectId("516866d7b29e4f47ecdf02f0"),
"actual_duration_(minutes)_" : 69,
"actual_start_date/time" : ISODate("2012-10-15T21:00:00.000+04:00"),
"clicked_registration_link" : 6,
"details" : [
{ "first_name" : "Viacheslav",
"last_name" : "Slavinsky",
"interest_rating" : 80,
"questions_asked_by_attendee" : "Q: я слышуnA: --unanswered--n",
"registration_date" : ISODate("2012-10-15T20:54:00.000+04:00"),
"join_time" : ISODate("2012-10-15T21:01:00.000+04:00"),
"attended" : "Yes",
"unsubscribed" : "No",
"in_session_duration*_(minutes)_" : 69.03,
"leave_time" : ISODate("2012-10-15T22:10:00.000+04:00"),
"email" : "viacheslav.slavinsky@embarcadero.com" },
{},
{},
{},
{},
{},
],
"generated" : ISODate("2013-04-12T16:33:00.000+04:00"),
"opened_invitation" : 0,
"presenter" : [ "VLeonov" ],
"tools" : "RAD Studio",
"total_attended" : 6,
"webinar_id" : 857747534,
"webinar_name" : "Blogging on FireMonkey"
}
EMBARCADERO TECHNOLOGIES
Широкий набор возможностей
• Богатый язык запросов (полный CRUD)
• GeoSpatial – географические запросы
• Текстовый поиск
• Гибкие схемы
• Aggregation и MapReduce
• GridFS (distributed & replicated file storage для больших объектов)
• Интеграция с Hadoop, Storm, Solr и т.п.
EMBARCADERO TECHNOLOGIES
Автоматическая репликация данных.
EMBARCADERO TECHNOLOGIES
EMBARCADERO TECHNOLOGIES
Горизонтальное масштабирование
EMBARCADERO TECHNOLOGIES
Баланс
Масштабируемостьипроизводительность
Глубина функциональных возможностей
MongoDB
Memcached
RDBMS
EMBARCADERO TECHNOLOGIES
Почему MongoDB?
Используют MongoDB в
промышленном режиме
EMBARCADERO TECHNOLOGIES
А также…
• и тысячи кроме этого
EMBARCADERO TECHNOLOGIES
MongoDB & Hadoop
EMBARCADERO TECHNOLOGIES
N
EMBARCADERO TECHNOLOGIES
Прямая поддержка Big Data и NoSQL – в ER/Studio XE6
• Big Data Forward / Reverse Engineering
• Сбор описаний новых источников данных
Классические No SQL
• DW, BI
• Data Vault
• Инфраструктуры
• Специализированные
• Новые источники данных
• Новые типы
• Нужны модели (нет жестких схем)
На базе PostgreSQL
MPP EDW
EMBARCADERO TECHNOLOGIES
Прямая поддержка Big Data и NoSQL – в ER/Studio XE6
• MongoDB
– Versions 2.4 and 2.6
• Hadoop Hive
– Versions 0.12 and 0.13
• Возможности
– Создание диаграмм
– Reverse Engineering (JSON, BSON)
– Создание DDL для Hive (без ALTER)
– Создание JSON-шаблона для MongoDB
32
EMBARCADERO TECHNOLOGIES
Hive и ER/Studio
33
EMBARCADERO TECHNOLOGIES
Классические СУБД и технологии Hadoop могут работать вместе
Программная
аналитика
Стандартные
Средства (SQL)
Реляционные Многоструктурные
данные
SQL
Hadoop
DW
Stagingdata
Data Warehouse
Анализ данных
Delphi, Java, C++, C#, PHP, Python,
Perl, Ruby
EMBARCADERO TECHNOLOGIES
Где еще пригодятся инструменты Embarcadero для работы с БД
EMBARCADERO TECHNOLOGIES
Архитектура и модели в эпоху NoSQL
• Модель появляется в результате работы архитектора
• Без инструментов моделирования не обойтись
• Есть много типов моделей данных: какие именно вам нужны?
• В разных проектах модели нужны в разное время. Но они должны
быть доступны в нужное время
• Моделирование не просто проектирование схем. Это взгляд «с
высоты птичьего полета» и на перспективу
EMBARCADERO TECHNOLOGIES
Архитектура и модели в эпоху NoSQL
• Модели данных содержат гораздо больше, чем просто диаграммы
• Может потребоваться обучение моделированию
• Участники проекта могут не понимать модели. Обучите их
• Есть много вариантов использования NoSql. Рассмотрите все
способы
• Современные архитектуры данных чаще всего представляют
смешанные решения. Нельзя поддерживать только одну часть из
общего
EMBARCADERO TECHNOLOGIES
Роль архитекторов и разработчиков в проектах
• Для архитекторов данных
это означает:
– Останется место для
традиционных,
реляционных моделей
– …как и для разработчиков
– Все данные имеют свое
назначение. Множество
назначений.
– Нужно найти верное
решение для каждого
такого назначения
EMBARCADERO TECHNOLOGIES
Наш набор Database Tools
40
Не важно, работаете ли в команде
над масштабными моделями
данных, управляете
гетерогенными средами с
многочисленными типами СУБД
или разрабатываете оптимальный
по производительности код на SQL,
инструменты Embarcadero для
работы с БД дают существенный
рост продуктивности на еще более
расширенном наборе
поддерживаемых платформ СУБД
EMBARCADERO TECHNOLOGIES
Полезные ссылки
• Для более подробной информации о ER/Studio
http://www.embarcadero.com/products/er-studio
http://www.embarcadero.com/solutions/data-governance
• Демонстрационные примеры ER/Studio
http://www.embarcadero.com/quick-solution-demos
• Загрузка бесплатной пробной версии (Free Trial)
https://downloads.embarcadero.com/free/er_studio_enterprise
http://webportal.embarcadero.com (username=“PortalUser”, password=“portal*trial”)
• Примеры использования
Newmont Mining, Protective Life, Catalina Marketing, Entrust, Microsoft:
http://www.embarcadero.com/our-customers/case-studies
• Поддержка
http://www.embarcadero.com/support
• Представительство
mailto: Russia.Info@embarcadero.com
Телефон: +7(495)7084393
В социальных сетях
Facebook: http://on.fb.me/WDUQqY
LinkedIn: http://linkd.in/WDVeWu
Google+: http://bit.ly/WDVViL
Twitter: @ERStudio
EMBARCADERO TECHNOLOGIES
90 из Fortune 100 и 97% из Global 2000
EMBARCADERO TECHNOLOGIES
Спасибо за внимание!
Powering Today’s Applications and Data
Андрей Совцов
Embarcadero
Email: Andrew.Sovtsov@Embarcadero.com
Blog: http://embt.co/ASovtsov
Tel: +7(495)708 4393
Записи вебинаров: http://embt.co/MrAndySova
Блоги Embarcadero
(все языки):
http://community.embarcadero.com/index.php/blogs
EMBARCADERO TECHNOLOGIES
Вопросы?
EMBARCADERO TECHNOLOGIES
Приложение
EMBARCADERO TECHNOLOGIES
Рост интереса по годам
EMBARCADERO TECHNOLOGIES
Интерес по странам
EMBARCADERO TECHNOLOGIES
Big Data & NoSQL Resources (EMBT)
• Big Data & NoSQL Solution Webinar (recorded)
– https://www3.gotomeeting.com/register/264404974?elq=eadeadfbc4414ca1b53c906d6624f701&elqCampaignId=2703
• ER/Studio XE6 - Data Architect 10 New Features Guide - Big Data / NoSQL platforms
– http://docs.embarcadero.com/products/er_studio/erstudioDA10.0.0_EN/ERStudioDA_10.0.0_NewFeaturesGuide_EN.pdf
• Perform reverse and forward engineering with Hadoop Hive
– http://www.youtube.com/watch?v=SQSiPwbdTlA&vq=hd720&width=940&height=680
• ER/Studio Support for MongoDB
– https://www.youtube.com/watch?v=ZKbjlsa2bhI
• NoSQL and Big Data Modeling: 10 Tips for Data Modelers and Architects
– http://embt.co/1xbDJPU
– Webinar Recording (Karen Lopez) : http://buff.ly/1mpu0Uh
48

More Related Content

Viewers also liked

10 причин перехода пользователей с ERwin на Embarcadero ER/Studio
10 причин перехода пользователей с ERwin на Embarcadero ER/Studio10 причин перехода пользователей с ERwin на Embarcadero ER/Studio
10 причин перехода пользователей с ERwin на Embarcadero ER/StudioAndrew Sovtsov
 
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
14-02-26 DBA 101_ как найти и устранить причины замедления работы БДAndrew Sovtsov
 
20160330 Занятие 6. Серия практических занятий "Чеклист"
20160330 Занятие 6. Серия практических занятий "Чеклист"  20160330 Занятие 6. Серия практических занятий "Чеклист"
20160330 Занятие 6. Серия практических занятий "Чеклист" Andrew Sovtsov
 
Embarcadero Team Server для администраторов БД
Embarcadero Team Server для администраторов БДEmbarcadero Team Server для администраторов БД
Embarcadero Team Server для администраторов БДAndrew Sovtsov
 
20160323 Пример бизнес-приложения контроля качества в розничной торговле
20160323 Пример бизнес-приложения контроля качества в розничной торговле20160323 Пример бизнес-приложения контроля качества в розничной торговле
20160323 Пример бизнес-приложения контроля качества в розничной торговлеAndrew Sovtsov
 
20160309 Простейший контрольный список на мобильном устройстве
20160309 Простейший контрольный список на мобильном устройстве20160309 Простейший контрольный список на мобильном устройстве
20160309 Простейший контрольный список на мобильном устройствеAndrew Sovtsov
 
20151112 Что нового в DB PowerStudio 2016
20151112 Что нового в DB PowerStudio 201620151112 Что нового в DB PowerStudio 2016
20151112 Что нового в DB PowerStudio 2016Andrew Sovtsov
 
Как использовать Rapid SQL для ускорения разработки SQL и другого кода для СУБД
Как использовать Rapid SQL для ускорения разработки SQL и другого кода для СУБДКак использовать Rapid SQL для ускорения разработки SQL и другого кода для СУБД
Как использовать Rapid SQL для ускорения разработки SQL и другого кода для СУБДAndrew Sovtsov
 
20160316 Работа с подготовленными заранее опросниками, хранимыми на сервере
20160316 Работа с подготовленными заранее опросниками, хранимыми на сервере20160316 Работа с подготовленными заранее опросниками, хранимыми на сервере
20160316 Работа с подготовленными заранее опросниками, хранимыми на сервереAndrew Sovtsov
 
DBArtisan 2016 это не просто face lifting!
DBArtisan 2016 это не просто face lifting!DBArtisan 2016 это не просто face lifting!
DBArtisan 2016 это не просто face lifting!Andrew Sovtsov
 
InterBase XE7: Применение Change Views для синхронизации данных
InterBase XE7: Применение Change Views для синхронизации данныхInterBase XE7: Применение Change Views для синхронизации данных
InterBase XE7: Применение Change Views для синхронизации данныхAndrew Sovtsov
 
20160330 Приложение с использованием данных с сервера (EMS)
20160330 Приложение с использованием данных с сервера (EMS) 20160330 Приложение с использованием данных с сервера (EMS)
20160330 Приложение с использованием данных с сервера (EMS) Andrew Sovtsov
 
2015/06/18 Как работать с InterBase Change Views в Delphi программах
2015/06/18 Как работать с InterBase Change Views в Delphi программах 2015/06/18 Как работать с InterBase Change Views в Delphi программах
2015/06/18 Как работать с InterBase Change Views в Delphi программах Andrew Sovtsov
 
Управление метаданными графических файлов на примере VCL приложения Windows
Управление метаданными графических файлов на примере VCL приложения WindowsУправление метаданными графических файлов на примере VCL приложения Windows
Управление метаданными графических файлов на примере VCL приложения WindowsAndrew Sovtsov
 
RAD Server для разработки современных корпоративных систем
RAD Server для разработки современных корпоративных системRAD Server для разработки современных корпоративных систем
RAD Server для разработки современных корпоративных системAndrew Sovtsov
 
Interbase xe7 - универсальная субд для windows linux mac ios android
Interbase xe7 - универсальная субд для windows linux mac ios androidInterbase xe7 - универсальная субд для windows linux mac ios android
Interbase xe7 - универсальная субд для windows linux mac ios androidAndrew Sovtsov
 
Моделирование для NoSQL БД
Моделирование для NoSQL БДМоделирование для NoSQL БД
Моделирование для NoSQL БДAndrew Sovtsov
 

Viewers also liked (17)

10 причин перехода пользователей с ERwin на Embarcadero ER/Studio
10 причин перехода пользователей с ERwin на Embarcadero ER/Studio10 причин перехода пользователей с ERwin на Embarcadero ER/Studio
10 причин перехода пользователей с ERwin на Embarcadero ER/Studio
 
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
 
20160330 Занятие 6. Серия практических занятий "Чеклист"
20160330 Занятие 6. Серия практических занятий "Чеклист"  20160330 Занятие 6. Серия практических занятий "Чеклист"
20160330 Занятие 6. Серия практических занятий "Чеклист"
 
Embarcadero Team Server для администраторов БД
Embarcadero Team Server для администраторов БДEmbarcadero Team Server для администраторов БД
Embarcadero Team Server для администраторов БД
 
20160323 Пример бизнес-приложения контроля качества в розничной торговле
20160323 Пример бизнес-приложения контроля качества в розничной торговле20160323 Пример бизнес-приложения контроля качества в розничной торговле
20160323 Пример бизнес-приложения контроля качества в розничной торговле
 
20160309 Простейший контрольный список на мобильном устройстве
20160309 Простейший контрольный список на мобильном устройстве20160309 Простейший контрольный список на мобильном устройстве
20160309 Простейший контрольный список на мобильном устройстве
 
20151112 Что нового в DB PowerStudio 2016
20151112 Что нового в DB PowerStudio 201620151112 Что нового в DB PowerStudio 2016
20151112 Что нового в DB PowerStudio 2016
 
Как использовать Rapid SQL для ускорения разработки SQL и другого кода для СУБД
Как использовать Rapid SQL для ускорения разработки SQL и другого кода для СУБДКак использовать Rapid SQL для ускорения разработки SQL и другого кода для СУБД
Как использовать Rapid SQL для ускорения разработки SQL и другого кода для СУБД
 
20160316 Работа с подготовленными заранее опросниками, хранимыми на сервере
20160316 Работа с подготовленными заранее опросниками, хранимыми на сервере20160316 Работа с подготовленными заранее опросниками, хранимыми на сервере
20160316 Работа с подготовленными заранее опросниками, хранимыми на сервере
 
DBArtisan 2016 это не просто face lifting!
DBArtisan 2016 это не просто face lifting!DBArtisan 2016 это не просто face lifting!
DBArtisan 2016 это не просто face lifting!
 
InterBase XE7: Применение Change Views для синхронизации данных
InterBase XE7: Применение Change Views для синхронизации данныхInterBase XE7: Применение Change Views для синхронизации данных
InterBase XE7: Применение Change Views для синхронизации данных
 
20160330 Приложение с использованием данных с сервера (EMS)
20160330 Приложение с использованием данных с сервера (EMS) 20160330 Приложение с использованием данных с сервера (EMS)
20160330 Приложение с использованием данных с сервера (EMS)
 
2015/06/18 Как работать с InterBase Change Views в Delphi программах
2015/06/18 Как работать с InterBase Change Views в Delphi программах 2015/06/18 Как работать с InterBase Change Views в Delphi программах
2015/06/18 Как работать с InterBase Change Views в Delphi программах
 
Управление метаданными графических файлов на примере VCL приложения Windows
Управление метаданными графических файлов на примере VCL приложения WindowsУправление метаданными графических файлов на примере VCL приложения Windows
Управление метаданными графических файлов на примере VCL приложения Windows
 
RAD Server для разработки современных корпоративных систем
RAD Server для разработки современных корпоративных системRAD Server для разработки современных корпоративных систем
RAD Server для разработки современных корпоративных систем
 
Interbase xe7 - универсальная субд для windows linux mac ios android
Interbase xe7 - универсальная субд для windows linux mac ios androidInterbase xe7 - универсальная субд для windows linux mac ios android
Interbase xe7 - универсальная субд для windows linux mac ios android
 
Моделирование для NoSQL БД
Моделирование для NoSQL БДМоделирование для NoSQL БД
Моделирование для NoSQL БД
 

Similar to Поддержка NoSQL и платформ MongoDB, Hive и Teradata в продуктах Embarcadero

Информационные технологии в эру Больших данных
Информационные технологии в эру Больших данныхИнформационные технологии в эру Больших данных
Информационные технологии в эру Больших данныхСергей Макрушин
 
Информационные технологии в эру Больших данных
Информационные технологии в эру Больших данныхИнформационные технологии в эру Больших данных
Информационные технологии в эру Больших данныхSergey Makrushin
 
#ITsubbotnik Spring 2017: Sergey Chernolyas "JPA for NoSQL"
#ITsubbotnik Spring 2017: Sergey Chernolyas "JPA for NoSQL"#ITsubbotnik Spring 2017: Sergey Chernolyas "JPA for NoSQL"
#ITsubbotnik Spring 2017: Sergey Chernolyas "JPA for NoSQL"epamspb
 
Fors и big data appliance
Fors и big data applianceFors и big data appliance
Fors и big data applianceCleverDATA
 
MongoDB. Области применения, преимущества и узкие места, тонкости использован...
MongoDB. Области применения, преимущества и узкие места, тонкости использован...MongoDB. Области применения, преимущества и узкие места, тонкости использован...
MongoDB. Области применения, преимущества и узкие места, тонкости использован...phpdevby
 
Обзор перспективных баз данных для highload / Юрий Насретдинов
Обзор перспективных баз данных для highload / Юрий НасретдиновОбзор перспективных баз данных для highload / Юрий Насретдинов
Обзор перспективных баз данных для highload / Юрий НасретдиновOntico
 
Денис Иванов
Денис ИвановДенис Иванов
Денис ИвановCodeFest
 
NoSQL - World IT Planet, Saint Petersburg 2015
NoSQL - World IT Planet, Saint Petersburg 2015NoSQL - World IT Planet, Saint Petersburg 2015
NoSQL - World IT Planet, Saint Petersburg 2015Shamim bhuiyan
 
Daemons In Web on #devrus
Daemons In Web on #devrusDaemons In Web on #devrus
Daemons In Web on #devrusAlex Chistyakov
 
Microsoft , Azure и Drupal
Microsoft , Azure и DrupalMicrosoft , Azure и Drupal
Microsoft , Azure и DrupalPVasili
 
Организация хранения данных сейсморазведки и промысловой геофизики
Организация хранения данных сейсморазведки и промысловой геофизикиОрганизация хранения данных сейсморазведки и промысловой геофизики
Организация хранения данных сейсморазведки и промысловой геофизикиVsevolod Shabad
 
DBD lection 4. Big Data, NoSQL. In Russian.
DBD lection 4. Big Data, NoSQL. In Russian.DBD lection 4. Big Data, NoSQL. In Russian.
DBD lection 4. Big Data, NoSQL. In Russian.mikhaelsmirnov
 
Точка кипения: проектирование крупных веб-систем
Точка кипения:  проектирование крупных веб-системТочка кипения:  проектирование крупных веб-систем
Точка кипения: проектирование крупных веб-системRoman Ivliev
 
Проектирование архитектуры крупных веб-систем
Проектирование архитектуры крупных веб-системПроектирование архитектуры крупных веб-систем
Проектирование архитектуры крупных веб-системTKConf
 
Павел Прищепа. Бббыстрый бэкенд на базе друпал
Павел Прищепа. Бббыстрый бэкенд на базе друпалПавел Прищепа. Бббыстрый бэкенд на базе друпал
Павел Прищепа. Бббыстрый бэкенд на базе друпалKsenia Rogachenko
 
Павел Прищепа. Бббыстрый бэкенд на базе Друпал
Павел Прищепа. Бббыстрый бэкенд на базе ДрупалПавел Прищепа. Бббыстрый бэкенд на базе Друпал
Павел Прищепа. Бббыстрый бэкенд на базе ДрупалDrupalSib
 
презентация оо субд сколково
презентация оо субд сколковопрезентация оо субд сколково
презентация оо субд сколковоvagrachev
 
20 апреля, DEV {highload}, "Демоны в большом проекте – проблемы и их решения ...
20 апреля, DEV {highload}, "Демоны в большом проекте – проблемы и их решения ...20 апреля, DEV {highload}, "Демоны в большом проекте – проблемы и их решения ...
20 апреля, DEV {highload}, "Демоны в большом проекте – проблемы и их решения ...IT-Portfolio
 

Similar to Поддержка NoSQL и платформ MongoDB, Hive и Teradata в продуктах Embarcadero (20)

Информационные технологии в эру Больших данных
Информационные технологии в эру Больших данныхИнформационные технологии в эру Больших данных
Информационные технологии в эру Больших данных
 
Информационные технологии в эру Больших данных
Информационные технологии в эру Больших данныхИнформационные технологии в эру Больших данных
Информационные технологии в эру Больших данных
 
#ITsubbotnik Spring 2017: Sergey Chernolyas "JPA for NoSQL"
#ITsubbotnik Spring 2017: Sergey Chernolyas "JPA for NoSQL"#ITsubbotnik Spring 2017: Sergey Chernolyas "JPA for NoSQL"
#ITsubbotnik Spring 2017: Sergey Chernolyas "JPA for NoSQL"
 
Fors и big data appliance
Fors и big data applianceFors и big data appliance
Fors и big data appliance
 
MongoDB. Области применения, преимущества и узкие места, тонкости использован...
MongoDB. Области применения, преимущества и узкие места, тонкости использован...MongoDB. Области применения, преимущества и узкие места, тонкости использован...
MongoDB. Области применения, преимущества и узкие места, тонкости использован...
 
Nosql and Mongodb
Nosql and MongodbNosql and Mongodb
Nosql and Mongodb
 
Обзор перспективных баз данных для highload / Юрий Насретдинов
Обзор перспективных баз данных для highload / Юрий НасретдиновОбзор перспективных баз данных для highload / Юрий Насретдинов
Обзор перспективных баз данных для highload / Юрий Насретдинов
 
Денис Иванов
Денис ИвановДенис Иванов
Денис Иванов
 
NoSQL - World IT Planet, Saint Petersburg 2015
NoSQL - World IT Planet, Saint Petersburg 2015NoSQL - World IT Planet, Saint Petersburg 2015
NoSQL - World IT Planet, Saint Petersburg 2015
 
Daemons In Web on #devrus
Daemons In Web on #devrusDaemons In Web on #devrus
Daemons In Web on #devrus
 
Microsoft , Azure и Drupal
Microsoft , Azure и DrupalMicrosoft , Azure и Drupal
Microsoft , Azure и Drupal
 
Организация хранения данных сейсморазведки и промысловой геофизики
Организация хранения данных сейсморазведки и промысловой геофизикиОрганизация хранения данных сейсморазведки и промысловой геофизики
Организация хранения данных сейсморазведки и промысловой геофизики
 
DBD lection 4. Big Data, NoSQL. In Russian.
DBD lection 4. Big Data, NoSQL. In Russian.DBD lection 4. Big Data, NoSQL. In Russian.
DBD lection 4. Big Data, NoSQL. In Russian.
 
Точка кипения: проектирование крупных веб-систем
Точка кипения:  проектирование крупных веб-системТочка кипения:  проектирование крупных веб-систем
Точка кипения: проектирование крупных веб-систем
 
Проектирование архитектуры крупных веб-систем
Проектирование архитектуры крупных веб-системПроектирование архитектуры крупных веб-систем
Проектирование архитектуры крупных веб-систем
 
Павел Прищепа. Бббыстрый бэкенд на базе друпал
Павел Прищепа. Бббыстрый бэкенд на базе друпалПавел Прищепа. Бббыстрый бэкенд на базе друпал
Павел Прищепа. Бббыстрый бэкенд на базе друпал
 
Павел Прищепа. Бббыстрый бэкенд на базе Друпал
Павел Прищепа. Бббыстрый бэкенд на базе ДрупалПавел Прищепа. Бббыстрый бэкенд на базе Друпал
Павел Прищепа. Бббыстрый бэкенд на базе Друпал
 
презентация оо субд сколково
презентация оо субд сколковопрезентация оо субд сколково
презентация оо субд сколково
 
20 апреля, DEV {highload}, "Демоны в большом проекте – проблемы и их решения ...
20 апреля, DEV {highload}, "Демоны в большом проекте – проблемы и их решения ...20 апреля, DEV {highload}, "Демоны в большом проекте – проблемы и их решения ...
20 апреля, DEV {highload}, "Демоны в большом проекте – проблемы и их решения ...
 
Embarcadero strategy
Embarcadero strategyEmbarcadero strategy
Embarcadero strategy
 

Поддержка NoSQL и платформ MongoDB, Hive и Teradata в продуктах Embarcadero

  • 1. EMBARCADERO TECHNOLOGIES Кросс-платформенные инструменты для работы с БД Андрей Совцов Embarcadero,Москва email: Andrew.Sovtsov@embarcadero.com Поддержка NoSQL и платформ Big Data: MongoDB, Hive, Teradata и др.
  • 2. EMBARCADERO TECHNOLOGIES Темы 1. СУБД сегодня 2. Большие данные 3. NoSQL: категории СУБД 4. MongoDB 5. «Горизонтальное» масштабирование БД 6. Map Reduce, Hadoop, Hive 7. Проектирование NoSQL БД 8. ER/Studio и NoSQL (demo)
  • 4. EMBARCADERO TECHNOLOGIES Big Data 2014 Все более значительная часть ИТ Применяется • Инфраструктура • Аналитика • Приложения 5
  • 5. EMBARCADERO TECHNOLOGIES Проблемы «Больших данных» в картинках
  • 6. EMBARCADERO TECHNOLOGIES Что требуется от БД? • Удобная для отображения моих данных структура данных • Скорость и возможность масштабирования (верт. и гор. ) • Богатые и удобные средства доступа и разработки приложений
  • 7. EMBARCADERO TECHNOLOGIES Что означает «масштабирование»? • Перенос обработки как можно ближе к данным • Массивно-параллельная обработка • Использование более дешевого, стандартного оборудования, но в больших количествах • Оптимизация для: запросов / чтения / вопросов / аналитики
  • 10. EMBARCADERO TECHNOLOGIES NoSQL, не только SQL Реляционные Графические Колоночные Ключ- значение Документные Другие
  • 11. EMBARCADERO TECHNOLOGIES Терминология ACID Atomic, Consistent, Isolated, Durable Атомарность, Согласованность, Изолированность, Надежность BASE Basically available, Soft state, Eventual consistency базовая доступность гибкое состояние согласованность в конечном счёте Eventual consistency Согласованность в конечном счете Schemaless Отсутствие схемы данных Constraints / Have-to/ MUST / OBEY / Rigid / Inflexible Ограничения
  • 12. EMBARCADERO TECHNOLOGIES Мифы про «Большие данные» • Отсутствие схемы данных – При чтении мы все равно получаем структуру – При записи мы можем использовать другую • Лучше говорить о «данных с множеством схем» • Новая аппаратная база • Новые технологии
  • 13. EMBARCADERO TECHNOLOGIES Schema для записи/ Schema на чтение Schema для записи(RDBMS) Директивное моделирование данных: • Создать схему БД • Загрузить данные в формате RDBMS • Запросы к данным в формате RDBMS Новые колонки должны быть добавлены ДО ТОГО, как новые данные будут помещены в систему. Хорошо для Known Unknowns (повторяемости) 14 Schema на чтение(Hadoop/NoSQL) Описательное моделирование данных: • Собрать данные в натуральном формате • Создать схему • Запросы к данным в натуральном формате Новые данные могут появляться в любое время и появляться задним числом если схема правильно описывает их Хорошо для Unknown Unknowns (исследования)
  • 15. EMBARCADERO TECHNOLOGIES Колоночные (ключзначение) • Хранение по колонкам (one-dimensional) • Единица значения – BLOB • Запросы только по ключу • Некоторые СУБД поддерживают вторичные индексы • Схема не существует • Update запрещены – только перезапись • Cassandra, Redis, MemcacheD, Riak, DynamoDB, Sybase IQ
  • 17. EMBARCADERO TECHNOLOGIES Реляционные и документо-ориентированные Реляционные • Запросы по любому полю • Замена по месту • Табличное хранение • Каждое поле содержит единственное значение • «Жесткая» схема • Нормализация приводит к Joins «мелких» таблиц • Oracle, MSSQL, MySQL, PostgreSQL,DB2 Документные • Многомерное хранение • В каждом поле м.б. 0,1 или много значений • Запросы по любому полю на любом уровне • Гибкая изменяемая схема • Замена значения по месту • Требуется меньше индексов, быстрее работает • MongoDB, CouchDB, RethinkDB
  • 18. EMBARCADERO TECHNOLOGIES Реляционная модель требует нормализации User • Name • Email Address Category • Name • Url Article • Name • Slug • Publish date • Text Tag • Name • Url Comment • Comment • Date • Author User • Name • Email Address Article • Name • Slug • Publish date • Text • Author Tag[] • Value Comment[] • Comment • Date • Author Category[] • Value В базе данных MongoDB хранятся документы
  • 19. EMBARCADERO TECHNOLOGIES MongoDB Горизонтальная масштабируемость { author : “steve”, date : new Date(), text : “About MongoDB...”, tags : [“tech”, “database”]} Хранит документы Приложение Высокая производительность Целостные данные
  • 20. EMBARCADERO TECHNOLOGIES Пример документа о вебинаре { "_id" : ObjectId("516866d7b29e4f47ecdf02f0"), "actual_duration_(minutes)_" : 69, "actual_start_date/time" : ISODate("2012-10-15T21:00:00.000+04:00"), "clicked_registration_link" : 6, "details" : [ { "first_name" : "Viacheslav", "last_name" : "Slavinsky", "interest_rating" : 80, "questions_asked_by_attendee" : "Q: я слышуnA: --unanswered--n", "registration_date" : ISODate("2012-10-15T20:54:00.000+04:00"), "join_time" : ISODate("2012-10-15T21:01:00.000+04:00"), "attended" : "Yes", "unsubscribed" : "No", "in_session_duration*_(minutes)_" : 69.03, "leave_time" : ISODate("2012-10-15T22:10:00.000+04:00"), "email" : "viacheslav.slavinsky@embarcadero.com" }, {}, {}, {}, {}, {}, ], "generated" : ISODate("2013-04-12T16:33:00.000+04:00"), "opened_invitation" : 0, "presenter" : [ "VLeonov" ], "tools" : "RAD Studio", "total_attended" : 6, "webinar_id" : 857747534, "webinar_name" : "Blogging on FireMonkey" }
  • 21. EMBARCADERO TECHNOLOGIES Широкий набор возможностей • Богатый язык запросов (полный CRUD) • GeoSpatial – географические запросы • Текстовый поиск • Гибкие схемы • Aggregation и MapReduce • GridFS (distributed & replicated file storage для больших объектов) • Интеграция с Hadoop, Storm, Solr и т.п.
  • 26. EMBARCADERO TECHNOLOGIES Почему MongoDB? Используют MongoDB в промышленном режиме
  • 27. EMBARCADERO TECHNOLOGIES А также… • и тысячи кроме этого
  • 30. EMBARCADERO TECHNOLOGIES Прямая поддержка Big Data и NoSQL – в ER/Studio XE6 • Big Data Forward / Reverse Engineering • Сбор описаний новых источников данных Классические No SQL • DW, BI • Data Vault • Инфраструктуры • Специализированные • Новые источники данных • Новые типы • Нужны модели (нет жестких схем) На базе PostgreSQL MPP EDW
  • 31. EMBARCADERO TECHNOLOGIES Прямая поддержка Big Data и NoSQL – в ER/Studio XE6 • MongoDB – Versions 2.4 and 2.6 • Hadoop Hive – Versions 0.12 and 0.13 • Возможности – Создание диаграмм – Reverse Engineering (JSON, BSON) – Создание DDL для Hive (без ALTER) – Создание JSON-шаблона для MongoDB 32
  • 33. EMBARCADERO TECHNOLOGIES Классические СУБД и технологии Hadoop могут работать вместе Программная аналитика Стандартные Средства (SQL) Реляционные Многоструктурные данные SQL Hadoop DW Stagingdata Data Warehouse Анализ данных Delphi, Java, C++, C#, PHP, Python, Perl, Ruby
  • 34. EMBARCADERO TECHNOLOGIES Где еще пригодятся инструменты Embarcadero для работы с БД
  • 35. EMBARCADERO TECHNOLOGIES Архитектура и модели в эпоху NoSQL • Модель появляется в результате работы архитектора • Без инструментов моделирования не обойтись • Есть много типов моделей данных: какие именно вам нужны? • В разных проектах модели нужны в разное время. Но они должны быть доступны в нужное время • Моделирование не просто проектирование схем. Это взгляд «с высоты птичьего полета» и на перспективу
  • 36. EMBARCADERO TECHNOLOGIES Архитектура и модели в эпоху NoSQL • Модели данных содержат гораздо больше, чем просто диаграммы • Может потребоваться обучение моделированию • Участники проекта могут не понимать модели. Обучите их • Есть много вариантов использования NoSql. Рассмотрите все способы • Современные архитектуры данных чаще всего представляют смешанные решения. Нельзя поддерживать только одну часть из общего
  • 37. EMBARCADERO TECHNOLOGIES Роль архитекторов и разработчиков в проектах • Для архитекторов данных это означает: – Останется место для традиционных, реляционных моделей – …как и для разработчиков – Все данные имеют свое назначение. Множество назначений. – Нужно найти верное решение для каждого такого назначения
  • 38. EMBARCADERO TECHNOLOGIES Наш набор Database Tools 40 Не важно, работаете ли в команде над масштабными моделями данных, управляете гетерогенными средами с многочисленными типами СУБД или разрабатываете оптимальный по производительности код на SQL, инструменты Embarcadero для работы с БД дают существенный рост продуктивности на еще более расширенном наборе поддерживаемых платформ СУБД
  • 39. EMBARCADERO TECHNOLOGIES Полезные ссылки • Для более подробной информации о ER/Studio http://www.embarcadero.com/products/er-studio http://www.embarcadero.com/solutions/data-governance • Демонстрационные примеры ER/Studio http://www.embarcadero.com/quick-solution-demos • Загрузка бесплатной пробной версии (Free Trial) https://downloads.embarcadero.com/free/er_studio_enterprise http://webportal.embarcadero.com (username=“PortalUser”, password=“portal*trial”) • Примеры использования Newmont Mining, Protective Life, Catalina Marketing, Entrust, Microsoft: http://www.embarcadero.com/our-customers/case-studies • Поддержка http://www.embarcadero.com/support • Представительство mailto: Russia.Info@embarcadero.com Телефон: +7(495)7084393 В социальных сетях Facebook: http://on.fb.me/WDUQqY LinkedIn: http://linkd.in/WDVeWu Google+: http://bit.ly/WDVViL Twitter: @ERStudio
  • 40. EMBARCADERO TECHNOLOGIES 90 из Fortune 100 и 97% из Global 2000
  • 41. EMBARCADERO TECHNOLOGIES Спасибо за внимание! Powering Today’s Applications and Data Андрей Совцов Embarcadero Email: Andrew.Sovtsov@Embarcadero.com Blog: http://embt.co/ASovtsov Tel: +7(495)708 4393 Записи вебинаров: http://embt.co/MrAndySova Блоги Embarcadero (все языки): http://community.embarcadero.com/index.php/blogs
  • 46. EMBARCADERO TECHNOLOGIES Big Data & NoSQL Resources (EMBT) • Big Data & NoSQL Solution Webinar (recorded) – https://www3.gotomeeting.com/register/264404974?elq=eadeadfbc4414ca1b53c906d6624f701&elqCampaignId=2703 • ER/Studio XE6 - Data Architect 10 New Features Guide - Big Data / NoSQL platforms – http://docs.embarcadero.com/products/er_studio/erstudioDA10.0.0_EN/ERStudioDA_10.0.0_NewFeaturesGuide_EN.pdf • Perform reverse and forward engineering with Hadoop Hive – http://www.youtube.com/watch?v=SQSiPwbdTlA&vq=hd720&width=940&height=680 • ER/Studio Support for MongoDB – https://www.youtube.com/watch?v=ZKbjlsa2bhI • NoSQL and Big Data Modeling: 10 Tips for Data Modelers and Architects – http://embt.co/1xbDJPU – Webinar Recording (Karen Lopez) : http://buff.ly/1mpu0Uh 48