apache cassandra и подруга её scylla

Apache Cassandra
и подруга её Scylla
Даниил Подольский
независимый консультант

Немного о докладчике
● Эксплуатирую кассандру в разных
проектах

Немного о докладчике
● Эксплуатирую кассандру в разных
проектах
● Уже 5 лет

Немного о докладе
● Фактически - обзорный

● Цель - продемонстрировать отличия
от “традиционных” AKA
реляционных СУБД

● Чтобы дать представление о круге
задач, для которых Cassandra
подходит хорошо

● Чтобы дать представление о круге
задач, для которых Cassandra
подходит хорошо
○ Спойлер: этот круг довольно узок

Cassandra, как мы ее себе
представляем
Cassandra
● NoSQL DBMS

Cassandra
● NoSQL DBMS
● Отказоустойчивая

Cassandra
● NoSQL DBMS
● Распределенная

Cassandra
● NoSQL DBMS
● Быстрая

Cassandra
● NoSQL DBMS
● Быстрая
● Eventually consistent

Cassandra, как она есть
● NoSQL DBMS

● NoSQL DBMS
○ схема данных и язык CQL

● NoSQL DBMS

● NoSQL DBMS
● Быстрая

● NoSQL DBMS
● Быстрая
○ Time based, со всеми вытекающими

В сравнении с RDBMS
Отсутствуют

● Relations (foreign keys, joins, etc)

● Транзакции

○ есть в рамках одной строки

● Вторичные индексы

○ Они есть

○ Они есть
○ Но работают иначе

Скорость
● Кассандра быстро пишет

Скорость
○ И расходует при этом много iops

Скорость
● Cassandra читает как-то

Скорость
○ Никаких гарантий

Скорость
○ Но обычно - быстро

Скорость
○ Но обычно - быстро
■ Если не перегружена

Потому, что гладиолус LevelDB
● Append only

● Append only
● Compaction

● Append only
● Compaction
Вообще, по-настоящему хорошо это
работает, если никогда не делать
UPDATE

Об архитектуре хранения данных
● PRIMARY KEY

● PRIMARY KEY
○ Обязателен

● PRIMARY KEY
○ Уникален

● PRIMARY KEY
○ Определяет шард

● PRIMARY KEY
■ Который определяет сервер, на
котором хранятся данные

● PRIMARY KEY
■ Который определяет сервер, на
котором хранятся данные
○ Двухчастный

● Двухчастный PRIMARY KEY

○ Partition Key

○ Partition Key
○ Clustering Key

○ Partition Key
○ Clustering Key
● Ключевой фактор, влияющий на
производительность

○ Partition Key
○ Clustering Key
○ Трудно понять, как правильно

○ Partition Key
○ Clustering Key
○ Трудно понять, как правильно
○ Невозможно поменять

О вторичных ключах
● Чисто маркетинговая фишка

○ Не нужны

○ Не нужны
● Работают плохо

○ Не нужны
● Запрос по вторичному ключу
достает данные со всех нод
кластера

○ Не нужны
● Запрос по вторичному ключу
достает данные со всех нод
кластера
○ Производительность падает при
расширении кластера

Еще о первичном ключе
● UPDATE для колонок, в него
включенных, невозможен

○ Потому, что первичный ключ
определяет физическое
расположение данных

○ Потому, что первичный ключ
определяет физическое
расположение данных
○ А DELETE-INSERT нельзя
сделать транзакционным в
распределенной системе

Отказоустойчивость
● Ключевой фактор - replication factor

○ Определяет, сколько полных
копий всех данных вы храните

○ При значениях меньше 3 не
обеспечивает отказоустойчивости

● Выбор ноды реализован на клиенте

● Rebalancing может быть болью

● Rebalancing может быть болью
○ и унижением

Memory mapped files
● Штатный способ доступа к данным
со стороны cassandra

Memory mapped files
● Но:

Memory mapped files
● Но:
○ Невидимы для iostat

Memory mapped files
● Но:
○ Неэффективно используют кеш

Memory mapped files
● Но:
■ Личные наблюдения

Memory mapped files
● Но:
■ Личные наблюдения
● Должно сильно зависеть
от данных

ScyllaDB
● Disclaimer: чистая теория

ScyllaDB
● Scylla is a drop-in Apache Cassandra
replacement that powers your
applications with ultra-low latency and
extreme throughput.

ScyllaDB
● Scylla is a drop-in Apache Cassandra
replacement that powers your
applications with ultra-low latency and
extreme throughput.
● http://www.scylladb.com/

ScyllaDB: о совместимости
● Scylla is compatible with Apache
Cassandra, version 2.1.8

● Самая важная страница

● Самая важная страница
○ http://docs.scylladb.com/cassandra-
compatibility/

ScyllaDB: чего не хватает
(из важного)
● Secondary Index

● Secondary Index
● User Define Functions

● Secondary Index
● User Define Functions
● Triggers

Спасибо
Вопросы?

Контакты докладчика
onokonem@gmail.com
Jabber: onokonem@gmail.com
Telegram: onokonem
Skype: onokonem

apache cassandra и подруга её scylla

More Related Content

What's hot

Similar to apache cassandra и подруга её scylla

More from Daniel Podolsky

apache cassandra и подруга её scylla