Как мы сбежали от PostgreSQL или когда реляционная БД не справляется, Куманяев Андрей

•

0 likes•862 views

Coub

Стачка 2015

Engineering

ÏПËЛÀАÒТÔФÎОÐРÌМÀА ÄДËЛßЯ ÑСÎОÇЗÄДÀАÍНÈИßЯ
ÈИ ÏПÐРÎОÑСÌМÎОÒТÐРÀА ÊКÎОÐРÎОÒТÊКÈИÕХ
ÇЗÀАÖЦÈИÊКËЛÅЕÍНÍНÛЫÕХ ÂВÈИÄДÅЕÎО ÄДÎО
10 ÑСÅЕÊКÓУÍНÄД ÄДËЛÈИÍНÍНÎОÉЙ
3

— N миллионов записей

— Взять из них 10 записей

— Подготовить JSON

— Отправить пользователю
7

— Большой JSON ~140 Kb

— Нетривиальная выборка

— Записи обновляются часто

— Tree

— Нет старого контента
9

11
Erotica

Banned

Private

Friends only

Copyright

Subscription

… etc.

12
0
175
350
525
700
1 10 20 40 50 100 200 300 500 700 1000
t, ms
follows

SELECT * FROM coubs LIMIT 10;

SELECT * FROM coubs LIMIT 10 OFFSET 10;

INSERT INTO coubs ........;

SELECT * FROM coubs LIMIT 10 OFFSET 20;
18

SELECT * FROM coubs LIMIT 10;

SELECT * FROM coubs LIMIT 10 OFFSET 10;

DELETE FROM coubs WHERE ........;

SELECT * FROM coubs LIMIT 10 OFFSET 20;
19

SELECT * FROM coubs LIMIT 10;

SELECT * FROM coubs LIMIT 10 OFFSET 10;

UPDATE coubs ........;

SELECT * FROM coubs LIMIT 10 OFFSET 20;
20

— Большой JSON ~140 Kb

— Нетривиальная выборка

— Записи обновляются часто

— Tree

— Нет старого контента
21

— Большой JSON ~140 Kb

— Нетривиальная выборка

— Записи обновляются часто
— Tree

— Нет старого контента
22

SELECT * FROM coubs

ORDER BY key LIMIT 10;

SELECT * FROM coubs WHERE key < ...

ORDER BY key LIMIT 10;

INSERT INTO coubs ……..;

SELECT * FROM coubs WHERE key < ...

ORDER BY key LIMIT 10;
23

SELECT * FROM coubs

ORDER BY key DESC LIMIT 10;

SELECT * FROM coubs WHERE key < ...

ORDER BY key DESC LIMIT 10;

DELETE FROM coubs WHERE ...;

SELECT * FROM coubs WHERE key < ...

ORDER BY key DESC LIMIT 10;
24

— Нужно хотя бы 1 раз сгенерировать

— Нужно где-то хранить

— Нужно как-то актуализировать
26

— Нужно хотя бы 1 раз сгенерировать
— Нужно где-то хранить

— Нужно как-то актуализировать
27

Page 1: делаем копию доступных данных

Page 2: работаем с данными из копии

Page 3: работаем с данными из копии
28

— Нужно хотя бы 1 раз сгенерировать

— Нужно где-то хранить
— Нужно как-то актуализировать
29

Page 1: делаем копию доступных данных

Page 2: работаем с данными из копии
31

— Нужно хотя бы 1 раз сгенерировать

— Нужно где-то хранить

— Нужно как-то актуализировать
32

Page 1: делаем копию доступных данных

Page 1: добавляем новые записи

Page 2: работаем с данными из копии
33

Генерация первого набора - долго

Достройка кеша - долго*

* при редких посещениях
34

36
— Берем все кобы, которые попадают в подписки
— Среди этих кобов ищем дублирующиеся рекобы
— Выкидываем их, оставляем только первые
— Выкидываем все то, что не должно быть видно
ÁБÛЫËЛÎО ÊКÀАÊК-ÒТÎО ÒТÀАÊК

40000
600
Несколько запросов
1 запрос
ms
37
ms

ÏПÎОËЛÓУ×ЧÅЕÍНÈИÅЕ
ÄДÀАÍНÍНÛЫÕХ
ÏПÀАÐРÀАËЛËЛÅЕËЛÜЬÍНÎО
42

46
Write:
— New coub / recoub
— Follow
Read:
— Page + PerPage = [ids]

FRONTEND SERVERS
DATABASE SERVERS TIMELINE SERVER
BACKEND SERVERS
1
2 34 5
6
0.02-2ms
1.5——-–2ms
~200-500ms
50

FRONTEND SERVERS
DATABASE SERVERS TIMELINE SERVER
BACKEND SERVERS
1
2 32 3
4
äдîо 5 ìмèи…
0.05 - 5ms
51
4
5

52
api workers
workers
hot data
fetch
worker
data
refresh
worker
update
worker
immediate
workers
workers

53
hash table
record
user_id
integer
coub_ids
list
tech_data
integer/binary
hash table
record
user_id
integer
coubs
record
tech_data
integer/binary
hot data
data

ÏПÎО×ЧÅЕÌМÓУ ÂВÑСÅЕ ÒТÀАÊК
ÏПÎОËЛÓУ×ЧÈИËЛÎОÑСÜЬ?
54

Я и моя группа занимаемся разработкой страницы Яндекс.Браузера, весь наш фронтенд построен на Node.js. Для нас очень важно максимально быстро отвечать нашим пользователям, и не только потому, что тем самым мы снижаем потребление нами системных ресурсов, а прежде всего для того, чтобы наш пользователь не ожидал лишние десятки миллисекунд и не терял интерес к нашим страницам. Многие исследования подтверждают — каждые 100мс ожидания загрузки страницы вы теряете долю пользователей, которые ждать не захотели. Именно поэтому после того, как некоторые страницы сильно разрослись и время ответа перестало удовлетворять нас, я начал исследование узких мест. Я перебрал множество доступных на данный момент инструментов профилирования Node.js приложений, покопался с работой оптимизаторов V8 и в результате за две недели уменьшил время ответа нашей страницы в 2.5 раза, а теперь я бы хотел поделиться с вами своим опытом.

Олег Анастасьев "Ближе к Cassandra". Выступление на Cassandra Conf 2013it-people

распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2rit2011

pgconf.ru 2015 avito postgresql

Михаил Тюрин

Сравнение форматов и библиотек сериализации / Антон Рыжов (Qrator Labs)

Ontico

В эпоху распределённых архитектур и микросервисов как никогда актуальными становятся вопросы — как эффективно сериализовать и передать данные. Большинство решает данный вопрос просто — используют стандартный, универсальный и всем понятный формат JSON. Другие же, ориентируясь на производительность, ищут в интернете бенчмарки и выбирают protobuf или msgpack. Мы протестировали разные реализации статически (thrift, protocol buffers) и динамически (json, msgpack) типизированных протоколов для python; сравнили их производительность в разных сценариях, возможности, внутреннее устройство, удобство разработки. Я расскажу о результатах нашего исследования, особенностях "приготовления" библиотек и выявленных подводных камнях.

Как устроена MySQL-репликация / Андрей Аксенов (Sphinx)

Ontico

Какая вообще в природе бывает репликация (sync vs. async vs. semisync, master-master vs. master-slave), как оно устроено конкретно в MySQL, в каких версиях что добавили. Про binary/relay log, про SBR/RBR/mixed форматы, про глупости с позициями и про GTID, про то, как из-за всяких бед возникают дополнительные продукты типа Tungsten и Galera. Несколько занятных фактов и парочка фокусов, которые можно учинять конкретно с MySQL-репликацией. Доклад вчистую про внутреннее устройство, по результатам должно появляться общее понимание того, как оно работает внутри и почему именно так. Конкретные SQL-операторы подробно рассматривать НЕ будем, эти скучные мелочи необходимо будет затем самостоятельно смотреть в документации (или не смотреть).

Андрей Дроздов "Создание высокопроизводительных rest api на tarantool"

Tanya Denisyuk

Тезисы: За последние 2 года экосистема tarantool пополнилась огромным количеством батареек: дисковое хранение, lua-шардинг, работа со схемами данных и версиями, nginx upstream модуль. Используя эти компоненты, можно создавать высокопроизводительные приложения без использования дополнительных технологий. В докладе будет описан опыт использования Tarantool для разработки performance-critical restful api: расскажу в чем плюсы и минусы текущей реализации lua-шардинга, как создать restful api прямо в базе данных и почему это быстрее многих популярных решений на примере реальных данных. Кроме того, будет рассмотрен подход использования avro схем для валидации, версионирования и хранения json документов в Tarantool. Для наглядности во время доклада будет разработан микросервис и проведено нагрузочное тестирование.

Операции над письмами (пометка спамовым, удаление или перемещение) — неотъемлемая часть почтового сервиса, которая создает заметную нагрузку на бэкенд и может сильно увеличить время отклика системы. В докладе я расскажу, как эволюционировал наш модуль операций над письмами, как мы сделали его асинхронным, на какие грабли мы наступили с Zookeeper’ом и какие выводы сделали.

SphinxSearch Meetup - Tips&tricks

Roman Pavlushko

Леонид Васильев "Python в инфраструктуре поиска"

Yandex

Леонид Васильев "Python в инфраструктуре поиска" Я.Субботник в Санкт-Петербурге О докладе: Что такое инфраструктура поиска. Какие задачи приходится решать. Какие инструменты для управления кластером используются в поиске. Как они устроены изнутри. Что можно посоветовать проектам с большой инфраструктурой. Какие существуют open-source аналоги.

Хранение json-документов в Tarantool / Андрей Дроздов (Mail.ru Group)

Ontico

AVRO - система сериализации данных, созданная сообществом Apache Hadoop. Включает в себя различные структуры данных, компактный формат хранения в бинарном виде, язык описания схем данных и правила миграции данных между разными версиями схемы. С помощью инструментария AVRO можно валидировать данные по схеме, совершать преобразования из одной версии в другую и даже восстанавливать неполные данные при помощи значений по-умолчанию. Поддержка Apache AVRO была добавлена в Tarantool в этом году и уже используются в production. Tarantool можно использовать как документо-ориентированную СУБД. В докладе я расскажу про подход к версионированию данных, разработанный командой tarantool: использование avro схемы для валидации входных данных, преобразования от одной версии к другой в runtime, оптимальное хранение версий документа, изменение схемы данных без избыточности и проблем в предыдущих версиях. Также я расскажу, как применять этот подход для создания бэкендов restful api прямо в базе данных (без дополнительной разработки). Для наглядности мы сравним получившуюся систему с популярными веб-фреймворками: django-rest-framework, go-restful, node.js и посмотрим, кто окажется в лидерах по производительности. Кроме того, во время выступления я покажу live пример создания restful api на стеке технологий tarantool в облаке amazon.

Владислав Животнев - Основы DNSYandex

kranonit S04E01 Антон: Защита от Master Boot Record LockerKrivoy Rog IT Community

Базы данных. MongoDB

Vadim Tsesko

AVITO. Решардинг Redis без даунтайма. DevConf 2012Roman Pavlushko

2014.09.24 история небольшого успеха с PostgreSQL (Yandex)

Nikolay Samokhvalov

Опыт внедрения DNSSEC

Philipp Kulin

Где живут Ваши объявления / Тюрин Михаил (Avito)

Ontico

Авито с 2010 года — с момента запуска на широкую аудиторию — прошел уже немалый путь, успев собрать более 600 миллионов объявлений со всех уголков страны, и став при этом крупнейшим классифайдом в Европе. В докладе будет дан обзор архитектуры ядра системы с ретроспективой, перечислены основные компоненты обработки объявлений, приведены оценки параметров функционирования от "продуктовых" "количество объявлений за единицу времени" до количества запросов на разные уровни стека (веб, базы, поиск, очереди) и степени утилизации железа. Будут также продемонстрированы примеры реализаций классических паттернов веба: кэш, прокси, денормализация и репликация, шардинг, очереди и удаленный вызов процедур — подходы, уже более 5 лет лежащие в основе нашей архитектуры. При этом будут приведены неочевидные, на взгляд автора, особенности внедрения данных подходов. Доклад должен заинтересовать соотнесением масштабов и ключевых слов.

05 - Web-технологии. Сетевые протоколы

Roman Brovko

Microsoft cluster systems ritconfrit2010

История успеха Яндекс.Почты с PostgreSQL / Владимир Бородин (Яндекс)

Ontico

Devconf15

Михаил Тюрин

Барнаул15

Михаил Тюрин

Механика DDoS (Александр Крижановский)Ontico

Avito Stachka 2012Roman Pavlushko

Lobanov_Cloud-Comput..webhostingguy

What's hot

С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).

Badoo Development

Массовые операции над письмами в Яндекс.Почте — Денис Кутуков

Yandex

SphinxSearch Meetup - Tips&tricks

Roman Pavlushko

Леонид Васильев "Python в инфраструктуре поиска"

Yandex

Хранение json-документов в Tarantool / Андрей Дроздов (Mail.ru Group)

Ontico

Владислав Животнев - Основы DNSYandex

kranonit S04E01 Антон: Защита от Master Boot Record LockerKrivoy Rog IT Community

Базы данных. MongoDB

Vadim Tsesko

AVITO. Решардинг Redis без даунтайма. DevConf 2012Roman Pavlushko

2014.09.24 история небольшого успеха с PostgreSQL (Yandex)

Nikolay Samokhvalov

Опыт внедрения DNSSEC

Philipp Kulin

Где живут Ваши объявления / Тюрин Михаил (Avito)

Ontico

05 - Web-технологии. Сетевые протоколы

Roman Brovko

Microsoft cluster systems ritconfrit2010

История успеха Яндекс.Почты с PostgreSQL / Владимир Бородин (Яндекс)

Ontico

Devconf15

Михаил Тюрин

Барнаул15

Михаил Тюрин

Механика DDoS (Александр Крижановский)Ontico

Avito Stachka 2012Roman Pavlushko

Lobanov_Cloud-Comput..webhostingguy

What's hot (20)

С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).

Массовые операции над письмами в Яндекс.Почте — Денис Кутуков

SphinxSearch Meetup - Tips&tricks

Леонид Васильев "Python в инфраструктуре поиска"

Хранение json-документов в Tarantool / Андрей Дроздов (Mail.ru Group)

Владислав Животнев - Основы DNS

kranonit S04E01 Антон: Защита от Master Boot Record Locker

Базы данных. MongoDB

AVITO. Решардинг Redis без даунтайма. DevConf 2012

2014.09.24 история небольшого успеха с PostgreSQL (Yandex)

Опыт внедрения DNSSEC

Где живут Ваши объявления / Тюрин Михаил (Avito)

05 - Web-технологии. Сетевые протоколы

Microsoft cluster systems ritconf

История успеха Яндекс.Почты с PostgreSQL / Владимир Бородин (Яндекс)

Devconf15

Барнаул15

Механика DDoS (Александр Крижановский)

Avito Stachka 2012

Lobanov_Cloud-Comput..

Как мы сбежали от PostgreSQL или когда реляционная БД не справляется, Куманяев Андрей

2. 2 @zzetorg

3. ÏПËЛÀАÒТÔФÎОÐРÌМÀА ÄДËЛßЯ ÑСÎОÇЗÄДÀАÍНÈИßЯ ÈИ ÏПÐРÎОÑСÌМÎОÒТÐРÀА ÊКÎОÐРÎОÒТÊКÈИÕХ ÇЗÀАÖЦÈИÊКËЛÅЕÍНÍНÛЫÕХ ÂВÈИÄДÅЕÎО ÄДÎО 10 ÑСÅЕÊКÓУÍНÄД ÄДËЛÈИÍНÍНÎОÉЙ 3

4. 4

5. 5

6. 6

7. — N миллионов записей — Взять из них 10 записей — Подготовить JSON — Отправить пользователю 7

8. + 8

9. — Большой JSON ~140 Kb — Нетривиальная выборка — Записи обновляются часто — Tree — Нет старого контента 9

10. 10

11. 11 Erotica Banned Private Friends only Copyright Subscription … etc.

12. 12 0 175 350 525 700 1 10 20 40 50 100 200 300 500 700 1000 t, ms follows

13. 13

14. 14

15. 15

16. 16

17. 17

18. SELECT * FROM coubs LIMIT 10; SELECT * FROM coubs LIMIT 10 OFFSET 10; INSERT INTO coubs ........; SELECT * FROM coubs LIMIT 10 OFFSET 20; 18

19. SELECT * FROM coubs LIMIT 10; SELECT * FROM coubs LIMIT 10 OFFSET 10; DELETE FROM coubs WHERE ........; SELECT * FROM coubs LIMIT 10 OFFSET 20; 19

20. SELECT * FROM coubs LIMIT 10; SELECT * FROM coubs LIMIT 10 OFFSET 10; UPDATE coubs ........; SELECT * FROM coubs LIMIT 10 OFFSET 20; 20

21. — Большой JSON ~140 Kb — Нетривиальная выборка — Записи обновляются часто — Tree — Нет старого контента 21

22. — Большой JSON ~140 Kb — Нетривиальная выборка — Записи обновляются часто — Tree — Нет старого контента 22

23. SELECT * FROM coubs ORDER BY key LIMIT 10; SELECT * FROM coubs WHERE key < ... ORDER BY key LIMIT 10; INSERT INTO coubs ……..; SELECT * FROM coubs WHERE key < ... ORDER BY key LIMIT 10; 23

24. SELECT * FROM coubs ORDER BY key DESC LIMIT 10; SELECT * FROM coubs WHERE key < ... ORDER BY key DESC LIMIT 10; DELETE FROM coubs WHERE ...; SELECT * FROM coubs WHERE key < ... ORDER BY key DESC LIMIT 10; 24

25. SNAPSHOT (CACHE) 25

26. — Нужно хотя бы 1 раз сгенерировать — Нужно где-то хранить — Нужно как-то актуализировать 26

27. — Нужно хотя бы 1 раз сгенерировать — Нужно где-то хранить — Нужно как-то актуализировать 27

28. Page 1: делаем копию доступных данных Page 2: работаем с данными из копии Page 3: работаем с данными из копии 28

29. — Нужно хотя бы 1 раз сгенерировать — Нужно где-то хранить — Нужно как-то актуализировать 29

30. 30

31. Page 1: делаем копию доступных данных Page 2: работаем с данными из копии 31

32. — Нужно хотя бы 1 раз сгенерировать — Нужно где-то хранить — Нужно как-то актуализировать 32

33. Page 1: делаем копию доступных данных Page 1: добавляем новые записи Page 2: работаем с данными из копии 33

34. Генерация первого набора - долго Достройка кеша - долго* * при редких посещениях 34

35. ÎОÏПÒТÈИÌМÈИÇЗÈИÐРÓУÉЙ SQL 35

36. 36 — Берем все кобы, которые попадают в подписки — Среди этих кобов ищем дублирующиеся рекобы — Выкидываем их, оставляем только первые — Выкидываем все то, что не должно быть видно ÁБÛЫËЛÎО ÊКÀАÊК-ÒТÎО ÒТÀАÊК

37. 40000 600 Несколько запросов 1 запрос ms 37 ms

38. 38

39. 39 502

40. 40

41. ×ЧÒТÎО ÄДÀАËЛÜЬØШÅЕ? 41

42. ÏПÎОËЛÓУ×ЧÅЕÍНÈИÅЕ ÄДÀАÍНÍНÛЫÕХ ÏПÀАÐРÀАËЛËЛÅЕËЛÜЬÍНÎО 42

43. 43

44. 44

45. 45 ÎОÒТÄДÅЕËЛÜЬÍНÛЫÉЙ ÑСÅЕÐРÂВÈИÑС

46. 46 Write: — New coub / recoub — Follow Read: — Page + PerPage = [ids]

47. 47

48. 48 ÏПÎО×ЧÅЕÌМÓУ ERLANG?