MySQL: Есть ли жизнь после 1 млрд. записей.

MySQL:
Есть ли жизнь после
1млрд. записей?

Лаухин Роман
R&D Lead
Global Fleet Management

О компании

Global Fleet Management Inc.
#301 - 7 West 7th Avenue
Vancouver, BC, Canada

http://www.positrace.com

Проблема
Рост числа сообщений

Проблема

~0.9 млн. сообщений в сутки

Проблема


~30 млн. в месяц

Проблема



~360 млн. в год

Проблема



~360 млн. в год

+ 15%

Проблема
На "вчерашний" день:

rows data size idx size total size

GPS_log 1163.45M 105.94G 75.28G 181.21G

Проблема
На "вчерашний" день:


GPS_log 1163.45M 105.94G 75.28G 181.21G

Events 22.22M 2.17G 2.36G 4.53G

Trips 16.02M 1.71G 1.62G 3.33G

Пути решения
Хранить точки как массив объектов
(JSON, Protobuf, etc)


плюсы:
- контролируемый рост числа записей


плюсы:
- контролируемый рост числа записей
- информация о поездке в 1-2 записях


минусы:
- много изменений в коде


минусы:
- много изменений в коде
- усложняется работа с точками

Использовать "Partitioning"


плюсы:

- контролируемый рост


плюсы:


- ускорение выполнения запросов


плюсы:


- ускорение выполнения запросов

- не требует изменений в коде
(теоретически)


минусы:

- ограничения, связанные с разделами


минусы:


- нет опыта


минусы:


- нет опыта

- страшно :)

Реализация
Анализ ограничений
(PK, FK)

Анализ ограничений
(PK, FK)

План разбиения на разделы
(дата - ключевой параметр)


ALTER TABLE ???


ALTER TABLE !!!

CREATE TABLE messages_new
.... PRIMARY KEY (id, dt) ...
PARTITION BY RANGE (TO_DAYS(dt))
( PARTITION p0801 VALUES LESS THAN
(TO_DAYS('2008-02-01')),
PARTITION p0802 VALUES LESS THAN
(TO_DAYS('2008-03-01')),
PARTITION p0803 VALUES LESS THAN
(TO_DAYS('2008-04-01')),
...
PARTITION p1212 VALUES LESS THAN (MAXVALUE));

Копирование данных в новую таблицу.

Копирование данных в новую таблицу.
- внешним скриптом
- малыми порциями
(INSERT LOW_PRIORITY ...)

RENAME TABLE
messages TO messages_old,
messages_new TO messages;

Анализ первого опыта:

- не без проблем
(тестовое окружение != production)

- скорость выполнения запросов
(возросла ~100 раз)

- скорость выполнения запросов
(возросла ~100 раз)
(связано с partitioning только косвенно)

Повторили предыдущие шаги для GPS_log и
связанных таблиц

Алгоритм известен -
соли и специй добавить по вкусу :)

Удаление старых таблиц


DROP TABLE


(DELETE LOW_PRIORITY)


- OPTIMIZE TABLE
(в период с минимальной нагрузкой)


- OPTIMIZE TABLE
(в период с минимальной нагрузкой)
- DROP TABLE

Итоги
На сегодняшний день:


GPS_log 1321.81M 94.11G 112.63G 206.74G

Итоги
Код, таки, пришлось менять :)

Итоги

Ограничение по дате (dt) обязательно

Итоги


Не забывать расширять последний раздел

Итоги


Не забывать расширять последний раздел

Помнить про файловую систему

Полезности

EXPLAIN PARTITIONS ....


EXPLAIN PARTITIONS ....

id select_type table partitions type .... Extra

1 SIMPLE l p0xx,p1202 ALL ... Using where; Using filesort

INFORMATION_SCHEMA - наш друг


SELECT concat(table_schema,'.',table_name),
concat(round(table_rows/1000000,2),'M') rows,
concat(round(data_length/(1024*1024*1024),2),'G') DATA,
concat(round(index_length/(1024*1024*1024),2),'G') idx,
concat(round((data_length+index_length)/(1024*1024*1024),2),'G')
total_size,
round(index_length/data_length,2) idxfrac
FROM information_schema.TABLES
ORDER BY data_length+index_length DESC LIMIT 20;


name rows data idx total

table_1 1329.84M 94.29G 112.84G 207.13G

table_2 1314.38M 105.94G 75.28G 181.21G

table_3 221.73M 34.86G 17.09G 51.96G

table_4 161.92M 13.02G 10.19G 23.21G

table_5 8.07M 18.58G 0.16G 18.74G

Ресурсы

MySQL 5.1 Reference Manual :: 18 Partitioning

http://dev.mysql.com/doc/refman/5.1/en/partitioning.html

MySQL: Есть ли жизнь после 1 млрд. записей.

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to MySQL: Есть ли жизнь после 1 млрд. записей.

Similar to MySQL: Есть ли жизнь после 1 млрд. записей. (20)

More from MageCloud

More from MageCloud (20)

MySQL: Есть ли жизнь после 1 млрд. записей.