2014.10.15 Мурат Кабилов, Avito.ru #PostgreSQLRussia

•

0 likes•1,879 views

* приемы доступа к данным; * прикладной класс работы с БД поверх PDO, особенности PDO; * связки пуллов коннектов; * API хранимых процедур; * работа c распределенным хранилищем; * RPC между базами на примере асинхронного геокодинга.

Technology

Pg clients
• Web: PHP на app’ах
• PHP cron-скрипты
• PGQ демоны
• другие DB сервера (e.g. via plproxy)
• внутренние сервисы (e.g. мониторинг)

PHP
• вложенные транзакции (via savepoints)
• комплексные типы: pg arrays, hstore, json
• registerAfterCommit
• «ленивые» коннекты, транзакции
• билд редкоизменяемых справочников в php массивы

PDO
• PDO::ATTR_EMULATE_PREPARES -> true
• PDOStatement::getColumnMeta
https://bugs.php.net/bug.php?id=64542 https://bugs.php.net/bug.php?id=62498

pgbouncer
• pool_mode = transaction
• avito = host=localhost
pool_size=10 datestyle='ISO,DMY'
connect_query='select init_prepared_statements();’

Prepared statements
init_prepared_statements():

Prepared statements
• не требующие сложной логики запросы
• частовыполняемые
• снизили CPU за их счет

Хранимые процедуры
• data locality
• много бизнес логики на стороне БД
• программный интерфейс процедур
• обработка исключений
• версионирование

Хранимые процедуры
• большие объемы возвращаемых данных
• «хинты» (e.g. set local enable_indexscan = false;)
• code/naming style
• отладка.

Распределенное хранилище
• храним письма
• через pl/proxy.
• хорошо масштабируется
• select hashtext('test');
8.3: 233914345
8.4: 1771415073
«Adopt a faster algorithm for hash functions (Kenneth Marshall, based on work of
Bob Jenkins) Many of the built-in hash functions now deliver different results on little-endian
and big-endian platforms.»
9.3: 1771415073
http://www.postgresql.org/docs/8.4/static/release-8-4.html

RPC
• на базе pgq (персистентный)
• написан на питоне (оглядывались на londiste)
• пример — геокодинг

Порой в процессе развития высоконагруженного проекта наступает момент, когда необходимо масштабирование. Возможно, ваш проект впервые упёрся в производительность железа (и таким образом перешёл в разряд высоконагруженных); возможно, это уже не первое масштабирование — не важно. Какие же проблемы могут возникнуть? Во-первых, если вы увеличиваете количество бэкенд-серверов, и, соответственно, количество рабочих процессов, то с ростом количества одновременных клиентских подключений вырастают и накладные расходы на базах данных. Во-вторых, достаточно быстро может кончиться ресурс in-memory баз данных. Потребуется создать (либо увеличить) кластер, а это каждый раз влечёт за собой необходимость модифицировать логику приложения. В-третьих, чем больше серверов, тем больше вероятность, что один из них выйдет из строя. Поэтому неплохо задуматься о том, как обеспечить отказоустойчивость, а это, опять же, потребует модифицировать логику приложения. В этом докладе я расскажу, как и какими инструментами можно легко решить все вышеперечисленные проблемы: уменьшить накладные расходы от большого количества подключений к базам данных, создать/модифицировать кластер БД прозрачно для приложения, а также прозрачно добавить устойчивость к падениям серверов БД.

"Отказоустойчивый standby PostgreSQL (HAProxy + PgBouncer)" Виктор Ягофаров (...

AvitoTech

Из презентации вы узнаете: — как мы пришли к Go, оставив идею использования Node.js, Scala или Rust; — про первый сервис, который мы написали на Go и запустили в продакшен; — про ошибки, с которыми сталкивались под нагрузкой; — про оптимизации, которые мы сделали и еще планируем сделать; — про тестирование и предотвращение тестирования на продакшене (в частности, websocket'ов).

Twisted Framework - сетевые приложения в Python

Andrey Smirnov

Streaming replication in practice

Alexey Lesovsky

«Миллион открытых каналов с данными по сети» – Илья Биин (Zenhotels)

AvitoTech

Расширения для PostgreSQL

Anastasia Lubennikova

2014.09.24 история небольшого успеха с PostgreSQL (Yandex)