Cоздаем пробки или тюнинг postgresql для расчетных задач

Создаём ПРОБКИ.
ТЮНИНГ PostgreSQL
для расчетных задач.

Скоморохов Евгений

Обо мне

Скоморохов Евгений Юрьевич
разработчик сервиса Пробки 2ГИС

Ранее
● разработка ПО по работе с БД PostgreSQL в
"КиберТехнология"
● разработка WorkFlow в "АБП"

Исходные данные

POINT(82.870156074 54.995442578);157;13

Процесс

CPP CPP

Nginx
Png
Nginx

http
Точки
MongoDb PostgreSQL PostgreSQL
http
Mobile
http

Показатели

Притяжка 1000 точек/секунду
Подготовка графа 20 минут

Система

i-net

н ые
Д ан

Запас прочности

Деградация

Ограничение объемов данных

Autovacuum

pgTune + pgFouine

Фича

Данные для обработки вырастут в N раз

Партицирование

2 таблицы лучше чем одна

Redis vs PostgreSQL

Число записей: 60.000.000
Отдача пробок 95 % персентиль

Redis 40 мс
PostgreSQL 55 мс

Заключение

Расчеты в БД -
быстро, качественно, надежно

Вопросы

Скоморохов Е.Ю. | icq:282708810 | e.skomorokhov@2gis.ru

В rfc1149 дан исчерпывающий обзор преимуществ голубиной почты для протокола IP: низкая пропускная способность, невысокая надёжность, простая топология сети. Для того чтобы дать адекватный ответ вызовам эпохи мемристоров и квантовых вычислений, Tarantool 1.7 содержит новый движок для хранения данных на классических жёстких дисках и флэш-накопителях: Vinyl. Tarantool известен своей скоростью, и мы постарались не ударить в грязь лицом и на этот раз. В докладе я расскажу об устройстве нашего нового storage engine: - как мы объединили in-memory технологию и LSM (log structured merge) деревья для достижения оптимальной производительности и утилизации ресурса накопителя, - как работает multiversion concurrency control в Vinyl, - основной компонент в промышленной реализации LSM дерева - merge scheduler, т.е. планировщик слияний и сборки мусора дерева. Я расскажу о подходе, который позволяет максимально снизить износ накопителя, при этом уложиться в заданные рамки производительности запросов.

ПКС-контроллеры сегодня: мифы и реальность

2015.02.06 PostgreSQL в Яндексе: история успеха №2

dev1ant

Highload Begun PankovOntico

В процессе обновления высоконагруженных серверов раздачи видео (40Gbit/s с каждого сервера) со старого OpenSuSE 10.2 на новый CentOS 7 (время между релизами — 7 лет) мы столкнулись с рядом проблем — необъяснимый свопинг и запуски OOM killer, неравномерное распределение нагрузки по ядрам, обрывы соединений, скачки системной нагрузки на CPU. В докладе будет рассказано о том, как мы боролись с этими проблемами и какие технологии для этого использовали.

Hl++2008 Gorniy ReadmeOntico

Дмитрий Новиков - Tarantool в Badoo

Что особенного в СУБД для данных в оперативной памяти / Константин Осипов (Ta...

Оперативная память становится всё более дешёвой и производительной, что позволяет использовать её для хранения рабочего набора данных всё большего числа приложений. Хранение всех данных в оперативной памяти позволяет сделать их высоко доступными, а алгоритмы для работы с данными либо существенно упростить, либо ускорить, а иногда — и то, и другое. Тезисы - http://www.highload.ru/2015/abstracts/1964.html

Масштабируемая система голосования на базе PostgreSQL. PGQ (Сергей Нековаль)Ontico

Масштабируемая система голосования на базе PostgreSQL PgQ, Сергей НековальFuenteovejuna

Организация аппаратного поиска в таблицах OpenFlow на базе ПЛИС

Михаил Табунов, Аналитическая платформа на несколько миллиардов событий в месяц

Tanya Denisyuk

Доклад про: – развитие архитектуры этой системы, как менялись и как будут меняться требования к такого рода системам – анализ подходящих под эту систему БД, с их проблемами, и опытом реальной эксплуатации – почему мы остановились на MongoDB, со всеми минусами и плюсами – немного про команду, трудозатраты и поддержку – как мы используем эту систему и как она помогает растить наши продукты

Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками

IBS

Андрей Николаенко, системный архитектор в IBS, выступил на конференции HighLoad++ 2016. Тезисы В выпуске 4.8 ядра Linux появилась поддержка NVMf (NVM Express over Fabrics) — стандартизованной возможности присоединять по сети как блочные устройства твердотельные накопители, установленные в разъёмы PCI Express. NVMf лишён многих недостатков iSCSI, повторяющего по сети SCSI-команды со всеми их издержками времён дисковых накопителей, и главное — позволяет по полной использовать возможности сетей с прямым доступом к оперативной памяти (RDMA). Таким образом, можно под управлением одного узла собрать сверхбыстрый и сверхотзывчивый пул блочных устройств, не прибегая к покупке дорогого флэш-массива. Но как воспользоваться этим пулом, не загубив теоретические показатели программными обёртками? В докладе будут рассмотрены варианты применения NVMf для различных конфигураций PostgreSQL, Oracle Database, Hadoop, файловых хранилищ, о разработках в направлении «программно-определяемой памяти» с применением NVMe-устройств, доступных по сети, обсуждены текущие проблемы, ограничения и перспективы. Особое внимание будет уделено практическим способам измерения производительности ввода-вывода с учётом задачи, решаемой подсистемой хранения.

SAMag2007 Conference: PostgreSQL 8.3 presentationNikolay Samokhvalov

Open Source SQL-базы данных вступили в эру миллионов запросов в секунду / Фед...

Широко распространено мнение, что SQL СУБД обречены быть медлительными и неповоротливыми, поскольку несут груз совместимости с предыдущими версиями. Это расхожее мнение широко эксплуатируется маркетингом NoSQL СУБД. Однако, это не всегда действительно так. Разработка в Open Source сообществе позволяет продукту развиваться достаточно гибко, чтобы отвечать требованиям времени. В MySQL и PostgreSQL – самых популярных Open Source СУБД – недавно были проведены оптимизации для работы на больших серверах, что позволило им выполнять более миллиона SQL-запросов в секунду на одном экземпляре БД. В данном докладе будут рассмотрены конкретные оптимизации, которые позволили добиться таких результатов, которые раньше могли бы показаться фантастическими. И можно сказать, что Open Source СУБД вошли в эру миллионов запросов в секунду.

Эффективное использование спотовых узлов Amazon EC2 / Дмитрий Пушкарев (Molec...Ontico

Как Python Дайджест работает с внешней статикой

PyNSK

Докладчик: Александр Сапронов Описание: В мини-докладе я рассмотрю простой велосипед (django-remdow), который позволяет в автоматическом режиме скачивать внешнюю статику. А также приведу простые инструменты для автоматической оптимизации вашего сайта.

Исследования программно-конфигурируемых сетей в Оренбургском государственном ...

Профилирование Node.js

Denis Chistyakov

Я и моя группа занимаемся разработкой страницы Яндекс.Браузера, весь наш фронтенд построен на Node.js. Для нас очень важно максимально быстро отвечать нашим пользователям, и не только потому, что тем самым мы снижаем потребление нами системных ресурсов, а прежде всего для того, чтобы наш пользователь не ожидал лишние десятки миллисекунд и не терял интерес к нашим страницам. Многие исследования подтверждают — каждые 100мс ожидания загрузки страницы вы теряете долю пользователей, которые ждать не захотели. Именно поэтому после того, как некоторые страницы сильно разрослись и время ответа перестало удовлетворять нас, я начал исследование узких мест. Я перебрал множество доступных на данный момент инструментов профилирования Node.js приложений, покопался с работой оптимизаторов V8 и в результате за две недели уменьшил время ответа нашей страницы в 2.5 раза, а теперь я бы хотел поделиться с вами своим опытом.

Chronicle Map — key-value хранилище для трейдинга на Java / Левентов Роман (C...

Сфера финансовых приложений и трейдинга выдвигает особые требования к системам обработки данных: ультракороткие задержки, конкурентные обновления (в т.ч. из разных процессов), репликация высокочастотных обновлений. Существовавшие открытые key-value хранилища не справлялись, поэтому мы сделали свое — Chronicle Map. В докладе я отвечу на вопросы: + Почему бывает эффективнее разбить систему, работающую с общим состоянием, на несколько отдельных процессов? + Зачем вам может захотеться распилить JVM на несколько частей? + Как добиться от key-value хранилища медианной latency меньше 1 микросекунды? + Как сделать репликацию, если она упирается в пропускную способность сети из-за слишком частых обновлений? Развею миф о том, что Java — это медленно :) Также, в докладе будет сравнение Chronicle Map с redis, one-nio и ConcurrentHashMap.

Дмитрий Носов, Rambler&Co, H2O на Spark: как мы пили газировку и чуть не захл...

H2O — интересная и многообещающая платформа машинного обучения. Она может порадовать аналитика скоростью работы с большими объемами данных, набором алгоритмов, наличием API для нескольких языков программирования, и, конечно же, красивыми и подробными отчетами по построенным моделям. H2O написана на Java, поэтому работает везде (tm), в том числе на кластере Spark. В докладе спикер поделился своим опытом использования H2O на Spark и YARN, а также причинами отказа от использования H2O в production-окружении, не смотря на все ее положительные качества.

10 HappyDev-lite'14 Иван Погудин, Анатолий Никулин. Решение задач, связанных...

HappyDev

Архитектура и программирование потоковых многоядерных процессоров для научных...

a15464321646213

Взаимодействие Go и C-библиотек. Go и ErlangDevDay

Манипулятор на Ti Stellaris Launchpad, Лёша Романенко

За последние несколько десятков лет робототехника стала очень доступной. Настолько, что можно собрать робота и запрограммировать его даже в домашних условиях, имея подходящий инструментарий. С чего начать? Как попробовать? Именно об этом мы и поговорим на докладе на примере контроллера TI Stellaris Launchpad (аналог Arduino), управляемого с Android-смартфона.

What's hot

СХД для обработки сейсмики: сравнительный обзор

Vsevolod Shabad

Тюним память и сетевой стек в Linux: история перевода высоконагруженных серве...

Hl++2008 Gorniy ReadmeOntico

Дмитрий Новиков - Tarantool в Badoo

Что особенного в СУБД для данных в оперативной памяти / Константин Осипов (Ta...

Масштабируемая система голосования на базе PostgreSQL. PGQ (Сергей Нековаль)Ontico

Масштабируемая система голосования на базе PostgreSQL PgQ, Сергей НековальFuenteovejuna

Организация аппаратного поиска в таблицах OpenFlow на базе ПЛИС

Михаил Табунов, Аналитическая платформа на несколько миллиардов событий в месяц

Tanya Denisyuk

Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками

IBS

SAMag2007 Conference: PostgreSQL 8.3 presentationNikolay Samokhvalov

Open Source SQL-базы данных вступили в эру миллионов запросов в секунду / Фед...

Эффективное использование спотовых узлов Amazon EC2 / Дмитрий Пушкарев (Molec...Ontico

Как Python Дайджест работает с внешней статикой

PyNSK

Исследования программно-конфигурируемых сетей в Оренбургском государственном ...

Профилирование Node.js

Denis Chistyakov

Chronicle Map — key-value хранилище для трейдинга на Java / Левентов Роман (C...

Дмитрий Носов, Rambler&Co, H2O на Spark: как мы пили газировку и чуть не захл...

10 HappyDev-lite'14 Иван Погудин, Анатолий Никулин. Решение задач, связанных...

HappyDev

Архитектура и программирование потоковых многоядерных процессоров для научных...

a15464321646213

What's hot (20)

СХД для обработки сейсмики: сравнительный обзор

Тюним память и сетевой стек в Linux: история перевода высоконагруженных серве...

Hl++2008 Gorniy Readme

Дмитрий Новиков - Tarantool в Badoo

Что особенного в СУБД для данных в оперативной памяти / Константин Осипов (Ta...

Масштабируемая система голосования на базе PostgreSQL. PGQ (Сергей Нековаль)

Масштабируемая система голосования на базе PostgreSQL PgQ, Сергей Нековаль

Организация аппаратного поиска в таблицах OpenFlow на базе ПЛИС

Михаил Табунов, Аналитическая платформа на несколько миллиардов событий в месяц

Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками

SAMag2007 Conference: PostgreSQL 8.3 presentation

Open Source SQL-базы данных вступили в эру миллионов запросов в секунду / Фед...

Эффективное использование спотовых узлов Amazon EC2 / Дмитрий Пушкарев (Molec...

Как Python Дайджест работает с внешней статикой

Исследования программно-конфигурируемых сетей в Оренбургском государственном ...

Профилирование Node.js

Chronicle Map — key-value хранилище для трейдинга на Java / Левентов Роман (C...

Дмитрий Носов, Rambler&Co, H2O на Spark: как мы пили газировку и чуть не захл...

10 HappyDev-lite'14 Иван Погудин, Анатолий Никулин. Решение задач, связанных...

Архитектура и программирование потоковых многоядерных процессоров для научных...

Viewers also liked

Взаимодействие Go и C-библиотек. Go и ErlangDevDay

Манипулятор на Ti Stellaris Launchpad, Лёша Романенко

Lua vs c++_desyatovDevDay

SQL-ник DevDay. Рубцов. Новое в Percona Server и MariaDB в сравнении с MySQL 5.5

Григорий Рубцов — руководитель проектов SQLinfo.ru (http://sqlinfo.ru/) и Webew.ru (http://webew.ru/), автор онлайн-курса по MySQL (http://sqlinfo.ru/classes/) и спикер конференции РИТ++. Новое в Percona Server и MariaDB в сравнении с MySQL 5.5 Обзор возможностей: — новое для разработчика; — новое для администратора; — улучшения производительности; — миграция и вопросы совместимости. Технические детали: — хранилище XtraDB; — Percona Tools; — алгоритмы оптимизации подзапросов в MariaDB.

Артём Кудзев «Делайте на работе то, что мотивирует»

Слышали же такое «в другой компании база более реляционнее, процессы более гибкие и тимлид встречает с кофе каждое утро»? В общем, рай для айтишника. Мы в свое время столкнулись с этой проблемой, когда нас стало достаточно много и «2ГИС перестал быть тортом». Я расскажу, что мы придумали, чтобы ребята не теряли мотивацию и увлечённо работали. Поговорим о фича и продакт-командах, «своих» проектах, опенсорсе и внутренних тусовках.

App store iap. short commentsDevDay

Веб 3.0. Футуристический рассказ о будущем интернета и IT

«Agile-тестирование по версии API 2ГИС» — Анастасия Огаркова, 2ГИС

В свое время, когда мы только запускали API, всё было скромно: небольшая команда, комфортные требования, да и бизнес не требовал от нас подвигов. Но всё коренным образом изменилось, когда API разрослось до 30 серверных компонент в трёх датацентрах, а бизнес «порекомендовал» успевать с ответом в 200 мс и выкатывать релизы раз в неделю. На фоне роста проекта, росла команда и остро встали вопросы «как экологично встроить тестирование в большую scrum-команду большого проекта». Мы сфокусировались на трёх важных моментах: Планирование Большая команда → «большое» планирование. Тестирование планируется отдельно или вместе с разработчиками? Нужна ли выделенная роль крайнего за тестирование на проекте? Релиз Нужен ли крайний за релиз и кто отвечает за интеграционные зависимости? Когда надо остановиться и заморозить фичи? Кто и как мониторит продукт после релиза? Автоматизация — наше всё ;) Как не «захлебнуться» в регрессии: unit-тесты, json-схема. Как правильно выбрать фичи для автоматизации и как встроить автоматизацию в процесс тестирования.

Фича готова. Что дальше?

Порой в погоне за созданием очередной классной штуки для продукта мы забываем о том, как будем выводить это на рынок. В идеальном мире задумываться о запуске мы должны еще до того, как задумались о фиче, ведь именно через потребность аудитории стоит проектировать функционал. Что делать, если на дворе 2013 год, а вам предстоит запускать поиск проезда на общественном транспорте? Алгоритмы вашего поиска не являются революционными, да и все это уже давно реализовано у конкурентов. Как сместить акценты 4 миллионов пользователей и сделать так, чтобы они оценили ваши старания? Мы нашли неплохое решение. Хочу рассказать, как это получилось — от подготовки концепции запуска и мотивации команды до самого процесса релиза и работы с обратной связью. Факапы, выводы, рекомендации. Максимально честно, на живых примерах.

Хочу делать игры, пусть меня научат — DevDay, 06.06.2012DevDay

«Роль исследований в формировании продуктового видения компании», Лиза Алексе...

В своем докладе я расскажу о постановке цели и подготовительном этапе при проведении продуктовых исследований. Мы рассмотрим наиболее популярные виды исследований. Специфику исследований на локальном и междунароных рынках. Прикладную ценность результатов исследований. И это всё на примерах продуктов компании 2ГИС.

«Я спросил у сервера...», Илья Пастушков

«Bdd и реактивщина в 2ГИС», Евгений Тютюев

Инструкция по созданию самопального биллинга, Михаил Крестьянинов (Новотелеком)

В ходе своего доклада я хочу показать пару фокусов и попытаться ответить на следующие вопросы: - Что такое Enterprise разработка? - Зачем нужны бизнес-процессы и как их автоматизировать? - Какие существуют платформы для построения корпоративных приложений? - В чём особенности архитектуры промышленных приложений? - Какую БД выбрать для вашего приложения? - Как быть с тестированием и деплойментом? - Что делать с нагрузками, и какие могут быть проблемы в корпоративных приложениях? - Как сделать так, чтобы всё работало и никогда не ломалось?

Матвей Мальков «Ещё один поиск контактов на Android»

Многие дайлеры не умеют делать поиск по Т9 клавиатуре. Те, что умеют, в большинстве своем делают поиск только по имени/фамилии контакта или по началу номера, а кто-то только с использованием английского алфавита. В 2GIS Dialer нам хотелось искать все контакты по имени, фамилии, телефону (любому из списка и с любого символа), а так же по должности и месту работу (опционально: e-mail и вебсайт, адрес и группы контактов). Кроме того, нам хотелось, чтобы пользователь на любом языке мог найти свои контакты. И в завершение необходимо было, чтобы весь этот поиск работал быстро. О том, как мы добились прогресса в этом деле я и расскажу.

Распределенное хранилище Ceph. Обзор и практические способы использованияDevDay

Рендеринг может больше: vue.js vs React, Андрей Солодовников

Тимофей Чаптыков «Верстальщик должен быть ленивый»

Большую часть рабочего времени мы занимаемся не написанием новой функциональности, а тестированием, исправлением ошибок, рефакторингом. При этом писать классные фичи всем нравится гораздо больше, чем искать причину очередного хитроумного бага. Как сделать так, чтобы ошибок стало меньше, и мы могли тратить время на то, что доставляет удовольствие?

Viewers also liked (18)

Взаимодействие Go и C-библиотек. Go и Erlang

Манипулятор на Ti Stellaris Launchpad, Лёша Романенко

Lua vs c++_desyatov

SQL-ник DevDay. Рубцов. Новое в Percona Server и MariaDB в сравнении с MySQL 5.5

Артём Кудзев «Делайте на работе то, что мотивирует»

App store iap. short comments

Веб 3.0. Футуристический рассказ о будущем интернета и IT

«Agile-тестирование по версии API 2ГИС» — Анастасия Огаркова, 2ГИС

Фича готова. Что дальше?

Хочу делать игры, пусть меня научат — DevDay, 06.06.2012

«Роль исследований в формировании продуктового видения компании», Лиза Алексе...

«Я спросил у сервера...», Илья Пастушков

«Bdd и реактивщина в 2ГИС», Евгений Тютюев

Инструкция по созданию самопального биллинга, Михаил Крестьянинов (Новотелеком)

Матвей Мальков «Ещё один поиск контактов на Android»

Распределенное хранилище Ceph. Обзор и практические способы использования

Рендеринг может больше: vue.js vs React, Андрей Солодовников

Тимофей Чаптыков «Верстальщик должен быть ленивый»

Similar to Cоздаем пробки или тюнинг postgresql для расчетных задач

PostgreSQL: вчера, сегодня, завтра, Олег Бартунов, Postgres Professional, Мо...

it-people

Последние новости постгреса с PGCon / О.Бартунов, А.Коротков, Ф.Сигаев (Postg...

Как быстро развивается сейчас PostgreSQL — общеизвестно. За несколько дней до РИТ++ заканчивается главный мировой форум разработчиков этой СУБД — конференция PGCon в Канаде. Большая команда разработчиков Postgres Professional принимает участие в этой конференции и готова рассказать все последние новости прямо с PGCon. Параллельное исполнение запросов, новые стораджи, неутихающая тема Postgres vs key-value storage, распределенный Postgres, высокая доступность, многочисленные улучшения производительности, планы и интриги разработчиков — вот основные темы этой конференции. Я остановлюсь подробнее на нашем вкладе в ожидаемый релиз 9.6 и планах на, возможно, релиз 10.0.

JS Fest 2019. Игорь Березин и Николай Крещенко. Эволюция архитектуры многогра...

JSFestUA

За 3 года существования, “Koyfin” претерпел множество изменений. Проект прошел путь от MVP до сложной системы сбора и обработки большого количества финансовых данных с десятками микросервисов и тоннами логики. Как жить, когда проект содержит огромное количество репозиториев, микросервисы отправляют и читают из шины тысячи разношерстных сообщений в минуту и кажется, что от попыток за всем уследить скоро взорвется голова? Как поддерживать консистентность, скорость, отказоустойчивость и при этом сохранять гибкость? Мы рассмотрим с Вами основные проблемы, с которыми мы столкнулись, и поделимся результатами творческих мук в поиске их решения. Расскажем об инструментах и техниках, которые помогают нам каждый день

Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...

Tanya Denisyuk

Будет показан пример архитектуры популярной социальной сети в Англии, переработанной на новом стеке, чтобы решить проблемы производительности, отказоустойчивости и горизонтального масштабирования. Новый стек базируется на технологиях: .NET, SignalR, Couchbase, RabbitMQ, ElasticSearch, Amazon Services (CloudFront, S3, EC2, Route 53, Balancer), Windows, Linux. Цель: показать одну из моделей архитектуры нагруженных веб-систем, практики и возможные подводные камни при разработке высоконагруженных Интернет систем.

20111002 information retrieval raskovalov_lecture3Computer Science Club

Оптимизация high-contention write в PostgreSQL / Александр Коротков, Олег Бар...

HighLoad++ 2017 Зал «Рио-де-Жанейро», 7 ноября, 11:00 Тезисы: http://www.highload.ru/2017/abstracts/3030.html Оптимизация производительности – дело тонкое. Улучшая производительность системы при одной нагрузке, можно запросто ухудшить её при другой нагрузке. Основным мерилом производительности PostgreSQL в среде его разработчиков является pgbench. Как следствие, PostgreSQL стал "pgbench-optimized DBMS" (СУБД, оптимизированная для pgbench). ...

Scaling PostgreSQL

Дмитрий Васильев

специализированные http-демона (Сергей Боченков, Александр Панков)Ontico

Ivan Kotlyar. PostgreSQL in web applications

DrupalSib

Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва...

Nikolay Samokhvalov

Администрирование баз данных в будущем будет полностью автоматизировано. Это уже так для базовых операций DBA: поднятие инстансов, бэкапы, управление репликацией, failover — мы наблюдаем это по бурному развитию облачных «управляемых» СУБД (AWS RDS, Google Cloud SQL и десятков игроков поменьше), работе над k8s-оператором для Postgres и MySQL в ряде компаний, внедрению внутренних RDS-like DBaaS (database-as-a-service) решений внутри крупных организаций. Но диагностика и оптимизация производительности баз данных сегодня всё ещё очень «ручные». Например, в Postgres: находим медленную группу запросов в pg_stat_statements, ищем конкретный пример (а то и «выдумываем» его на ходу), пробуем EXPLAIN ANALYZE сначала в dev/staging-окружении, где, как правило, данных не так много, а потом на prod'е... Подбираем индекс, убеждаемся, что он ускоряет (вроде бы) один SQL-запрос и — всё, отправляем в production. Метод «чик-чик и в production» должен остаться в прошлом! Как остались в прошлом развёртывание и настройка серверов и сервисов вручную. Nancy CLI (https://github.com/postgres-ai/nancy) – открытый фреймворк для проведения экспериментов над базами данных PostgreSQL, позволяющий любому инженеру наладить системный подход к анализу и оптимизации производительности БД. Nancy поддерживает проведение экспериментов локально (на любом сервере) и удалённо на дешёвых высокопроизводительных спот-инстансах AWS EC2. Без каких-либо специальных знаний, используя Nancy CLI, любой инженер может теперь: - собрать подробную информацию о поведении «SQL-запросов с прода» на «клоне прода», но «не трогая прод» с целью выявления узких мест (на «проде» под нагрузкой включать обширную диагностику неразумно, а иногда и невозможно); - проверить, как тот или иной индекс влияет на производительность SQL (в том числе, насколько он замедлит UPDATE'ы); - подобрать оптимальные параметры настройки Postgres'а (пример: запустить в облаке проверку 100 вариантов default_statistics_target с подробным исследованием эффекта и анализом для каждой группы SQL-запросов); - сравнить 2+ прогонов моделированной нагрузки на клоне реальной БД в различных условиях (разное оборудование, разные версии Postgres, разные настройки, разные наборы индексов). В докладе мы также обсудим конкретные примеры внедрения метода автоматизации экспериментов над БД и Nancy CLI в ряд проектов различных компаний (БД до 2ТБ, hybrid workload, до 15k TPS) и трудности, которые пришлось преодолеть на пути: 1. Включение полного логирования запросов: когда это просто страх, а когда это действительно серьёзный стресс для сервера? Как быть, если диски «не тянут» полное логирование? 2. Вопросы безопасности: нужно ли давать доступ к экспериментальным узлам всем разработчикам или можно обойтись без этого? Обфускировать ли данные? 3. Как убедиться, что результаты эксперимента достоверны? 4. Как проводить эксперименты над терабайтной базой данных быстро? 5. Стоит ли включать Nancy в CI/CD-конвейер?

PostgreSQL в высоконагруженных проектах

Alexey Vasiliev

Олег Бартунов и Иван Панченко

CodeFest

мониторинг производительности приложения на PINBA

Slach

Новые нереляционные системы хранения данныхVsevolod Dyomkin

Работа с Big Data

MATLAB

Мы покажем, как можно перенести разработанные алгоритмы для работы с Big Data с минимальными изменениями исходных программ. Рассмотрим возможности по распараллеливанию счета на многоядерных процессорах (вычислительных кластерах) и графических процессорах, поддерживающих CUDA.

Hl2008 Spy Log Architechture 169Media Gorod

DUMP-2012 - Базы данных - "MongoDB" Тимофей Миронов (Timeliner)it-people

MongoDB. Как готовить, с чем едят?

Tim Mironov

Руслан Гроховецкий "Как Python стал делать погоду в Яндексе"

Yandex

2 июля 2011, Я.Субботник в Екатеринбурге Руслан Гроховецкий "Как Python стал делать погоду в Яндексе" О докладе: Про Python и Django: зачем нужна красота и простота перфекционистам с дедлайнами, на примере Яндекс.Погоды. Когда число сервисов, которые делаются в Яндексе, стало возрастать, дедлайны — поджимать, а от процесса разработки требовалось стать более гибким, возникла потребность в свежих решениях. В докладе на примере Яндекс.Погоды рассказывается, как в Яндексе делают сервисы с помощью языка Python и веб-фреймворка Django.

Простая и дешёвая бизнес-аналитика на базе Google BigQuery / Алексей Паршуков...

РИТ++ 2017, Backend Conf Зал Сан-Паулу, 6 июня, 14:00 Тезисы: http://backendconf.ru/2017/abstracts/2778.html Хотите научиться принимать решения на основе данных, но не знаете, с чего начать? Нужно записать миллионы событий, но не уверены, как делать это правильно? Вы не знаете, как быстро и дёшево строить аналитические отчеты или запутались в инструментах? На примере DocDoc я расскажу о плюсах и минусах различных подходов: как выбрать систему хранения, почему мы остановились на Google BigQuery. Как правильно организовать данные, записать свой clickstream, отказаться от сэмплирования в GA, а также строить простые и понятные отчеты.

Similar to Cоздаем пробки или тюнинг postgresql для расчетных задач (20)

PostgreSQL: вчера, сегодня, завтра, Олег Бартунов, Postgres Professional, Мо...

Последние новости постгреса с PGCon / О.Бартунов, А.Коротков, Ф.Сигаев (Postg...

JS Fest 2019. Игорь Березин и Николай Крещенко. Эволюция архитектуры многогра...

Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...

20111002 information retrieval raskovalov_lecture3

Оптимизация high-contention write в PostgreSQL / Александр Коротков, Олег Бар...

Scaling PostgreSQL

специализированные http-демона (Сергей Боченков, Александр Панков)

Ivan Kotlyar. PostgreSQL in web applications

Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва...

PostgreSQL в высоконагруженных проектах

Олег Бартунов и Иван Панченко

мониторинг производительности приложения на PINBA

Новые нереляционные системы хранения данных

Работа с Big Data

Hl2008 Spy Log Architechture 169

DUMP-2012 - Базы данных - "MongoDB" Тимофей Миронов (Timeliner)

MongoDB. Как готовить, с чем едят?

Руслан Гроховецкий "Как Python стал делать погоду в Яндексе"

Простая и дешёвая бизнес-аналитика на базе Google BigQuery / Алексей Паршуков...

More from DevDay

«Интеграция push-уведомлений в Яндекс.Браузер под iOS», Юрий Музюкин

Фреймворк Slot, Good Parts, Александр Бирюков

Devops-практики в разработке решений для бизнеса, Максим Пашук

Обычно разработчик успокаивается как только написан код, решающий задачи бизнеса. На самом деле есть ещё целый ряд вопросов, которые также необходимо решать. Как донести изменения разработчика до тестирования в согласованном виде (база данных, приложение, конфиги)? Как донести эти же изменения до production и ничего не потерять по дороге? Что делать если продукт — распределённая многокомпонентная система, работающая в отказоустойчивом кластере? Тогда ситуация требует тесной совместной работы разработчиков и администраторов, а это, как известно, люди немного с разных планет. Я расскажу на примере конкретного проекта на .NET стеке, как мы построили мост дружбы. Как свели воедино систему сборки, развёртывания и автоматизации, используя библиотеку psake и достигли взаимопонимания.

Inversion of Control в деталях, Дмитрий Кожевников

Казалось бы всё сказано об инверсии управления, особенно в .NET. Но нетривиальные квесты вокруг дизайна, построенного на DI, продолжают возникать из проекта в проект. Предлагаю поговорить немного о прописных истинах, а потом перейти к более любопытным вещам и болезненным вопросам. Чем плох ServiceLocator? Почему IoC-контейнер — это фреймворк, а не библиотека? Как быть с множественными реализациями? Convention over configuration? Отдельно поговорим об архитектуре enterprise решений в свете возможностей IoC-контейнеров.

«Используем неизменяемые данные и создаем качественный код», Игорь КудринDevDay

«Велогосипед», Данил Ильиных

Год от года многие программисты решают одни и те же задачи, но не всегда среди огромного многообразия решений можно найти что-то подходящее. Вот и мы не смогли найти ни одной библиотеки логирования для C++, которая удовлетворяла бы всем нашим требованиям. Теперь у нас есть свой велосипед, и мы расскажем, чем он лучше других.

«Процесс создания продукта», Максим Берёзкин

«Вывод продукта на новых территориях», Елизавета Алексеенко

Лабиринт на Arduino, Вадим Ипполитов

Все мы привыкли писать программы, результаты работы которых можно увидеть и услышать. Хотите, чтобы их можно было ещё и потрогать? На примере создания электронной игры «Лабиринт» вы увидите, как не имея знаний и опыта сделать первый шаг в мир hardware.

«Хоба-хоба и в продакшн», Женя Пономарёв

Расскажу про первый продукт 2ГИС, который не совсем про организации – 2GIS Dialer. О трудностях создания, и почему их не нужно бояться. Делая что-то новое, вы обязательно с ними столкнетесь: — Команда будет меняться. — Конкуренты будут поджимать и опережать. — Промо-кампании не будут стрелять.

«Бегущий по лезвию. Продуктовые сценарии в дизайне», Макс Карпылев

С чего начинается проектирование и дизайн новых продуктов — со сценариев. Продуктовые сценарии работы — ключевой элемент в пазле проектирования новых взаимодействий. В докладе покажу какое место сценарии занимают в 2ГИСе, почему они важны и какие сценарии бывают.

«Тестируем веб приложения», Павел Сташевский

«Открытая веб картография», Илья Таратухин

«Изоморфные js приложения с использованием catberry.js», Денис Речкунов

Олег Годовых «Страх и ненависть в Event Bus»

У нас было 500 страниц спецификаций, 40000 строк кода, 2 офиса, полдюжины разработчиков, а также целое множество андроидов всех сортов и расцветок. Не то, чтобы это был необходимый запас для приложения крупной торговой сети. Но если начал собирать софт, становится трудно остановиться. Единственное, что вызвало у меня опасение — это сетевая библиотека. Нет ничего более беспомощного, безответственного и испорченного, чем писать AsyncTask на каждый вызов. Я знал, что рано или поздно мы перейдём на Event Bus.

Распределенные приложения и Azure Service Bus

Когда приложения перестают быть монолитными и разделяются на подсистемы, возникает много нюансов. Как спроектировать распределенную систему так, чтобы она оставалась управляемой? Как добиться того, чтобы процессы, в которых задействованы несколько подсистем, остаавалить прозрачными, а данные - согласованными? Какие принципы, технологии и инструменты могут нам помочь? Я расскажу о том, какие задачи мы решаем в одном из внутренних проектов 2ГИС, и почему мы остановились на Azure Service Bus как на инструменте обеспечения взаимодействия подсистем приложения.

FrontendDevDay

Илья Беда «Как Erlang сделает ваши приложения реалтаймовыми»

Современный веб становится интерактивнее. Сейчас практически все браузеры поддерживают такую технологию как WebSocket, но современные веб-фремймоворки, такие как Django, Yii или RubyOnRails, не поддерживают работу с ними. Я расскажу, как мы сделали наши приложения интерактивным с использованием Erlang. А также что такое Erlang. Для чего он нужен.

Роман Акинфеев «Разработка RESTful API with all bells and whistles»

Каждый уважающий себя интернет-сервис, ориентированный больше чем на одну платформу, сегодня имеет RESTful API. Но мало кто понимает что такое REST, с чем его едят, как готовят и чем он полезен для здоровья. Кто-то считает, что RESTful API - это API использующее в качестве транспорта протокол HTTP, кто-то думает, что REST - это стандарт в рамках которого разработчики ограничены набором ресурсов и восьмью операциями над ними. Я расскажу о том как мы в Яндекс.Диске понимаем REST, как его готовим и какую пользу он нам приносит.

Александр Щепановский «Почему каждому языку нужен свой _»