SlideShare a Scribd company logo
Организация процесса
регулярной обработки
больших объемов данных
Группа разработки Крипта
Дмитрий Кукса, разработчик
Что такое Крипта?
▌ Отвечает на вопрос – «Кто?»
▌ Определяет характеристики
пользователя по поведению в
интернете
▌ Используется для таргетинга рекламы
5
Как это работает?
▌ Объем регулярно обрабатываемых данных ~ 50 ТБ/час
6
Логи
Обучение Контроль
Логи Профили
Профили
+
Матрикснет
Матрикснет
ОбучениеКлассификация
MapReduce
7
MapReduce
8
▌ Модель распределенных вычислений
▌ Входные / выходные данные – пары (k, v)
▌ Две основных операции:
Map: (k, v) → {(k1*, v1*), …, (kn*, vn*)}
Reduce: (k, {v1, …, vm}) → {(k1*, v1*), …, (kn*, vn*)}
▌ Фреймворки – YT, Hadoop (http://hadoop.apache.org)
9
Inputs
id1, nagibator1995@gmail.com
id2, nagibator1996@gmail.com
id3, superman@yandex.ru
id3, whosyourdaddy@mail.ru
id4, superman2@yandex.ru
id5, superman3@yandex.ru
10
Inputs Map
id1, nagibator1995@gmail.com
id2, nagibator1996@gmail.com
id3, superman@yandex.ru
gmail.com, 1
gmail.com, 1
yandex.ru, 1
mail.ru, 1
yandex.ru, 1
yandex.ru, 1
id3, whosyourdaddy@mail.ru
id4, superman2@yandex.ru
id5, superman3@yandex.ru
11
Inputs Map Group
id1, nagibator1995@gmail.com
id2, nagibator1996@gmail.com
id3, superman@yandex.ru
gmail.com, 1
gmail.com, 1
yandex.ru, 1
yandex.ru, {1 ,1, 1}
mail.ru, 1
yandex.ru, 1
yandex.ru, 1
gmail.ru, {1, 1}
mail.ru, {1}
id3, whosyourdaddy@mail.ru
id4, superman2@yandex.ru
id5, superman3@yandex.ru
12
Inputs Map ReduceGroup
id1, nagibator1995@gmail.com
id2, nagibator1996@gmail.com
id3, superman@yandex.ru
gmail.com, 1
gmail.com, 1
yandex.ru, 1
yandex.ru, {1 ,1, 1}
mail.ru, 1
yandex.ru, 1
yandex.ru, 1
gmail.ru, {1, 1}
mail.ru, {1}
yandex.ru, 3
gmail.ru, 2
mail.ru, 1
id3, whosyourdaddy@mail.ru
id4, superman2@yandex.ru
id5, superman3@yandex.ru
Что обеспечивает MR?
▌ Распределение задач между узлами
▌ Распределенное хранение данных
▌ Группировка данных перед Reduce
▌ Cортировки и слияния
▌ Отказоустойчивость
13
Так все ОК, MapReduce все сделает!
14
,
, ,
Клиент - Сервер
15
▌ Задачу на выполнение мастеру MR ставит клиент
▌ Проблемы
Потеря канала связи между сервером и клиентом
Отказ машины клиента
В этом месте MR ничего не гарантирует!
Что нужно для хорошей жизни?
▌ Выполнение задачи ровно один раз в час/день/неделю
▌ Недопустимы потери данных
▌ Допустима задержка в обработке
▌ Минимальное количество вмешательств «руками»
▌ Информирование о необходимости ручного вмешательства
16
Комплекс решений
▌ Конкурирующий запуск с нескольких клиентов
▌ Автоматическое восстановление задачи при падении
▌ Система мониторинга
17
Аспекты
18
АОП
▌ Инкапсуляция кода, не имеющего отношения к бизнес логике
▌ Часто – выполнение действий «до» и «после»
▌ Логирование, авторизация, транзакционный контроль
19
Аспекты
Run() {
RunTask();
}
RunTask() {
RunOperation();
}
Аспекты. Monitoring
Run() {
MonitoringBefore(); // Логирование
RunTask();
MonitoringAfter(); // Логирование
}
RunTask() {
MonitoringBefore(); // Логирование
RunOperation();
MonitoringAfter(); // Логирование
}
Аспекты. Monitoring
22
Monitoring
Application
Аспекты. Blocker
Run() {
BlockerBefore(); // Проверка возможности запуска. Блокировка
MonitoringBefore(); // Логирование
RunTask();
MonitoringAfter(); // Логирование
BlockerAfter(); // Снятие блокировки
}
RunTask() {
MonitoringBefore(); // Логирование
RunOperation();
MonitoringAfter(); // Логирование
}
Аспекты. Blocker
24
▌ Разделяемое состояние – YT таблица
Time – время блокировки
▌ Пролонгация во время работы
▌ Мьютекс с протуханием
▌ Нет лишних точек отказа
Time = 00:15 24-02-2015
Аспекты. Blocker
25
▌ Не чаще раза в сутки – блокировка
▌ Done – флаг завершения
▌ Решает проблемы:
Одновременного запуска
Выполнения по расписанию
Time = 00:00 25-02-2015
Done = true
Аспекты. Raise Up
Run() {
BlockerBefore(); // Проверка возможности запуска. Блокировка
RaiseUpBefore(); // Определение контекста задачи. Сохранение
MonitoringBefore(); // Логирование
RunTask();
MonitoringAfter(); // Логирование
RaiseUpAfter(); // Удаление контекста
BlockerAfter(); // Снятие блокировки
}
RunTask() {
RaiseUpBefore(); // Определение контекста задачи. Сохранение
MonitoringBefore(); // Логирование
RunOperation();
MonitoringAfter(); // Логирование
RaiseUpAfter(); // Запись информации об окончании
}
Аспекты. Raise Up
27
▌ Контекст задачи
Аргументы бинарника
▌ Контекст операции
Входные таблицы
1
Tmp_123 Tmp_042
2
Failed start Current start
2
1
Аспекты. Raise Up
▌ Разделяемое состояние – журнал (YT)
▌ Задача - воссоздание условий упавшего запуска
▌ Выполнение только незавершенных операций
▌ Запускается тот же бинарник
▌ Единственный механизм влияния – аспекты
28
Raise Up. Нормальное исполнение
29
Task -src //crypta/fresh/offers/
-dst //crypta/state/
-ts 1424791640
Raise Up. Нормальное исполнение
30
Task
operation_1
-src //crypta/fresh/offers/
-dst //crypta/state/
-ts 1424791640
Name = operation_1
Src = //crypta/fresh/offers/1
Dst = //crypta/state/offers_123
Raise Up. Нормальное исполнение
31
Task
operation_1
-src //crypta/fresh/offers/
-dst //crypta/state/
-ts 1424791640
Name = operation_1
Src = //crypta/fresh/offers/1
Dst = //crypta/state/offers_123
Done = true
Raise Up. Нормальное исполнение
32
Task
operation_1
operation_2
-src //crypta/fresh/offers/
-dst //crypta/state/
-ts 1424791640
Name = operation_1
Src = //crypta/fresh/offers/1
Dst = //crypta/state/offers_123
Done = true
Name = operation_2
Src = //crypta/state/offers_123
Dst = //crypta/state/accum
Raise Up. Нормальное исполнение
33
Task
operation_1
operation_2
-src //crypta/fresh/offers/
-dst //crypta/state/
-ts 1424791640
Name = operation_1
Src = //crypta/fresh/offers/1
Dst = //crypta/state/offers_123
Done = true
Name = operation_2
Src = //crypta/state/offers_123
Dst = //crypta/state/accum
Raise Up. Нормальное исполнение
34
Task
operation_1
operation_2
-src //crypta/fresh/offers/
-dst //crypta/state/
-ts 1424791640
-failures 1
Name = operation_1
Src = //crypta/fresh/offers/1
Dst = //crypta/state/offers_123
Done = true
Name = operation_2
Src = //crypta/state/offers_123
Dst = //crypta/state/accum
Аспекты
▌ Blocker, RaiseUp, Monitoring
▌ Довольно простые механизмы
▌ Не порождают ненужных зависимостей
35
А что насчет цепочки?
36
Цепочки задач
▌ Скрипт
▌ Нужна поддержка аспектов (запуск с помощью бинарника)
▌ В целом - все аналогично бинарнику
37
Цепочки задач. Восстановление
38
2
падения
8
падений
--- ---
10
падений
Цепочки задач. Восстановление
39
2
падения
8
падений
--- ---
10
падений
force_drop_journal = true
Цепочки задач. Восстановление
40
17:00 17:00 --- 16:00
skip executeСтарт 16:30 skip execute
Цепочки задач. Восстановление
41
17:00 17:00 --- 16:00
executeСтарт 16:30
executeСтарт 17:00
executeskip skip
executeexecute
Цепочки задач. Восстановление
42
17:00 17:00 --- 16:00
skip executeСтарт 16:30 skip
executeСтарт 17:00 executeexecute
До упавшей задачи - пропускать сделанные
execute
skip_done
true
Цепочки задач. Восстановление
43
17:00 17:00 --- 16:00
skip executeСтарт 16:30 skip
executeСтарт 17:00 executeexecute
До упавшей задачи - пропускать сделанные
После – исполнять
execute
skip_done
true
skip_done
false
Цепочки задач. Режимы запуска
44
▌ Необходимо изменять параметры аспектов по ходу цепочки
▌ Режимы
Schedule (force_drop_journal = true, skip_done = false)
Watchdog (force_drop_journal = false, skip_done = true)
▌ Передача режима исполнения - через файл
Вроде бы и норм
▌ Вмешательств руками ~ 1-2 в месяц
Но!
▌ Длинные цепочки – большая вероятность падения
▌ Обработка больших порций данных
▌ Неравномерность загрузки кластера
45
Другой подход. Конвейер
46
Обработка. Наивный подход
47
Producer
Append Consume
Consumer
Обработка. Наивный подход
48
Producer Consumer
A
B
Append Consume
Обработка. Наивный подход
49
Producer Consumer
A
B
Append Consume
Обработка. Наивный подход
50
Producer Consumer
A
B
С
Append Consume
Обработка. Наивный подход
51
Producer Consumer
A
B
С
С – потеряно!
Append Consume
Цепочка
52
Producer Consumer
1 2
A
Всегда одна обрабатываемая часть
Append Consume
Конвейерная обработка
53
Producer Consumer
Append Consume
Конвейерная обработка
54
Producer Consumer
Append Consume
Конвейерная обработка
55
Producer Consumer
Append Consume
Конвейерная обработка
56
Producer Consumer
С – проблем нет!
Append Consume
Конвейерная обработка
▌ Узлы работают независимо
▌ Нет последовательности выполнения
▌ Триггером запуска является наличие новых данных
Можно ли использовать всегда?
57
Возможен только один потребитель
58
Producer
Consumer
Consumer
Возможен только один потребитель
59
Producer
Consumer
Consumer
Multiplexor
Возможен только один потребитель
60
Producer Consumer
Consumer
Read
Move
Consume
Консистентность данных
61
▌ Два разных лога с url
▌ Общий словарь (url, id)
▌ Словарь пополняется
▌ Выход – цепочка!
Consume
R/W
Consume
R/W
Конвейер цепочек
▌ Смешение двух подходов
▌ Плюсы конвейерной обработки
▌ Количество цепочек – минимально возможное
▌ Удобно при рефакторинге
▌ Основной используемый подход
Вмешательств руками < 1 в месяц
62
Спасибо за внимание!
Контакты
dkuksa@yandex-team.ru
Дмитрий Кукса
Группа разработки Крипта
64
Дополнительные слайды
Другие решения
▌ Hadoop workflow schedulers
Oozie – http://oozie.apache.org
Azkaban – http://data.linkedin.com/opensource/azkaban
▌ Конфигурационные файлы (XML)
▌ У нас – другой подход
Обслуживающая функциональность – в бинарниках
Workflow = скрипт
66
Характерные задачи Крипты
▌ Парсинг логов
▌ Агрегация данных из разных источников
▌ Фильтрация противоречивых данных
▌ Подготовка выборок для Матрикснет
▌ Классификация пользователей
Нужны регулярные последовательности действий
67

More Related Content

What's hot

One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
Ontico
 
Быстрое прототипирование бэкенда игры с геолокацией на OpenResty, Redis и Doc...
Быстрое прототипирование бэкенда игры с геолокацией на OpenResty, Redis и Doc...Быстрое прототипирование бэкенда игры с геолокацией на OpenResty, Redis и Doc...
Быстрое прототипирование бэкенда игры с геолокацией на OpenResty, Redis и Doc...
Ontico
 
Алексей Фомкин, Практическое применение Web Workers
Алексей Фомкин, Практическое применение Web WorkersАлексей Фомкин, Практическое применение Web Workers
Алексей Фомкин, Практическое применение Web Workers
Aleksey Fomkin
 
"Fault tolerant workflow orchestration on PHP", Anton Tsitou
"Fault tolerant workflow orchestration on PHP", Anton Tsitou"Fault tolerant workflow orchestration on PHP", Anton Tsitou
"Fault tolerant workflow orchestration on PHP", Anton Tsitou
Fwdays
 
Разбор сложных случаев OutOfMemoryError
Разбор сложных случаев OutOfMemoryErrorРазбор сложных случаев OutOfMemoryError
Разбор сложных случаев OutOfMemoryError
Vladimir Sitnikov
 
Подводные камни в нагрузочном тестировании
Подводные камни в нагрузочном тестированииПодводные камни в нагрузочном тестировании
Подводные камни в нагрузочном тестировании
Vladimir Sitnikov
 
Implement your own profiler with blackjack and fun
Implement your own profiler with blackjack and funImplement your own profiler with blackjack and fun
Implement your own profiler with blackjack and fun
Vladimir Sitnikov
 
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
Ontico
 
Regular expressions
Regular expressionsRegular expressions
Regular expressions
Vladimir Sitnikov
 
PostgreSQL и JDBC: выжимаем все соки
PostgreSQL и JDBC: выжимаем все сокиPostgreSQL и JDBC: выжимаем все соки
PostgreSQL и JDBC: выжимаем все соки
Vladimir Sitnikov
 
Автоматизация тестирования клиентской производительности / Николай Лавлинский...
Автоматизация тестирования клиентской производительности / Николай Лавлинский...Автоматизация тестирования клиентской производительности / Николай Лавлинский...
Автоматизация тестирования клиентской производительности / Николай Лавлинский...
Ontico
 
Эффективная отладка репликации MySQL / Света Смирнова (Percona)
Эффективная отладка репликации MySQL / Света Смирнова (Percona)Эффективная отладка репликации MySQL / Света Смирнова (Percona)
Эффективная отладка репликации MySQL / Света Смирнова (Percona)
Ontico
 
Игнат Корчагин "Как Cloudflare помогает справиться с крупнейшими атаками в Сети"
Игнат Корчагин "Как Cloudflare помогает справиться с крупнейшими атаками в Сети"Игнат Корчагин "Как Cloudflare помогает справиться с крупнейшими атаками в Сети"
Игнат Корчагин "Как Cloudflare помогает справиться с крупнейшими атаками в Сети"
Fwdays
 
noBackend, или Как выжить в эпоху толстеющих клиентов / Самохвалов Николай
noBackend, или Как выжить в эпоху толстеющих клиентов / Самохвалов НиколайnoBackend, или Как выжить в эпоху толстеющих клиентов / Самохвалов Николай
noBackend, или Как выжить в эпоху толстеющих клиентов / Самохвалов Николай
Ontico
 
Zabbix и миллионы метрик: наилучший опыт масштабного мониторинга / Алексей Вл...
Zabbix и миллионы метрик: наилучший опыт масштабного мониторинга / Алексей Вл...Zabbix и миллионы метрик: наилучший опыт масштабного мониторинга / Алексей Вл...
Zabbix и миллионы метрик: наилучший опыт масштабного мониторинга / Алексей Вл...
Ontico
 
Отладка и устранение проблем в PostgreSQL Streaming Replication.
Отладка и устранение проблем в PostgreSQL Streaming Replication.Отладка и устранение проблем в PostgreSQL Streaming Replication.
Отладка и устранение проблем в PostgreSQL Streaming Replication.
Alexey Lesovsky
 
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
Ontico
 
Эффективная отладка репликации MySQL
Эффективная отладка репликации MySQLЭффективная отладка репликации MySQL
Эффективная отладка репликации MySQL
Sveta Smirnova
 
Длинная транзакция или когда размер имеет значение / Михаил Балаян (Odin — In...
Длинная транзакция или когда размер имеет значение / Михаил Балаян (Odin — In...Длинная транзакция или когда размер имеет значение / Михаил Балаян (Odin — In...
Длинная транзакция или когда размер имеет значение / Михаил Балаян (Odin — In...
Ontico
 
Чему мы научились разрабатывая микросервисы?
Чему мы научились разрабатывая микросервисы?Чему мы научились разрабатывая микросервисы?
Чему мы научились разрабатывая микросервисы?
Vadim Madison
 

What's hot (20)

One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
 
Быстрое прототипирование бэкенда игры с геолокацией на OpenResty, Redis и Doc...
Быстрое прототипирование бэкенда игры с геолокацией на OpenResty, Redis и Doc...Быстрое прототипирование бэкенда игры с геолокацией на OpenResty, Redis и Doc...
Быстрое прототипирование бэкенда игры с геолокацией на OpenResty, Redis и Doc...
 
Алексей Фомкин, Практическое применение Web Workers
Алексей Фомкин, Практическое применение Web WorkersАлексей Фомкин, Практическое применение Web Workers
Алексей Фомкин, Практическое применение Web Workers
 
"Fault tolerant workflow orchestration on PHP", Anton Tsitou
"Fault tolerant workflow orchestration on PHP", Anton Tsitou"Fault tolerant workflow orchestration on PHP", Anton Tsitou
"Fault tolerant workflow orchestration on PHP", Anton Tsitou
 
Разбор сложных случаев OutOfMemoryError
Разбор сложных случаев OutOfMemoryErrorРазбор сложных случаев OutOfMemoryError
Разбор сложных случаев OutOfMemoryError
 
Подводные камни в нагрузочном тестировании
Подводные камни в нагрузочном тестированииПодводные камни в нагрузочном тестировании
Подводные камни в нагрузочном тестировании
 
Implement your own profiler with blackjack and fun
Implement your own profiler with blackjack and funImplement your own profiler with blackjack and fun
Implement your own profiler with blackjack and fun
 
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
 
Regular expressions
Regular expressionsRegular expressions
Regular expressions
 
PostgreSQL и JDBC: выжимаем все соки
PostgreSQL и JDBC: выжимаем все сокиPostgreSQL и JDBC: выжимаем все соки
PostgreSQL и JDBC: выжимаем все соки
 
Автоматизация тестирования клиентской производительности / Николай Лавлинский...
Автоматизация тестирования клиентской производительности / Николай Лавлинский...Автоматизация тестирования клиентской производительности / Николай Лавлинский...
Автоматизация тестирования клиентской производительности / Николай Лавлинский...
 
Эффективная отладка репликации MySQL / Света Смирнова (Percona)
Эффективная отладка репликации MySQL / Света Смирнова (Percona)Эффективная отладка репликации MySQL / Света Смирнова (Percona)
Эффективная отладка репликации MySQL / Света Смирнова (Percona)
 
Игнат Корчагин "Как Cloudflare помогает справиться с крупнейшими атаками в Сети"
Игнат Корчагин "Как Cloudflare помогает справиться с крупнейшими атаками в Сети"Игнат Корчагин "Как Cloudflare помогает справиться с крупнейшими атаками в Сети"
Игнат Корчагин "Как Cloudflare помогает справиться с крупнейшими атаками в Сети"
 
noBackend, или Как выжить в эпоху толстеющих клиентов / Самохвалов Николай
noBackend, или Как выжить в эпоху толстеющих клиентов / Самохвалов НиколайnoBackend, или Как выжить в эпоху толстеющих клиентов / Самохвалов Николай
noBackend, или Как выжить в эпоху толстеющих клиентов / Самохвалов Николай
 
Zabbix и миллионы метрик: наилучший опыт масштабного мониторинга / Алексей Вл...
Zabbix и миллионы метрик: наилучший опыт масштабного мониторинга / Алексей Вл...Zabbix и миллионы метрик: наилучший опыт масштабного мониторинга / Алексей Вл...
Zabbix и миллионы метрик: наилучший опыт масштабного мониторинга / Алексей Вл...
 
Отладка и устранение проблем в PostgreSQL Streaming Replication.
Отладка и устранение проблем в PostgreSQL Streaming Replication.Отладка и устранение проблем в PostgreSQL Streaming Replication.
Отладка и устранение проблем в PostgreSQL Streaming Replication.
 
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
 
Эффективная отладка репликации MySQL
Эффективная отладка репликации MySQLЭффективная отладка репликации MySQL
Эффективная отладка репликации MySQL
 
Длинная транзакция или когда размер имеет значение / Михаил Балаян (Odin — In...
Длинная транзакция или когда размер имеет значение / Михаил Балаян (Odin — In...Длинная транзакция или когда размер имеет значение / Михаил Балаян (Odin — In...
Длинная транзакция или когда размер имеет значение / Михаил Балаян (Odin — In...
 
Чему мы научились разрабатывая микросервисы?
Чему мы научились разрабатывая микросервисы?Чему мы научились разрабатывая микросервисы?
Чему мы научились разрабатывая микросервисы?
 

Viewers also liked

Измерения эффективности медиарекламы и особенности аудиторного исследования. ...
Измерения эффективности медиарекламы и особенности аудиторного исследования. ...Измерения эффективности медиарекламы и особенности аудиторного исследования. ...
Измерения эффективности медиарекламы и особенности аудиторного исследования. ...
Ira Jigilo
 
Target Mail.ru T-Sell 2015
Target Mail.ru T-Sell 2015 Target Mail.ru T-Sell 2015
Target Mail.ru T-Sell 2015
Anna Shemyakina
 
Колёса. Примеры эффективных рекламных кампаний
Колёса. Примеры эффективных рекламных кампанийКолёса. Примеры эффективных рекламных кампаний
Колёса. Примеры эффективных рекламных кампаний
Vladimir Merkushev
 
comScore online measurement - Russia RIW November 2010
comScore online measurement - Russia  RIW November 2010comScore online measurement - Russia  RIW November 2010
comScore online measurement - Russia RIW November 2010Osnat Ben-Nesher Zaretsky
 
Digital без силикона: Виктория Кинаш - Яндекс о том, что стоит за Криптой
Digital без силикона: Виктория Кинаш - Яндекс о том, что стоит за КриптойDigital без силикона: Виктория Кинаш - Яндекс о том, что стоит за Криптой
Digital без силикона: Виктория Кинаш - Яндекс о том, что стоит за КриптойCossa
 
7 слайдов плюс 1 социально демографический профиль
7 слайдов плюс 1 социально демографический профиль7 слайдов плюс 1 социально демографический профиль
7 слайдов плюс 1 социально демографический профильPeter Smirnov
 
Людмила Михайлова, Яндекс
Людмила Михайлова, ЯндексЛюдмила Михайлова, Яндекс
Людмила Михайлова, Яндексweb2win
 
Роль мобильной аудитории в Рунете (myTarget)
Роль мобильной аудитории в Рунете (myTarget)Роль мобильной аудитории в Рунете (myTarget)
Роль мобильной аудитории в Рунете (myTarget)
NetCampus
 
Маленькие секреты больших данных
Маленькие секреты больших данныхМаленькие секреты больших данных
Маленькие секреты больших данных
Andrey Ustyuzhanin
 
comScore: отчёт “Российская Digital индустрия в 2015 г.”
comScore: отчёт “Российская Digital индустрия в 2015 г.”comScore: отчёт “Российская Digital индустрия в 2015 г.”
comScore: отчёт “Российская Digital индустрия в 2015 г.”
Игорь Назаров
 
Мобильный интернет в России, исследование
Мобильный интернет в России, исследованиеМобильный интернет в России, исследование
Мобильный интернет в России, исследование
Mail.ru Group
 
Критичные метрики веб-аналитики
Критичные метрики веб-аналитикиКритичные метрики веб-аналитики
Критичные метрики веб-аналитикиDmitriy Isaev
 
Встречайте myTarget!
Встречайте myTarget!Встречайте myTarget!
Встречайте myTarget!
Dmitry Shkolnikov
 
Big Data & Big Image_Николай Киселев
Big Data & Big Image_Николай КиселевBig Data & Big Image_Николай Киселев
Big Data & Big Image_Николай Киселев
iabrussiaprez
 
Онлайн-классификация пользователей в быстрой Крипте. Родион Желудков
 Онлайн-классификация пользователей в быстрой Крипте. Родион Желудков Онлайн-классификация пользователей в быстрой Крипте. Родион Желудков
Онлайн-классификация пользователей в быстрой Крипте. Родион Желудков
Yandex
 
Дмитрий Пашутин, Ivi
Дмитрий Пашутин, IviДмитрий Пашутин, Ivi
Дмитрий Пашутин, Ivi
Cossa
 
Вставить код Google analitycs
Вставить код Google analitycsВставить код Google analitycs
Вставить код Google analitycs
Олександр Мілютін
 
Вы есть то, что вы измеряете!
Вы есть то, что вы измеряете!Вы есть то, что вы измеряете!
Вы есть то, что вы измеряете!
Roman.ua
 
Анализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов GoogleАнализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов Google
Netpeak
 

Viewers also liked (20)

Измерения эффективности медиарекламы и особенности аудиторного исследования. ...
Измерения эффективности медиарекламы и особенности аудиторного исследования. ...Измерения эффективности медиарекламы и особенности аудиторного исследования. ...
Измерения эффективности медиарекламы и особенности аудиторного исследования. ...
 
Target Mail.ru T-Sell 2015
Target Mail.ru T-Sell 2015 Target Mail.ru T-Sell 2015
Target Mail.ru T-Sell 2015
 
Gemius Audience Minsk
Gemius Audience MinskGemius Audience Minsk
Gemius Audience Minsk
 
Колёса. Примеры эффективных рекламных кампаний
Колёса. Примеры эффективных рекламных кампанийКолёса. Примеры эффективных рекламных кампаний
Колёса. Примеры эффективных рекламных кампаний
 
comScore online measurement - Russia RIW November 2010
comScore online measurement - Russia  RIW November 2010comScore online measurement - Russia  RIW November 2010
comScore online measurement - Russia RIW November 2010
 
Digital без силикона: Виктория Кинаш - Яндекс о том, что стоит за Криптой
Digital без силикона: Виктория Кинаш - Яндекс о том, что стоит за КриптойDigital без силикона: Виктория Кинаш - Яндекс о том, что стоит за Криптой
Digital без силикона: Виктория Кинаш - Яндекс о том, что стоит за Криптой
 
7 слайдов плюс 1 социально демографический профиль
7 слайдов плюс 1 социально демографический профиль7 слайдов плюс 1 социально демографический профиль
7 слайдов плюс 1 социально демографический профиль
 
Людмила Михайлова, Яндекс
Людмила Михайлова, ЯндексЛюдмила Михайлова, Яндекс
Людмила Михайлова, Яндекс
 
Роль мобильной аудитории в Рунете (myTarget)
Роль мобильной аудитории в Рунете (myTarget)Роль мобильной аудитории в Рунете (myTarget)
Роль мобильной аудитории в Рунете (myTarget)
 
Маленькие секреты больших данных
Маленькие секреты больших данныхМаленькие секреты больших данных
Маленькие секреты больших данных
 
comScore: отчёт “Российская Digital индустрия в 2015 г.”
comScore: отчёт “Российская Digital индустрия в 2015 г.”comScore: отчёт “Российская Digital индустрия в 2015 г.”
comScore: отчёт “Российская Digital индустрия в 2015 г.”
 
Мобильный интернет в России, исследование
Мобильный интернет в России, исследованиеМобильный интернет в России, исследование
Мобильный интернет в России, исследование
 
Критичные метрики веб-аналитики
Критичные метрики веб-аналитикиКритичные метрики веб-аналитики
Критичные метрики веб-аналитики
 
Встречайте myTarget!
Встречайте myTarget!Встречайте myTarget!
Встречайте myTarget!
 
Big Data & Big Image_Николай Киселев
Big Data & Big Image_Николай КиселевBig Data & Big Image_Николай Киселев
Big Data & Big Image_Николай Киселев
 
Онлайн-классификация пользователей в быстрой Крипте. Родион Желудков
 Онлайн-классификация пользователей в быстрой Крипте. Родион Желудков Онлайн-классификация пользователей в быстрой Крипте. Родион Желудков
Онлайн-классификация пользователей в быстрой Крипте. Родион Желудков
 
Дмитрий Пашутин, Ivi
Дмитрий Пашутин, IviДмитрий Пашутин, Ivi
Дмитрий Пашутин, Ivi
 
Вставить код Google analitycs
Вставить код Google analitycsВставить код Google analitycs
Вставить код Google analitycs
 
Вы есть то, что вы измеряете!
Вы есть то, что вы измеряете!Вы есть то, что вы измеряете!
Вы есть то, что вы измеряете!
 
Анализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов GoogleАнализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов Google
 

Similar to Организация процесса регулярной обработки больших объемов данных

Техники пентеста для активной защиты - Николай Овчарук
Техники пентеста для активной защиты - Николай ОвчарукТехники пентеста для активной защиты - Николай Овчарук
Техники пентеста для активной защиты - Николай Овчарук
HackIT Ukraine
 
Антон Довгоброд: Highload и очереди задач на примере PHP + Gearman + Yii2
Антон Довгоброд: Highload и очереди задач на примере PHP + Gearman + Yii2Антон Довгоброд: Highload и очереди задач на примере PHP + Gearman + Yii2
Антон Довгоброд: Highload и очереди задач на примере PHP + Gearman + Yii2
Oleg Poludnenko
 
Continuous monitoring
Continuous monitoringContinuous monitoring
Continuous monitoring
Dmitry Yackevich
 
UA Mobile 2012
UA Mobile 2012UA Mobile 2012
UA Mobile 2012
dmalykhanov
 
Call of Postgres: Advanced Operations (part 2)
Call of Postgres: Advanced Operations (part 2)Call of Postgres: Advanced Operations (part 2)
Call of Postgres: Advanced Operations (part 2)
Alexey Lesovsky
 
Dmytro Nemesh "Building the perfect infrastructure with Kubernetes"
Dmytro Nemesh "Building the perfect infrastructure with Kubernetes"Dmytro Nemesh "Building the perfect infrastructure with Kubernetes"
Dmytro Nemesh "Building the perfect infrastructure with Kubernetes"
Fwdays
 
Jiramania презентации @augspb
Jiramania презентации   @augspbJiramania презентации   @augspb
Jiramania презентации @augspb
Gonchik Tsymzhitov
 
Scorex framework
Scorex frameworkScorex framework
Scorex framework
Dmitry Meshkov
 
SECON'2017, Клементьев Михаил, Обнаружение руткитов в GNU/Linux
SECON'2017, Клементьев Михаил, Обнаружение руткитов в GNU/LinuxSECON'2017, Клементьев Михаил, Обнаружение руткитов в GNU/Linux
SECON'2017, Клементьев Михаил, Обнаружение руткитов в GNU/Linux
SECON
 
Gnevshev мониторинг
Gnevshev   мониторингGnevshev   мониторинг
Gnevshev мониторингkuchinskaya
 
Call of Postgres: Advanced Operations (part 3)
Call of Postgres: Advanced Operations (part 3)Call of Postgres: Advanced Operations (part 3)
Call of Postgres: Advanced Operations (part 3)
Alexey Lesovsky
 
20090720 hpc exercise1
20090720 hpc exercise120090720 hpc exercise1
20090720 hpc exercise1Michael Karpov
 
DevOps или искусство выживания в растущей компании
DevOps или искусство выживания в растущей компанииDevOps или искусство выживания в растущей компании
DevOps или искусство выживания в растущей компании
Alexey Vakhov
 
Yehor Nazarkin "Journey to the distributed task queue"
Yehor Nazarkin "Journey to the distributed task queue"Yehor Nazarkin "Journey to the distributed task queue"
Yehor Nazarkin "Journey to the distributed task queue"
OdessaPyConference
 
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...rit2011
 
KharkivJS 2017: Коллаборативные системы и CRDT
KharkivJS 2017: Коллаборативные системы и CRDTKharkivJS 2017: Коллаборативные системы и CRDT
KharkivJS 2017: Коллаборативные системы и CRDT
Max Klymyshyn
 
Программируемость и автоматизация решений Ciscо - практическое применение
Программируемость и автоматизация решений Ciscо - практическое применениеПрограммируемость и автоматизация решений Ciscо - практическое применение
Программируемость и автоматизация решений Ciscо - практическое применение
Cisco Russia
 
Оптимизация производительности Python
Оптимизация производительности PythonОптимизация производительности Python
Оптимизация производительности Python
PyNSK
 
Где кончается react native? / Павел Кондратенко (Rambler&Co)
Где кончается react native? / Павел Кондратенко (Rambler&Co)Где кончается react native? / Павел Кондратенко (Rambler&Co)
Где кончается react native? / Павел Кондратенко (Rambler&Co)
Ontico
 
SkyTools помощь в вопросах масштабирования (Артем Носов)
SkyTools помощь в вопросах масштабирования (Артем Носов)SkyTools помощь в вопросах масштабирования (Артем Носов)
SkyTools помощь в вопросах масштабирования (Артем Носов)Ontico
 

Similar to Организация процесса регулярной обработки больших объемов данных (20)

Техники пентеста для активной защиты - Николай Овчарук
Техники пентеста для активной защиты - Николай ОвчарукТехники пентеста для активной защиты - Николай Овчарук
Техники пентеста для активной защиты - Николай Овчарук
 
Антон Довгоброд: Highload и очереди задач на примере PHP + Gearman + Yii2
Антон Довгоброд: Highload и очереди задач на примере PHP + Gearman + Yii2Антон Довгоброд: Highload и очереди задач на примере PHP + Gearman + Yii2
Антон Довгоброд: Highload и очереди задач на примере PHP + Gearman + Yii2
 
Continuous monitoring
Continuous monitoringContinuous monitoring
Continuous monitoring
 
UA Mobile 2012
UA Mobile 2012UA Mobile 2012
UA Mobile 2012
 
Call of Postgres: Advanced Operations (part 2)
Call of Postgres: Advanced Operations (part 2)Call of Postgres: Advanced Operations (part 2)
Call of Postgres: Advanced Operations (part 2)
 
Dmytro Nemesh "Building the perfect infrastructure with Kubernetes"
Dmytro Nemesh "Building the perfect infrastructure with Kubernetes"Dmytro Nemesh "Building the perfect infrastructure with Kubernetes"
Dmytro Nemesh "Building the perfect infrastructure with Kubernetes"
 
Jiramania презентации @augspb
Jiramania презентации   @augspbJiramania презентации   @augspb
Jiramania презентации @augspb
 
Scorex framework
Scorex frameworkScorex framework
Scorex framework
 
SECON'2017, Клементьев Михаил, Обнаружение руткитов в GNU/Linux
SECON'2017, Клементьев Михаил, Обнаружение руткитов в GNU/LinuxSECON'2017, Клементьев Михаил, Обнаружение руткитов в GNU/Linux
SECON'2017, Клементьев Михаил, Обнаружение руткитов в GNU/Linux
 
Gnevshev мониторинг
Gnevshev   мониторингGnevshev   мониторинг
Gnevshev мониторинг
 
Call of Postgres: Advanced Operations (part 3)
Call of Postgres: Advanced Operations (part 3)Call of Postgres: Advanced Operations (part 3)
Call of Postgres: Advanced Operations (part 3)
 
20090720 hpc exercise1
20090720 hpc exercise120090720 hpc exercise1
20090720 hpc exercise1
 
DevOps или искусство выживания в растущей компании
DevOps или искусство выживания в растущей компанииDevOps или искусство выживания в растущей компании
DevOps или искусство выживания в растущей компании
 
Yehor Nazarkin "Journey to the distributed task queue"
Yehor Nazarkin "Journey to the distributed task queue"Yehor Nazarkin "Journey to the distributed task queue"
Yehor Nazarkin "Journey to the distributed task queue"
 
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
 
KharkivJS 2017: Коллаборативные системы и CRDT
KharkivJS 2017: Коллаборативные системы и CRDTKharkivJS 2017: Коллаборативные системы и CRDT
KharkivJS 2017: Коллаборативные системы и CRDT
 
Программируемость и автоматизация решений Ciscо - практическое применение
Программируемость и автоматизация решений Ciscо - практическое применениеПрограммируемость и автоматизация решений Ciscо - практическое применение
Программируемость и автоматизация решений Ciscо - практическое применение
 
Оптимизация производительности Python
Оптимизация производительности PythonОптимизация производительности Python
Оптимизация производительности Python
 
Где кончается react native? / Павел Кондратенко (Rambler&Co)
Где кончается react native? / Павел Кондратенко (Rambler&Co)Где кончается react native? / Павел Кондратенко (Rambler&Co)
Где кончается react native? / Павел Кондратенко (Rambler&Co)
 
SkyTools помощь в вопросах масштабирования (Артем Носов)
SkyTools помощь в вопросах масштабирования (Артем Носов)SkyTools помощь в вопросах масштабирования (Артем Носов)
SkyTools помощь в вопросах масштабирования (Артем Носов)
 

More from CodeFest

Alexander Graebe
Alexander GraebeAlexander Graebe
Alexander Graebe
CodeFest
 
Никита Прокопов
Никита ПрокоповНикита Прокопов
Никита Прокопов
CodeFest
 
Денис Баталов
Денис БаталовДенис Баталов
Денис Баталов
CodeFest
 
Елена Гальцина
Елена ГальцинаЕлена Гальцина
Елена Гальцина
CodeFest
 
Александр Калашников
Александр КалашниковАлександр Калашников
Александр Калашников
CodeFest
 
Ирина Иванова
Ирина ИвановаИрина Иванова
Ирина Иванова
CodeFest
 
Marko Berković
Marko BerkovićMarko Berković
Marko Berković
CodeFest
 
Денис Кортунов
Денис КортуновДенис Кортунов
Денис Кортунов
CodeFest
 
Александр Зимин
Александр ЗиминАлександр Зимин
Александр Зимин
CodeFest
 
Сергей Крапивенский
Сергей КрапивенскийСергей Крапивенский
Сергей Крапивенский
CodeFest
 
Сергей Игнатов
Сергей ИгнатовСергей Игнатов
Сергей Игнатов
CodeFest
 
Николай Крапивный
Николай КрапивныйНиколай Крапивный
Николай Крапивный
CodeFest
 
Alexander Graebe
Alexander GraebeAlexander Graebe
Alexander Graebe
CodeFest
 
Вадим Смирнов
Вадим СмирновВадим Смирнов
Вадим Смирнов
CodeFest
 
Константин Осипов
Константин ОсиповКонстантин Осипов
Константин Осипов
CodeFest
 
Raffaele Rialdi
Raffaele RialdiRaffaele Rialdi
Raffaele Rialdi
CodeFest
 
Максим Пугачев
Максим ПугачевМаксим Пугачев
Максим Пугачев
CodeFest
 
Rene Groeschke
Rene GroeschkeRene Groeschke
Rene Groeschke
CodeFest
 
Иван Бондаренко
Иван БондаренкоИван Бондаренко
Иван Бондаренко
CodeFest
 
Mete Atamel
Mete AtamelMete Atamel
Mete Atamel
CodeFest
 

More from CodeFest (20)

Alexander Graebe
Alexander GraebeAlexander Graebe
Alexander Graebe
 
Никита Прокопов
Никита ПрокоповНикита Прокопов
Никита Прокопов
 
Денис Баталов
Денис БаталовДенис Баталов
Денис Баталов
 
Елена Гальцина
Елена ГальцинаЕлена Гальцина
Елена Гальцина
 
Александр Калашников
Александр КалашниковАлександр Калашников
Александр Калашников
 
Ирина Иванова
Ирина ИвановаИрина Иванова
Ирина Иванова
 
Marko Berković
Marko BerkovićMarko Berković
Marko Berković
 
Денис Кортунов
Денис КортуновДенис Кортунов
Денис Кортунов
 
Александр Зимин
Александр ЗиминАлександр Зимин
Александр Зимин
 
Сергей Крапивенский
Сергей КрапивенскийСергей Крапивенский
Сергей Крапивенский
 
Сергей Игнатов
Сергей ИгнатовСергей Игнатов
Сергей Игнатов
 
Николай Крапивный
Николай КрапивныйНиколай Крапивный
Николай Крапивный
 
Alexander Graebe
Alexander GraebeAlexander Graebe
Alexander Graebe
 
Вадим Смирнов
Вадим СмирновВадим Смирнов
Вадим Смирнов
 
Константин Осипов
Константин ОсиповКонстантин Осипов
Константин Осипов
 
Raffaele Rialdi
Raffaele RialdiRaffaele Rialdi
Raffaele Rialdi
 
Максим Пугачев
Максим ПугачевМаксим Пугачев
Максим Пугачев
 
Rene Groeschke
Rene GroeschkeRene Groeschke
Rene Groeschke
 
Иван Бондаренко
Иван БондаренкоИван Бондаренко
Иван Бондаренко
 
Mete Atamel
Mete AtamelMete Atamel
Mete Atamel
 

Организация процесса регулярной обработки больших объемов данных