SlideShare a Scribd company logo
1 of 16
Download to read offline
N☆SQL
Опыт применения NoSQL решений в
проекте Thumbtack RTB Bidder.
Или как покупать контекстную рекламу в режиме
реального времени, и не утонуть в водопаде
данных.
Анатолий Никулин
RTB Architecture
Термины:
RTB Exchange (SSP) - биржа,
Bidder (DSP) - брокер
Creative - он же баннер
Publisher - сайт
CPI - Cost per Impression
CPA - Cost per action
Real Time Core (Bidder)
За 30 ms надо выбрать пару: Creative + Ставка (Bid)
Что принимаем и что отдаем
Creative
id: 123123 - идентификатор
size: 120x50 - размер
snippet: "<img src='my-image-adserver.com/1234567'/>"
…
...
index: {
city: [omsk, moskow, spb]
age: [20-25, 30-31]
}
динамические
категории
Как хранить креатив в RDBMS?
Идеально подходящая
структура - JSON
Где JSON - там и MongoDB :-)
● Динамическая структура
● Гибкий поиск по полям JSON
● Нет проблем с меняющейся схемой, в
процессе разработки.
* MongoDB хранит креативы, кампании, можно делать выборки и отчёты.
Но поиск в режиме реального времени мы ей не доверили. Запилили сами
внутрипроцессный кэш:-) Mongo - не для RT
Redis - оперативная статистика
Данных много и обновляются они раз в час
Статистика цен, в разных срезах:
● По дням недели
● По паблишерам
● По времени суток
● По доходности креативов
Events
1000 QPS = 86 400 000 в сутки
Зачем хранить запросы?
1. История посещений пользователя. По ней можно
вычислить соц. дем. и кое-какие интересы.
rbc.ru
60%
40%
habr.ru
80%
20%
Зачем хранить запросы?
2. Referer. &q=”пластиковые окна”
В нем часто можно встретить поисковые запросы,
из которых также можно попытаться достать интересы.
Зачем хранить ответы?
Для анализа успешности и эффективности торговой
стратегии.
победа % поражение + цена вопроса
Данные льются в HDFS
они не упорядоченны
Bulk-load
Вопросы?

More Related Content

Viewers also liked (7)

Azkaban
AzkabanAzkaban
Azkaban
 
Hadoop presentation
Hadoop presentationHadoop presentation
Hadoop presentation
 
Azkaban and Pig at LinkedIn
Azkaban and Pig at LinkedInAzkaban and Pig at LinkedIn
Azkaban and Pig at LinkedIn
 
Hadoop ecosystem framework n hadoop in live environment
Hadoop ecosystem framework  n hadoop in live environmentHadoop ecosystem framework  n hadoop in live environment
Hadoop ecosystem framework n hadoop in live environment
 
Interactive workflow management using Azkaban
Interactive workflow management using AzkabanInteractive workflow management using Azkaban
Interactive workflow management using Azkaban
 
Azkaban - WorkFlow Scheduler/Automation Engine
Azkaban - WorkFlow Scheduler/Automation EngineAzkaban - WorkFlow Scheduler/Automation Engine
Azkaban - WorkFlow Scheduler/Automation Engine
 
A Guide to SlideShare Analytics - Excerpts from Hubspot's Step by Step Guide ...
A Guide to SlideShare Analytics - Excerpts from Hubspot's Step by Step Guide ...A Guide to SlideShare Analytics - Excerpts from Hubspot's Step by Step Guide ...
A Guide to SlideShare Analytics - Excerpts from Hubspot's Step by Step Guide ...
 

Similar to Архитектура продукта Thumbtack RTB Bidder

RTB для издателей Sell-Side Platform (SSP)
RTB для издателей Sell-Side Platform (SSP)RTB для издателей Sell-Side Platform (SSP)
RTB для издателей Sell-Side Platform (SSP)
ADFOX
 
Яркие идеи в рекламе. Опыт профессионалов
Яркие идеи в рекламе. Опыт профессионаловЯркие идеи в рекламе. Опыт профессионалов
Яркие идеи в рекламе. Опыт профессионалов
Maria Abashkina
 
Технологии оптимизации рекламных бюджетов
Технологии оптимизации рекламных бюджетовТехнологии оптимизации рекламных бюджетов
Технологии оптимизации рекламных бюджетов
Cossa
 
РИФ 2016, Performance-маркетинг для банков: управление на основе сложных целей
РИФ 2016, Performance-маркетинг для банков: управление на основе сложных целейРИФ 2016, Performance-маркетинг для банков: управление на основе сложных целей
РИФ 2016, Performance-маркетинг для банков: управление на основе сложных целей
Тарасов Константин
 
Осенняя Сессия: Денис Девятых
Осенняя Сессия: Денис ДевятыхОсенняя Сессия: Денис Девятых
Осенняя Сессия: Денис Девятых
sem-in-russia
 
Real time bidding
Real time biddingReal time bidding
Real time bidding
drivecity
 
Анатомия RTB / Владимир Климонтович
Анатомия RTB / Владимир КлимонтовичАнатомия RTB / Владимир Климонтович
Анатомия RTB / Владимир Климонтович
Ontico
 
Использование RTB в модели CPA
Использование RTB в модели CPAИспользование RTB в модели CPA
Использование RTB в модели CPA
Cossa
 

Similar to Архитектура продукта Thumbtack RTB Bidder (20)

RTB для издателей Sell-Side Platform (SSP)
RTB для издателей Sell-Side Platform (SSP)RTB для издателей Sell-Side Platform (SSP)
RTB для издателей Sell-Side Platform (SSP)
 
Start upshow 3dinn
Start upshow 3dinnStart upshow 3dinn
Start upshow 3dinn
 
Клуб Юных Программатиков. Лекция 4. Дмитрий Максаков
Клуб Юных Программатиков. Лекция 4. Дмитрий МаксаковКлуб Юных Программатиков. Лекция 4. Дмитрий Максаков
Клуб Юных Программатиков. Лекция 4. Дмитрий Максаков
 
Автоматизация таргетированной рекламы(Никита Пасынков)
Автоматизация таргетированной рекламы(Никита Пасынков)Автоматизация таргетированной рекламы(Никита Пасынков)
Автоматизация таргетированной рекламы(Никита Пасынков)
 
ObjectManager, или как работать с большим количеством объектов на карте, Мари...
ObjectManager, или как работать с большим количеством объектов на карте, Мари...ObjectManager, или как работать с большим количеством объектов на карте, Мари...
ObjectManager, или как работать с большим количеством объектов на карте, Мари...
 
Яркие идеи в рекламе. Опыт профессионалов
Яркие идеи в рекламе. Опыт профессионаловЯркие идеи в рекламе. Опыт профессионалов
Яркие идеи в рекламе. Опыт профессионалов
 
Александр Сербул – Разработка и эксплуатация облачных сервисов Битрикс изнутри
Александр Сербул – Разработка и эксплуатация облачных сервисов Битрикс изнутриАлександр Сербул – Разработка и эксплуатация облачных сервисов Битрикс изнутри
Александр Сербул – Разработка и эксплуатация облачных сервисов Битрикс изнутри
 
Ретаргетинг и суперклик на тизерном трафике. Примеры и анализ размещений за а...
Ретаргетинг и суперклик на тизерном трафике. Примеры и анализ размещений за а...Ретаргетинг и суперклик на тизерном трафике. Примеры и анализ размещений за а...
Ретаргетинг и суперклик на тизерном трафике. Примеры и анализ размещений за а...
 
Hubrus DSP - ТЕХНОЛОГИИ ОПТИМИЗАЦИИ РЕКЛАМНЫХ БЮДЖЕТОВ
Hubrus DSP - ТЕХНОЛОГИИ ОПТИМИЗАЦИИ РЕКЛАМНЫХ БЮДЖЕТОВHubrus DSP - ТЕХНОЛОГИИ ОПТИМИЗАЦИИ РЕКЛАМНЫХ БЮДЖЕТОВ
Hubrus DSP - ТЕХНОЛОГИИ ОПТИМИЗАЦИИ РЕКЛАМНЫХ БЮДЖЕТОВ
 
Технологии оптимизации рекламных бюджетов
Технологии оптимизации рекламных бюджетовТехнологии оптимизации рекламных бюджетов
Технологии оптимизации рекламных бюджетов
 
РИФ 2016, Performance-маркетинг для банков: управление на основе сложных целей
РИФ 2016, Performance-маркетинг для банков: управление на основе сложных целейРИФ 2016, Performance-маркетинг для банков: управление на основе сложных целей
РИФ 2016, Performance-маркетинг для банков: управление на основе сложных целей
 
Осенняя Сессия: Денис Девятых
Осенняя Сессия: Денис ДевятыхОсенняя Сессия: Денис Девятых
Осенняя Сессия: Денис Девятых
 
RTB монетизация трафика для издателей: опыт реализации SSP-решения
RTB монетизация трафика для издателей: опыт реализации SSP-решенияRTB монетизация трафика для издателей: опыт реализации SSP-решения
RTB монетизация трафика для издателей: опыт реализации SSP-решения
 
Real time bidding
Real time biddingReal time bidding
Real time bidding
 
Rtb
RtbRtb
Rtb
 
GrowHack for Noordem
GrowHack for NoordemGrowHack for Noordem
GrowHack for Noordem
 
каванга
кавангакаванга
каванга
 
Анатомия RTB / Владимир Климонтович
Анатомия RTB / Владимир КлимонтовичАнатомия RTB / Владимир Климонтович
Анатомия RTB / Владимир Климонтович
 
Использование RTB в модели CPA
Использование RTB в модели CPAИспользование RTB в модели CPA
Использование RTB в модели CPA
 
Rtb case (музыка а.а)
Rtb case (музыка а.а) Rtb case (музыка а.а)
Rtb case (музыка а.а)
 

Архитектура продукта Thumbtack RTB Bidder

  • 1. N☆SQL Опыт применения NoSQL решений в проекте Thumbtack RTB Bidder. Или как покупать контекстную рекламу в режиме реального времени, и не утонуть в водопаде данных. Анатолий Никулин
  • 2. RTB Architecture Термины: RTB Exchange (SSP) - биржа, Bidder (DSP) - брокер Creative - он же баннер Publisher - сайт CPI - Cost per Impression CPA - Cost per action
  • 3. Real Time Core (Bidder) За 30 ms надо выбрать пару: Creative + Ставка (Bid)
  • 4. Что принимаем и что отдаем
  • 5. Creative id: 123123 - идентификатор size: 120x50 - размер snippet: "<img src='my-image-adserver.com/1234567'/>" … ... index: { city: [omsk, moskow, spb] age: [20-25, 30-31] } динамические категории
  • 7. Идеально подходящая структура - JSON Где JSON - там и MongoDB :-) ● Динамическая структура ● Гибкий поиск по полям JSON ● Нет проблем с меняющейся схемой, в процессе разработки. * MongoDB хранит креативы, кампании, можно делать выборки и отчёты. Но поиск в режиме реального времени мы ей не доверили. Запилили сами внутрипроцессный кэш:-) Mongo - не для RT
  • 8. Redis - оперативная статистика Данных много и обновляются они раз в час Статистика цен, в разных срезах: ● По дням недели ● По паблишерам ● По времени суток ● По доходности креативов
  • 9. Events 1000 QPS = 86 400 000 в сутки
  • 10. Зачем хранить запросы? 1. История посещений пользователя. По ней можно вычислить соц. дем. и кое-какие интересы. rbc.ru 60% 40% habr.ru 80% 20%
  • 11. Зачем хранить запросы? 2. Referer. &q=”пластиковые окна” В нем часто можно встретить поисковые запросы, из которых также можно попытаться достать интересы.
  • 12. Зачем хранить ответы? Для анализа успешности и эффективности торговой стратегии. победа % поражение + цена вопроса
  • 13. Данные льются в HDFS они не упорядоченны
  • 15.