Бинарный поиск в Excel:
применение в интернет-маркетинге
• Принцип работы
• Почему такой быстрый (визуальное и мат. обоснование)
• Бинарный поиск в Excel, или тайна 4-го параметра ВПР
• Где и почему нужен в контекстной рекламе?
• Пример 1: Лемматизация
• Пример 2: Кластеризация по маркерам
• Пример 3: Капитализация имен собственных
Обо мне
• ~3 лет в контекстной рекламе
• Недавно: perfomance в контекстной рекламе, автоматизация
контекстной рекламы для e-commerce в агентстве
• Сейчас: PPC-специалист в Яндексе (performance)
Что такое бинарный (двоичный) поиск?
Почему бинарный поиск такой быстрый?
Slin(x)≈x/2
•Slin(10)=5
•Slin(100)=50
•Slin(1.000.000)=500.000
Sbin(x)≈𝒍𝒐𝒈 𝟐
𝒙
/2
S(8)=𝑙𝑜𝑔2
8
/2≈1.5
S(128)=𝑙𝑜𝑔2
128
/2≈3.5
S(1024)=𝑙𝑜𝑔2
1024
/2≈5
S(4096)=𝑙𝑜𝑔2
4096
/2≈6
S(65535)=𝑙𝑜𝑔2
65536
≈9 (XLS)
S(1048575)= 𝑙𝑜𝑔2
1048576
≈10!!! (XLSX)
А при чем тут Excel?
ВПР(VLOOKUP)
Как искать быстро, и только то, что нужно
Плюсы
• Тысячекратный прирост скорости
• Работает, как обычный ВПР
• Открываются много новых возможностей
Минусы
• Непривычный синтаксис (нужно потренироваться)
Окей, а при чем
тут
контекстная реклама?
В моем СЯ на n сотен (тысяч) фраз все
города – с маленькой буквы
В моем СЯ (было) много неявных дублей
• Розовые слоны
• Розовый слон
• Слоны розовые
• И слоны, и розовые
• -----
Все фразы выше – неявные дубли друг друга.
В моем СЯ (было) много неявных дублей
Неявные дубли = избыточность, лишняя работа, лишняя
конкуренция между ключевыми фразами.
Текущие инструменты для удаления неявных дублей:
Директ.Коммандер. Удаляет что хочет, без спроса
К50-Лемматизатор. Не понимает стоп-слова
Py7.ru – знает не все стоп-слова, и нет экспорта в CSV.
Все крэшатся на больших объемах.
Не работают офлайн (кр. Коммандера)
Я хотел посмотреть, какие запросы в моем
СЯ относятся:
• к категории А
• к категории Б
• и к А, и к Б
• Ни к одной из категорий
Не нашел таких решений
IT’S OPEN, AND IT’S FREE!
Папка с несколькими примерами применения:
https://yadi.sk/d/eiCPN-YQozHmH
Профиль в FB (обновления):
https://www.facebook.com/tumaykin.d
Спасибо за внимание!

Дмитрий Тумайкин (Яндекс) - "Макросы на бинарном поиске, или неприлично быстрый ВПР"