Презентация Алексея Даналина с онлайн-конференции от обучающего центра «Топ Эксперт» #SEO, #SMM, #Директ, #Конверсия.
Алексей рассказал, как на основе данных из систем веб-аналитики, можно предсказать вероятность конверсии для конкретной страницы и интернет-магазина в целом. Это позволяет делать более точные прогнозы на грядущие периоды, оптимизировать поставки и логистику товаров, бюджеты.
2. О себе
Analytics Strategist в агентстве
интернет-маркетинга Netpeak и
сервисе Serpstat.
Принцип оказания услуг Netpeak
— интернет-маркетинг для
бизнеса, а цель — рост продаж у
клиентов. C нами вы
инвестируете в будущее вашей
компании, добиваетесь
окупаемости бизнеса,
увеличиваете ROI (возврат
вложенных средств) и оборот.
a.danilin@netpeak.net
3. План доклада
1. Сбор сырых данных.
2. Выбор показателей для построения предсказательной модели.
3. Построение предсказательной модели.
4. Оценка качества полученной модели.
7. Преимущества BigQuery
● Облачная база данных;
● SQL подобный синтаксис запросов;
● Оплата за используемые ресурсы;
● Ежемесячный бесплатный дисконт;
● Доступ к практически не ограниченным ресурсам;
● Возможность записи данных в реальном времени;
● Внешние коннекторы и модули для работы.
8. Выбор показателей для построения
предсказательной модели
1. Используйте значимые показатели для прогнозирования требуемой
величины.
2. Настраивайте параметры модели на подвыборках.
3. Модель не должна идеально описывать данные, на которых её
настраивали.
4. Возьмите больше достоверных данных.
13. Шаг 1. Получение данных
sqlTrain <- "SELECT
DATA.PATH,
DATA.EVENTACTIONS,
DATA.CID,
DATA.HOST,
IFNULL(LEAST(1,INTEGER(ORDERS.PATH)),0) AS ORDERS
FROM (
SELECT
EXACT_COUNT_DISTINCT(page.pagePath) AS PATH,
EXACT_COUNT_DISTINCT(eventInfo.eventAction) AS
EVENTACTIONS,
clientId AS CID,
page.hostname AS HOST
FROM
...
17. Шаг 4. Получение тестовых данных
sqlTest <- "SELECT
DATA.PATH,
DATA.EVENTACTIONS,
DATA.CID,
DATA.HOST,
IFNULL(LEAST(1,INTEGER(ORDERS.PATH)),0) AS ORDERS
FROM (
SELECT
EXACT_COUNT_DISTINCT(page.pagePath) AS PATH,
EXACT_COUNT_DISTINCT(eventInfo.eventAction) AS EVENTACTIONS,
clientId AS CID,
page.hostname AS HOST
FROM
...
20. Шаг 7. Улучшение качества модели
1. Тестирование настроек модели.
2. Тестирование других моделей.
3. Переоценка анализируемых параметров.
21. Список литературы
1. Графики в докладе построены в R.
2. Справочные материалы по R:
https://stat.ethz.ch/R-manual/R-devel/library/stats/html/lm.html
https://stat.ethz.ch/R-manual/R-devel/library/stats/html/glm.html
https://cran.r-project.org/web/packages/forecast/index.html
https://stat.ethz.ch/R-manual/R-devel/library/stats/html/stl.html
https://github.com/twitter/AnomalyDetection