SlideShare a Scribd company logo
ПОЧЕМУ

рекомендательным системам
вечно не хватает метаданных

и как это исправить………….
Дмитрий Зимин, Главный редактор Nemo TV

Специально для ICDBA, Moscow, 2016
Что происходит
Кроссплатформенная сервисная экосистема ближайшего будущего:
Медиацентр
• TV
• VOD
• Музыка
• Игры
• и т.д.
Сервисы
• Денежные
операции
• E&T-comm
• Social
• и т.д.
Город
• ЖКХ+
• Доставка
• Афиши
• City Alert
• E-council
• и т.д.
Данные
• Интересы
• Биометрия
• Связи
• Движение
• и т.д.
Умный дом, управляемый ИИ
Вроде бы всё хорошо…
Медиацентр
• TV
• VOD
• Музыка
• Игры
• и т.д.
Данные
• Интересы
• Биометрия
• Связи
• Движение
• и т.д.
☑ Агрегация данных, в т.ч. из разных внешних источников
☑ Профайлинг с >100 параметров ~ 1 млн. пользователей.
☑ Машинное обучение в закрытой информационной экосистеме
☑ Рекомендации контента по матрице >300 атрибутов
❌ Можем знать “что”, но не знать “почему”
❌ Анализ потребления медиаконтента всё ещё может быть
затруднён из-за нехватки описательных метаданных…
Российские реалии: Кто виноват
• не более 10% телеканалов поставляют
метаданные в своём сигнале
• 5-10% телеканалов могут предоставлять по
запросу XML c расширенным, но не всегда
релевантным описанием
• все остальные – в лучшем случае XLS
• основным поставщиком метаданных об
эфирах/контенте считаются поставщики EPG
• в неделю обновляется информация 

о примерно 100 000 эфиров
TV VOD
• Большая часть информации копируется с
КиноПоиска
• …и её не хватает.
• Средний объём рабочего каталога
российских онлайн кинотеатров (без UGC,
преимущественно AVOD модель):

15 000 – 40 000 единиц контента,

это в среднем 3 000 – 8 000 наименований.
Сервисов, которые предоставляли бы
пользователям максимальный и самостоятельно
лицензируемый набор TV+VOD, 

в России пока не существует.
Российские реалии: Что делать
1. Для медиаконтента создать внутреннюю базу данных с максимально возможным набором контента,
2. Разметить максимально возможное количество позиций минимально необходимым набором
метаданных. Впоследствии их можно будет использовать в поиске и навигации по сервису.
3. В разметку включать как реальный, так и отсутствующий на платформе контент, чтобы увеличить
количеств взаимосвязей. Это необходимо для отслеживания запросов пользователей и SEO.
Минимальный набор дополнительных метаданных, которыми придётся размечать каталог:
• Поджанры,
• Сюжет (о чём),
• Качества (какой),
• Художественные характеристики,
• Настроение, которое вызывает контент
…и для каждого значения желательно проставить его “удельный вес”.
Российские реалии: Как делать
• Набор из >300 описательных атрибутов даёт примерно 5000 – 10 000 рабочих комбинаций, из
которых в реальности чаще всего будет работать не больше 1000 (это одинаково работает и у
Netflix, и у ivi.ru).
• Качественная разметка каталога из 8 000 – 10 000 позиций занимает около 500 человекодней.
• В идеальной ситуации 80% активного каталога силами ~20 квалифицированных и разбирающихся
в контенте редакторов на аутсорсе можно описать в первые 2 месяца. Среднерыночная стоимость
таких работ составит от 1 – 2 млн. руб. в зависимости от ваших требований к качеству работы.
• При этом реальный срок и бюджет увеличивайте вдвое. 

Потому что:
a) Скорее всего, у вас появляется новый контент, который также нужно размечать,
b) Не забывайте об отсутствующем “в бою” контенте, который требует разметки метатегами.
• Если вы хотите анализировать пользователей не только по потреблению медиаконтента, но и по
товарам, которые пользователь ищет/покупает/смотрит, то, скорее всего, вас зовут Amazon, вы
уже потратили на эту работу кучу времени и денег, и знаете обо всём, что я рассказываю.
Российские реалии: Зачем?
• Скорее всего, вы обсуждали это с поставщиками EPG и Яндексом и решили, что сделать всё
своими силами – проще,
• Маппинг данных, возможно, вы даже думали над рекламной моделью монетизации,
• Глубокое изучение пользовательских предпочтений,
• Усовершенствование алгоритмов предиктивного анализа на основе добавления психологических
характеристик.
• Также на основе существующей разметки “базы знаний”, лингвистического анализа
пользовательских оценок и отзывов и обучающейся системы вы можете предустанавливать
описательные метаданные к новому или эфирному контенту. Это поначалу требует
квалифицированного редакторского супервайзинга, но кто-то должен обучать систему…
• Кроме того, разметка качественными описательными метатегами добавляет ценности продукту и
позволяет улучшить навигацию по контенту. Не сортировать же всё по популярности или TOP-250
КиноПоиска.
• Но главное – чем больше описательных значений вы добавляете, тем ближе вы подходите к
пониманию контекста, смысла контента и пониманию пользователей. (Мы помним про E&T-comm)
Ради чего мы работаем
Монетизация сервисной экосистемы ближайшего будущего:
Медиацентр
• TV
• VOD
• Музыка
• Игры
• и т.д.
Сервисы
• Денежные
операции
• E&T-comm
• Social
• и т.д.
Город
• ЖКХ+
• Доставка
• Афиши
• City Alert
• E-council
• и т.д.
Данные
• Интересы
• Биометрия
• Связи
• Движение
• и т.д.
Умный дом, управляемый ИИ
(ну, и ради этого, конечно)
Использованы материалы:
Syd Mead
MARVEL Entertainment
Дмитрий Зимин, Главный редактор Nemo TV

Специально для ICDBA, Moscow, 2016



Контакты:
Cell: + 7(965) 446-06-02
Email: d.zimin@nemo.tv, dzimin@gmail.com
LinkedIn: https://ru.linkedin.com/in/dimitryzimin
Facebook: https://www.facebook.com/dimitry.zimin

More Related Content

Viewers also liked

Максим Кулиш — OWOX-Russia — ICBDA2016
Максим Кулиш — OWOX-Russia — ICBDA2016Максим Кулиш — OWOX-Russia — ICBDA2016
Максим Кулиш — OWOX-Russia — ICBDA2016
rusbase
 
Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016
rusbase
 
Иван Красников — K☆50 — ICBDA2016
Иван Красников — K☆50 — ICBDA2016Иван Красников — K☆50 — ICBDA2016
Иван Красников — K☆50 — ICBDA2016
rusbase
 
Монетизация данных: могут ли банки зарабатывать на информации
Монетизация данных: могут ли банки зарабатывать на информацииМонетизация данных: могут ли банки зарабатывать на информации
Монетизация данных: могут ли банки зарабатывать на информации
Mike Sverdlov
 
Александр Куликов — Segmento — ICBDA2016
Александр Куликов — Segmento — ICBDA2016Александр Куликов — Segmento — ICBDA2016
Александр Куликов — Segmento — ICBDA2016
rusbase
 
Александр Хайтин — Yandex Data Factory — ICBDA2016
Александр Хайтин — Yandex Data Factory — ICBDA2016Александр Хайтин — Yandex Data Factory — ICBDA2016
Александр Хайтин — Yandex Data Factory — ICBDA2016
rusbase
 
Роман Чеботарев — КРОК — ICBDA2016
Роман Чеботарев — КРОК — ICBDA2016Роман Чеботарев — КРОК — ICBDA2016
Роман Чеботарев — КРОК — ICBDA2016
rusbase
 
Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015
rusbase
 
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
rusbase
 
Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015
rusbase
 
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
rusbase
 
Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015
rusbase
 
Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015
rusbase
 
Евгений Власов — CallTouch — ICBDA 2015
Евгений Власов — CallTouch — ICBDA 2015Евгений Власов — CallTouch — ICBDA 2015
Евгений Власов — CallTouch — ICBDA 2015
rusbase
 
Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015
rusbase
 
Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015
rusbase
 
Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015
rusbase
 
Роман Постников – OneFactor – ICBDA2016
Роман Постников – OneFactor  – ICBDA2016Роман Постников – OneFactor  – ICBDA2016
Роман Постников – OneFactor – ICBDA2016
rusbase
 
Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015
rusbase
 
Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015
rusbase
 

Viewers also liked (20)

Максим Кулиш — OWOX-Russia — ICBDA2016
Максим Кулиш — OWOX-Russia — ICBDA2016Максим Кулиш — OWOX-Russia — ICBDA2016
Максим Кулиш — OWOX-Russia — ICBDA2016
 
Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016
 
Иван Красников — K☆50 — ICBDA2016
Иван Красников — K☆50 — ICBDA2016Иван Красников — K☆50 — ICBDA2016
Иван Красников — K☆50 — ICBDA2016
 
Монетизация данных: могут ли банки зарабатывать на информации
Монетизация данных: могут ли банки зарабатывать на информацииМонетизация данных: могут ли банки зарабатывать на информации
Монетизация данных: могут ли банки зарабатывать на информации
 
Александр Куликов — Segmento — ICBDA2016
Александр Куликов — Segmento — ICBDA2016Александр Куликов — Segmento — ICBDA2016
Александр Куликов — Segmento — ICBDA2016
 
Александр Хайтин — Yandex Data Factory — ICBDA2016
Александр Хайтин — Yandex Data Factory — ICBDA2016Александр Хайтин — Yandex Data Factory — ICBDA2016
Александр Хайтин — Yandex Data Factory — ICBDA2016
 
Роман Чеботарев — КРОК — ICBDA2016
Роман Чеботарев — КРОК — ICBDA2016Роман Чеботарев — КРОК — ICBDA2016
Роман Чеботарев — КРОК — ICBDA2016
 
Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015
 
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
 
Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015
 
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
 
Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015
 
Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015
 
Евгений Власов — CallTouch — ICBDA 2015
Евгений Власов — CallTouch — ICBDA 2015Евгений Власов — CallTouch — ICBDA 2015
Евгений Власов — CallTouch — ICBDA 2015
 
Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015
 
Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015
 
Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015
 
Роман Постников – OneFactor – ICBDA2016
Роман Постников – OneFactor  – ICBDA2016Роман Постников – OneFactor  – ICBDA2016
Роман Постников – OneFactor – ICBDA2016
 
Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015
 
Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015
 

More from rusbase

Робоэдвайзинг
РобоэдвайзингРобоэдвайзинг
Робоэдвайзинг
rusbase
 
Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание
rusbase
 
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
rusbase
 
Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг
rusbase
 
Искусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеИскусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скоринге
rusbase
 
P2P кредитование и народное поручительство
P2P кредитование и народное поручительство P2P кредитование и народное поручительство
P2P кредитование и народное поручительство
rusbase
 
Francis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech RussiaFrancis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech Russia
rusbase
 
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech RussiaРуслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
rusbase
 
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech RussiaАлексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
rusbase
 
Иван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech RussiaИван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech Russia
rusbase
 
Алексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech RussiaАлексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech Russia
rusbase
 
Алексей Архипов, Мастерчейн - FinTech Russia
Алексей Архипов, Мастерчейн  - FinTech RussiaАлексей Архипов, Мастерчейн  - FinTech Russia
Алексей Архипов, Мастерчейн - FinTech Russia
rusbase
 
Максим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech RussiaМаксим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech Russia
rusbase
 
Александр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech RussiaАлександр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech Russia
rusbase
 
Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017
rusbase
 
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
rusbase
 
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
rusbase
 
Анатолий Климчук – ARTOX Media International – ICBDA 2016
Анатолий Климчук – ARTOX Media International – ICBDA 2016Анатолий Климчук – ARTOX Media International – ICBDA 2016
Анатолий Климчук – ARTOX Media International – ICBDA 2016
rusbase
 
Алексей Смирнов – Актион – ICBDA 2016
Алексей Смирнов – Актион – ICBDA 2016Алексей Смирнов – Актион – ICBDA 2016
Алексей Смирнов – Актион – ICBDA 2016
rusbase
 
Александр Воронов – BURDA – ICBDA 2016
Александр Воронов – BURDA – ICBDA 2016Александр Воронов – BURDA – ICBDA 2016
Александр Воронов – BURDA – ICBDA 2016
rusbase
 

More from rusbase (20)

Робоэдвайзинг
РобоэдвайзингРобоэдвайзинг
Робоэдвайзинг
 
Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание
 
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
 
Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг
 
Искусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеИскусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скоринге
 
P2P кредитование и народное поручительство
P2P кредитование и народное поручительство P2P кредитование и народное поручительство
P2P кредитование и народное поручительство
 
Francis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech RussiaFrancis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech Russia
 
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech RussiaРуслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
 
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech RussiaАлексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
 
Иван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech RussiaИван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech Russia
 
Алексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech RussiaАлексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech Russia
 
Алексей Архипов, Мастерчейн - FinTech Russia
Алексей Архипов, Мастерчейн  - FinTech RussiaАлексей Архипов, Мастерчейн  - FinTech Russia
Алексей Архипов, Мастерчейн - FinTech Russia
 
Максим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech RussiaМаксим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech Russia
 
Александр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech RussiaАлександр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech Russia
 
Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017
 
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
 
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
 
Анатолий Климчук – ARTOX Media International – ICBDA 2016
Анатолий Климчук – ARTOX Media International – ICBDA 2016Анатолий Климчук – ARTOX Media International – ICBDA 2016
Анатолий Климчук – ARTOX Media International – ICBDA 2016
 
Алексей Смирнов – Актион – ICBDA 2016
Алексей Смирнов – Актион – ICBDA 2016Алексей Смирнов – Актион – ICBDA 2016
Алексей Смирнов – Актион – ICBDA 2016
 
Александр Воронов – BURDA – ICBDA 2016
Александр Воронов – BURDA – ICBDA 2016Александр Воронов – BURDA – ICBDA 2016
Александр Воронов – BURDA – ICBDA 2016
 

Дмитрий Зимин — Немо ТВ — ICBDA2016

  • 1. ПОЧЕМУ
 рекомендательным системам вечно не хватает метаданных
 и как это исправить…………. Дмитрий Зимин, Главный редактор Nemo TV
 Специально для ICDBA, Moscow, 2016
  • 2. Что происходит Кроссплатформенная сервисная экосистема ближайшего будущего: Медиацентр • TV • VOD • Музыка • Игры • и т.д. Сервисы • Денежные операции • E&T-comm • Social • и т.д. Город • ЖКХ+ • Доставка • Афиши • City Alert • E-council • и т.д. Данные • Интересы • Биометрия • Связи • Движение • и т.д. Умный дом, управляемый ИИ
  • 3. Вроде бы всё хорошо… Медиацентр • TV • VOD • Музыка • Игры • и т.д. Данные • Интересы • Биометрия • Связи • Движение • и т.д. ☑ Агрегация данных, в т.ч. из разных внешних источников ☑ Профайлинг с >100 параметров ~ 1 млн. пользователей. ☑ Машинное обучение в закрытой информационной экосистеме ☑ Рекомендации контента по матрице >300 атрибутов ❌ Можем знать “что”, но не знать “почему” ❌ Анализ потребления медиаконтента всё ещё может быть затруднён из-за нехватки описательных метаданных…
  • 4. Российские реалии: Кто виноват • не более 10% телеканалов поставляют метаданные в своём сигнале • 5-10% телеканалов могут предоставлять по запросу XML c расширенным, но не всегда релевантным описанием • все остальные – в лучшем случае XLS • основным поставщиком метаданных об эфирах/контенте считаются поставщики EPG • в неделю обновляется информация 
 о примерно 100 000 эфиров TV VOD • Большая часть информации копируется с КиноПоиска • …и её не хватает. • Средний объём рабочего каталога российских онлайн кинотеатров (без UGC, преимущественно AVOD модель):
 15 000 – 40 000 единиц контента,
 это в среднем 3 000 – 8 000 наименований. Сервисов, которые предоставляли бы пользователям максимальный и самостоятельно лицензируемый набор TV+VOD, 
 в России пока не существует.
  • 5. Российские реалии: Что делать 1. Для медиаконтента создать внутреннюю базу данных с максимально возможным набором контента, 2. Разметить максимально возможное количество позиций минимально необходимым набором метаданных. Впоследствии их можно будет использовать в поиске и навигации по сервису. 3. В разметку включать как реальный, так и отсутствующий на платформе контент, чтобы увеличить количеств взаимосвязей. Это необходимо для отслеживания запросов пользователей и SEO. Минимальный набор дополнительных метаданных, которыми придётся размечать каталог: • Поджанры, • Сюжет (о чём), • Качества (какой), • Художественные характеристики, • Настроение, которое вызывает контент …и для каждого значения желательно проставить его “удельный вес”.
  • 6. Российские реалии: Как делать • Набор из >300 описательных атрибутов даёт примерно 5000 – 10 000 рабочих комбинаций, из которых в реальности чаще всего будет работать не больше 1000 (это одинаково работает и у Netflix, и у ivi.ru). • Качественная разметка каталога из 8 000 – 10 000 позиций занимает около 500 человекодней. • В идеальной ситуации 80% активного каталога силами ~20 квалифицированных и разбирающихся в контенте редакторов на аутсорсе можно описать в первые 2 месяца. Среднерыночная стоимость таких работ составит от 1 – 2 млн. руб. в зависимости от ваших требований к качеству работы. • При этом реальный срок и бюджет увеличивайте вдвое. 
 Потому что: a) Скорее всего, у вас появляется новый контент, который также нужно размечать, b) Не забывайте об отсутствующем “в бою” контенте, который требует разметки метатегами. • Если вы хотите анализировать пользователей не только по потреблению медиаконтента, но и по товарам, которые пользователь ищет/покупает/смотрит, то, скорее всего, вас зовут Amazon, вы уже потратили на эту работу кучу времени и денег, и знаете обо всём, что я рассказываю.
  • 7. Российские реалии: Зачем? • Скорее всего, вы обсуждали это с поставщиками EPG и Яндексом и решили, что сделать всё своими силами – проще, • Маппинг данных, возможно, вы даже думали над рекламной моделью монетизации, • Глубокое изучение пользовательских предпочтений, • Усовершенствование алгоритмов предиктивного анализа на основе добавления психологических характеристик. • Также на основе существующей разметки “базы знаний”, лингвистического анализа пользовательских оценок и отзывов и обучающейся системы вы можете предустанавливать описательные метаданные к новому или эфирному контенту. Это поначалу требует квалифицированного редакторского супервайзинга, но кто-то должен обучать систему… • Кроме того, разметка качественными описательными метатегами добавляет ценности продукту и позволяет улучшить навигацию по контенту. Не сортировать же всё по популярности или TOP-250 КиноПоиска. • Но главное – чем больше описательных значений вы добавляете, тем ближе вы подходите к пониманию контекста, смысла контента и пониманию пользователей. (Мы помним про E&T-comm)
  • 8. Ради чего мы работаем Монетизация сервисной экосистемы ближайшего будущего: Медиацентр • TV • VOD • Музыка • Игры • и т.д. Сервисы • Денежные операции • E&T-comm • Social • и т.д. Город • ЖКХ+ • Доставка • Афиши • City Alert • E-council • и т.д. Данные • Интересы • Биометрия • Связи • Движение • и т.д. Умный дом, управляемый ИИ
  • 9. (ну, и ради этого, конечно)
  • 10. Использованы материалы: Syd Mead MARVEL Entertainment Дмитрий Зимин, Главный редактор Nemo TV
 Специально для ICDBA, Moscow, 2016
 
 Контакты: Cell: + 7(965) 446-06-02 Email: d.zimin@nemo.tv, dzimin@gmail.com LinkedIn: https://ru.linkedin.com/in/dimitryzimin Facebook: https://www.facebook.com/dimitry.zimin