Big Data - что это и с чем его "едят") Откуда взялся термин Big Data, какое содержание он в себе несет, и, есть ли будущее у тренда Big Data. Изучаем...
Использование PI Event Frames для сокращения времени анализа причин неисправн...Elizaveta Fateeva
Представьте, что Ваша база данных реального времени (БДРВ) автоматически выявляет различные типы событий, выделяет важную и релевантную информацию, предоставляет средства контекстного анализа и визуа лизации?
Big Data - что это и с чем его "едят") Откуда взялся термин Big Data, какое содержание он в себе несет, и, есть ли будущее у тренда Big Data. Изучаем...
Использование PI Event Frames для сокращения времени анализа причин неисправн...Elizaveta Fateeva
Представьте, что Ваша база данных реального времени (БДРВ) автоматически выявляет различные типы событий, выделяет важную и релевантную информацию, предоставляет средства контекстного анализа и визуа лизации?
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Datavalveindustryhub
Работа с сообществом: от операций - к стратегии
• Шаг 1. Сообщество – инструмент продаж
– Представительство в основных соцсетях и предметных форумах
– Мониторинг релевантных сообщений в соцсетях и реагирование
– Организация взаимодействия между клиентами (c2c-поддержка)
• Шаг 2. Сообщество помогает наращивать KPI
– Привязка активностей в соцсетях к основным КПЭ работы с клиентами: time-to-
market, CSAT, response times...
– Качественное понимание картины: типовые проблемы продукта/сервиса, идеи по совершенствованию, что говорят и как думают клиенты
• Шаг 3. Сообщество – стратегический партнер бизнеса
– Что будет нужно нашей ЦА через одно или два поколения наших продуктов
Несовершенство компьютерных технологий - почему так много до сих пор зависит ...Pavel Cherkashin
На ИТ конференциях мы говорим об удивительном прогрессе, которых достигли информационные технологии. Однако на самом деле технологии находятся еще на уровне динозавров - глупые прожорливые монстры...
Data-driven business: Информационная основа деятельности современной КомпанииAlexander Barakov
Обоснование концепции Data-driven business - попытка показать вектор трансформации способа ведения бизнеса вне зависимости от отрасли и найти ответы на ключевые вопросы, стоящие перед современной компанией:
Какие данные являются значимыми для бизнеса?
Какие значимые данные появятся и будут необходимы бизнесу через 5,10, 20 лет?
Какие новые виды анализа данных могут трансформировать принятие решений в вашей отрасли, повысив операционную эффективность?
Какой набор ПО оптимальным образом будет решать задачи связанные с хранением, обработкой, анализом данных и доставкой и информации пользователям?
Какие BI- BigData-решения внедрять, с какими приоритетами?
Какой набор ресурсов (внутренних/внешних) и компетенций необходимо аккумулировать для запуска и развития системы бизнес-анализа компании? (Как выбрать интегратора / консультанта? Какого набирать в штат? Как планировать и управлять BI-проектами? и т.д.)
Как необходимо трансформировать бизнес-процессы и корпоративную культуру?
и т.д.
Лучшие практики мобильного маркетинга: как стать №1Eugene Lisovskiy
- Обзор рынка электронных книг: тренды, прогнозы;
- Лучшие кейсы по мобильному маркетингу: как мы стали #1;
- Методы монетизации приложений: premium, freeware, freemium, shareware, adware;
- Электронные платежи: тренды, оптимизация;
- Сравнение каналов и стоимости привлечения мобильной аудитрии;
- Мобильная аналитика: инструменты, тренды, прогнозы;
- Универсальный подход к эффективному менеджменту в маркетинге.
Решения HPE Software для Больших данныхYuri Yashkin
Аналитика Больших данных позволяет улучшить бизнеспроцессы и операционную деятельность, повысить эффективность управления рисками и добиться дополнительной экономии средств. В документе описаны восемь подводных камней на пути к внедрению аналитики Больших данных
Анализ данных для распознавания коронарных сосудов и предсказания ишемической болезни сердца. Созданное ПО увеличивает процесс распознавания до 76%. Время распознавания одного сета - 295 секунд.
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Datavalveindustryhub
Работа с сообществом: от операций - к стратегии
• Шаг 1. Сообщество – инструмент продаж
– Представительство в основных соцсетях и предметных форумах
– Мониторинг релевантных сообщений в соцсетях и реагирование
– Организация взаимодействия между клиентами (c2c-поддержка)
• Шаг 2. Сообщество помогает наращивать KPI
– Привязка активностей в соцсетях к основным КПЭ работы с клиентами: time-to-
market, CSAT, response times...
– Качественное понимание картины: типовые проблемы продукта/сервиса, идеи по совершенствованию, что говорят и как думают клиенты
• Шаг 3. Сообщество – стратегический партнер бизнеса
– Что будет нужно нашей ЦА через одно или два поколения наших продуктов
Несовершенство компьютерных технологий - почему так много до сих пор зависит ...Pavel Cherkashin
На ИТ конференциях мы говорим об удивительном прогрессе, которых достигли информационные технологии. Однако на самом деле технологии находятся еще на уровне динозавров - глупые прожорливые монстры...
Data-driven business: Информационная основа деятельности современной КомпанииAlexander Barakov
Обоснование концепции Data-driven business - попытка показать вектор трансформации способа ведения бизнеса вне зависимости от отрасли и найти ответы на ключевые вопросы, стоящие перед современной компанией:
Какие данные являются значимыми для бизнеса?
Какие значимые данные появятся и будут необходимы бизнесу через 5,10, 20 лет?
Какие новые виды анализа данных могут трансформировать принятие решений в вашей отрасли, повысив операционную эффективность?
Какой набор ПО оптимальным образом будет решать задачи связанные с хранением, обработкой, анализом данных и доставкой и информации пользователям?
Какие BI- BigData-решения внедрять, с какими приоритетами?
Какой набор ресурсов (внутренних/внешних) и компетенций необходимо аккумулировать для запуска и развития системы бизнес-анализа компании? (Как выбрать интегратора / консультанта? Какого набирать в штат? Как планировать и управлять BI-проектами? и т.д.)
Как необходимо трансформировать бизнес-процессы и корпоративную культуру?
и т.д.
Лучшие практики мобильного маркетинга: как стать №1Eugene Lisovskiy
- Обзор рынка электронных книг: тренды, прогнозы;
- Лучшие кейсы по мобильному маркетингу: как мы стали #1;
- Методы монетизации приложений: premium, freeware, freemium, shareware, adware;
- Электронные платежи: тренды, оптимизация;
- Сравнение каналов и стоимости привлечения мобильной аудитрии;
- Мобильная аналитика: инструменты, тренды, прогнозы;
- Универсальный подход к эффективному менеджменту в маркетинге.
Решения HPE Software для Больших данныхYuri Yashkin
Аналитика Больших данных позволяет улучшить бизнеспроцессы и операционную деятельность, повысить эффективность управления рисками и добиться дополнительной экономии средств. В документе описаны восемь подводных камней на пути к внедрению аналитики Больших данных
Similar to Евгений Линник. БКС. GIGO — секреты очистки данных (20)
Анализ данных для распознавания коронарных сосудов и предсказания ишемической болезни сердца. Созданное ПО увеличивает процесс распознавания до 76%. Время распознавания одного сета - 295 секунд.
Павел Бахтин. ВШЭ. Использование state-of-the-art эмбеддинговых моделей для а...Global Innovation Labs
О проблемах использования эмбеддинговых моделей (в т.ч. BERT, XLNet) для анализа научно-технических текстов. Рассмотрены способы оценки их эффективности и кейс расширения базы знаний на примере одного научно-технологического направления.
Нейросеть должна не только правильно классифицировать корректные запросы, но также отфильтровывать заведомо неправильные. Необходимо, чтобы обученная сеть на нерелевантные запросы давала ответ «не знаю», а не предлагала наиболее подходящую услугу. Например, на вопрос «где получить паспорт?», сетка должна назвать номер кабинета и услугу, а на вопрос «где получить паспорт пирата?» ответить «не знаю».
Александр Ерофеев. Газпромнефть. Управление качеством данных, инструмент и пр...Global Innovation Labs
Вы знали, что в следствии цифрофизации бизнес процессов нефтяные компании стали создавать петабайты данных и сегодня 70% проектов направленных на повышение эффективности зависят от качества данных?
Как устроен процесс управления качеством данных и какие инструменты для этого используются расскажет Александр Ерофеев CDO блока разведки и добычи компании Газпром нефть.
Петр Ермаков. LAMODA. Автоматическая валидация контента в e-commerceGlobal Innovation Labs
Пальто с 300 кОрманами, или как искать ошибки.
LAMODA — это один из основных игроков онлайн-торговли в России с более чем 5 миллионами товаров в каталоге. И это не только сайт. Это - свои склады размером с футбольные поля, свои курьеры и парк автомобилей, свой отдел e-production с фото-студией и моделями. Компания не только делает свои фотографии товаров, но и сама создает описание и заполняет атрибуты. К сожалению, ручной процесс не исключает ошибок.
Как автоматизировать поиск ошибок в контенте и как методы анализа данных в этом помогают?
Андрей Коняев. ArenaData. Построение аналитики на ClickHouse — преимущества и...Global Innovation Labs
Когда стоит выбирать ClickHouse.
1. Когда у вас много фактов без обновлений:
- web-аналитика
- реклама
- e-commerce and finance
- мониторинг
- телеком, анализ логов
2. Витрины данных:
- нет JOIN со спилами
- очень хорошо переносит клиентскую нагрузку
- легко масштабируется
- быстрая агрегация витрин
- OBDC, JDBC, HTTP клиентские интерфейсы
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...Global Innovation Labs
Как правильно ставить цели в план по развитию маркетинг-аналитики — определить дальнейшие шаги развития маркетинг-аналитики в компании.
Обзор главных технологий и компетенций, о которых стоит помнить на каждом из этапов плана. Вы будете заранее готовы и сможете забюджетировать нужные ресурсы.
К чему стоит быть готовым при внедрении прогнозов в маркетинг аналитике? Вы сможете составить план развития маркетинг-аналитики, учитывая возможные проблемы на этом пути.
Какие источники данных позволяют наиболее точно прогнозировать выполнение маркетинг-плана? Вы сможете контролировать процесс выполнения плана и понимать в каких сегментах ваши зоны роста, а где - риски.
Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...Global Innovation Labs
Вредные советы о лучших способах убить производительность аналитической СУБД.
1. Передавайте много данных по сети.
2. Обрабатывайте лишние объемы данных.
3. Пренебрегайте мониторингом.
4. Никогда не используйте сжатие данных!
5. И, конечно же, забывайте про резервирование
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камниGlobal Innovation Labs
1. Потребности бизнеса, клиентов и рынка в массовом скоринге
2. Первый технологический стек, первый прототип
3. Полезные новейшие возможности облаков для скоринга и других применений ML
4. Выбор фич
5. Несбалансированные данные - как не сойти с ума
6. Оптимизация моделей скоринга
7. Внедрение скоринга в продукт
Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...Global Innovation Labs
Как построить эффективный медийный продукт на основе данных.
При грамотной настройке "умной выдачи" и "умной рекламы" рост эффективности РК по сегментам показывает до 40%.
Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...Global Innovation Labs
1. Большие данные о действиях пользователей в продуктах можно превратить в траектории и обрабатывать с помощью ML
2. ML позволяет быстро получать поведенческую сегментацию и строить наглядные интерпретируемые карты
3. Сегменты с проблемным поведением позволяют локализовать точки роста бизнеса и разместить их в клиентском пути
4. Касания и клики в рекламных каналах могут быть обработаны тем же пайплайном, чтобы точнее оценить качество трафика и эффективнее бюджетировать каналы.
Исследование ценностей и целей российских женщин при помощи нейросетей.
Как определить динамику изменения целей и ценностей, создать новые продукты и скорректировать имеющиеся.
Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...Global Innovation Labs
О том, как корпорации "следят" за нами. Обработка BigData требует средств, технологий и кадров. В первую очередь деньги вложат те, кто сможет быстро продать анализ вашей персональной информации: Google, Яндекс, Facebook, Сбербанк и т.д.
Государство - всегда догоняющий игрок.
Правительственные идеи тотального контроля лишь клонируют или расширяют корпоративные разработки.
Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения пр...Global Innovation Labs
Каким образом решить задачу увеличения конверсии CRM-кампаний по банковскому продукту для среднего и малого бизнеса. Как собрать внутренние и внешние источники данных. Какой использовать инструментарий. Какой выбрать алгоритм и оптимизацию гиперпараметров для максимизации прогнозирующей производительности конечной модели.
Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...Global Innovation Labs
Треть рабочего времени сотрудников теряется в попытках помочь друг друга.
Люди одной микрогруппы хорошо понимают друг друга и плохо понимают людей из других микрогрупп.
При внедрении ИИ текучка среди специалистов в первый месяц снизилась с 30% в месяц до 20%. Производительность увеличилась в 8 раз.
Как сделать лингвистический анализ судебных споров, в которых участвует компания, и вычислить, какие дополнительные активы или обязательства возникнут у нее в качестве дисконтированной на срок судебного разбирательства суммы потенциального выигрыша или проигрыша, вероятность которого вычисляется на основе аналогичных исков в том же суде с тем же предметом спора.
2. Евгений Линник
Экспертиза: большие данные, машинное обучение,
компьютерное зрение, дополненная реальность, построение процессов в
организации, цифровая трансформация, управление данными
MBA: CIO РАНХиГС
Опыт: более 6 лет проектной практики BigData
Разработка IT-решений для аналитики и работы с цифровыми массивами информации с
последующим внедрением результатов
в процессы организации – вот чем я занимаюсь каждый день!
2
4. Промышленность
Задача: поиск аномалий
Проблема: отсутствие данных о единицах
продукции
Решение: счетчик единиц продукции был
добавлен аналитически
4
Система источник: IBA PDA (АСУТП 1-3 уровень)
5. 5
Банк
Задача: поиск фрода
Проблема: малое количество целевых событий
Решение: первым этапом был применен
алгоритм «обучения без учителя» для
выявления случаев похожих на на целевые.
Система источник: Единый фронт и ABS
6. Задача: предсказание перетоков электроэнергии
Проблема: низкое качество предсказания
Решение: учли сезонность и тренды при
формировании прогноза
6
Энергетическая компания
Выделение сезонной компоненты
Исходный временной ряд
Тренд
Сезонная компонента
Остаток
7. Задача: определение места нахождения абонентов
Проблема: абоненты находятся в реках и озерах
Решение: применили еще один слой с ГЕО
7
Система источник: Пребиллинг (TDR)
Телеком
8. Задача: маркетинговые коммуникации на основе
данных о поведении в цифровых каналах
Проблема: источник без гарантии доставки
Решение: проблема решена на уровне бизнес-логики
8
Система источник: логи приложения
Финансовый сервис
9. Задача: витрина для маркетинговых коммуникаций
Проблема: внешние данные в модели
Решение: регулярное тестирование остаточной
значимости переменных
9
Система источник: внешние данные
Авиакомпания
10. Задача: online2offline и indoor
проходимость
Проблема: ограничения технологии
Решение: отказ от части бизнес-кейсов
10
Система источник: Wi-Fi сканер
Ритейл
11. • Выделяйте недостающие критерии аналитически, если есть
возможность.
• Плохая разметка данных не приговор, просто нужно будет
больше работать.
• Попробуйте очистить данные от помех, вызванных
прогнозируемыми факторами.
• Учитывайте особенности источников данных, особенно для
event based кейсов.
• Следите за изменением в алгоритмах формирования
комплексных измерений, регулярно тестируйте модель.
• Разберитесь в технологии, на которой основан источник и в ее
ограничениях.
11
Выводы
• Используйте внешние данные для уточнения результатов
аналитики, если это возможно.