Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Чатбот для подсказки ответов на вопросы —
новейшие алгоритмы, нейронные сети,
промышленная Java и большие нагрузки
Алексан...
Карл…
Карл, я пишу
хороший код и
люблю свою
работу….
Это очень круто,
пап!
Карл… Карл, я специалист по
BigData….
Это очень круто,
пап!
Но я давно забыл тервер
и диффиренциальное
исчисление и НЕ МОГ...
«Открытые линии»
• У вас есть какой-нибудь интернет-
магазин
• Нужно скоммуницировать экспертов
интернет-магазина с покупа...
«Открытые линии»
«Открытые линии»
«Открытые линии»
«Открытые линии»
Призовем Ктулху?
• Клиент состыкован с менеджером
• Но клиенты задают часто похожие
вопросы
• И получают похожие ответы
• ...
Все готовы к отжигу в
печи?
• Начнет болеть голова
• Из носа потечет кровь
• Пропадет слух
• Возможны судорги и
левитация…
Здравствуй, NLP
• Регулярки? Да! 
• Куча экспертов и …
регулярки?
• Предикативная логика и
базка?
• Семантические графы и...
Национальный корпус русского
языка и … «тайные знания»
• ruscorpora.ru
• Томита-парсер (Яндекс)
• Морфологический словарь
...
Карл…
Карл, я подписан на
новости научной
библиотеки….
Это очень круто,
пап!
Карл… Карл, я специалист по
BigData….
Это очень круто,
пап!
Только на их данных у
них ВСЕ РАБОТАЕТ… а у
на моих – нет  По...
«Из грязи» … в князи!
• Зачем изучать линейную
алгебру?
• Зачем понимать
логистическую регрессию?
• Зачем знать модели Мак...
Нам поможет «черная магия»
нейронок
• DSSM (Microsoft) и другие…
• Яндекс «Палех», Google
SmartReply
• Word2Vec, GloVe
Суть архитектуры на пальцах…
• 3 (N)-граммы, tfidf
• Сжатие размерности
(нелинейное)
• Метрика похожести какая
«НИТЬ», нап...
Метрики похожести, страшные и
ужасные…
• Многое зависит от ваших
данных
• Их объема, структуры
• Фазы Луны
• Года по китай...
На чем «кодить», production
• Тензоры… numpy, nd4j
• Python: Theano, Keras,
TensorFlow
• Lua: Torch7
• Java/Scala: Deeplea...
«Нейробот» 
Embedding+encoding -
каскад сжатия вопроса/контекста
(RNN/FF/CNN, softsign, adam)
Слой векторного умножения
(...
TuringТюнинг…
• Если мало данных… нейронка «бредит»
• Метрики качества: recall@N, уровень «бреда» и т.п.
• Обратный индекс...
Бот-платформа Битрикс24
• https://dev.1c-bitrix.ru/learning/course/?COURSE_ID=93
• Приглашаем дата-сатанистов сайнтистов к...
Спасибо за
внимание!
Вопросы?
Александр Сербул
@AlexSerbul
Alexandr Serbul
serbul@1c-bitrix.ru
Upcoming SlideShare
Loading in …5
×

Александр Сербул, 1С-Битрикс — Чатбот для подсказки ответов на вопросы — новейшие алгоритмы, нейронные сети, промышленная Java и большие нагрузки

118 views

Published on

Конференция Dev Party (http://devparty.ru).
Вологда, 25.03.2017

Published in: Software
  • Be the first to comment

  • Be the first to like this

Александр Сербул, 1С-Битрикс — Чатбот для подсказки ответов на вопросы — новейшие алгоритмы, нейронные сети, промышленная Java и большие нагрузки

  1. 1. Чатбот для подсказки ответов на вопросы — новейшие алгоритмы, нейронные сети, промышленная Java и большие нагрузки Александр Сербул руководитель направления
  2. 2. Карл… Карл, я пишу хороший код и люблю свою работу…. Это очень круто, пап!
  3. 3. Карл… Карл, я специалист по BigData…. Это очень круто, пап! Но я давно забыл тервер и диффиренциальное исчисление и НЕ МОГУ ИХ ВСПОМНИТЬ, даже за отпуск!
  4. 4. «Открытые линии» • У вас есть какой-нибудь интернет- магазин • Нужно скоммуницировать экспертов интернет-магазина с покупателями из разных каналов… • Люди начинают задавать вопросы… • Ваши сотрудники начинают им отвечать…
  5. 5. «Открытые линии»
  6. 6. «Открытые линии»
  7. 7. «Открытые линии»
  8. 8. «Открытые линии»
  9. 9. Призовем Ктулху? • Клиент состыкован с менеджером • Но клиенты задают часто похожие вопросы • И получают похожие ответы • База знаний, ЧАВО… •А вдруХ AI поможет?
  10. 10. Все готовы к отжигу в печи? • Начнет болеть голова • Из носа потечет кровь • Пропадет слух • Возможны судорги и левитация…
  11. 11. Здравствуй, NLP • Регулярки? Да!  • Куча экспертов и … регулярки? • Предикативная логика и базка? • Семантические графы и ЛСД (C20H25N3O)
  12. 12. Национальный корпус русского языка и … «тайные знания» • ruscorpora.ru • Томита-парсер (Яндекс) • Морфологический словарь • Словарь синонимов • Тезаурус/семантическая сеть • «Тайные знания» Яндекс, ABBYY…
  13. 13. Карл… Карл, я подписан на новости научной библиотеки…. Это очень круто, пап!
  14. 14. Карл… Карл, я специалист по BigData…. Это очень круто, пап! Только на их данных у них ВСЕ РАБОТАЕТ… а у на моих – нет  Пойду и напьюсь!
  15. 15. «Из грязи» … в князи! • Зачем изучать линейную алгебру? • Зачем понимать логистическую регрессию? • Зачем знать модели Макарова Маркова? • Айда сразу в … Deep Learning!
  16. 16. Нам поможет «черная магия» нейронок • DSSM (Microsoft) и другие… • Яндекс «Палех», Google SmartReply • Word2Vec, GloVe
  17. 17. Суть архитектуры на пальцах… • 3 (N)-граммы, tfidf • Сжатие размерности (нелинейное) • Метрика похожести какая «НИТЬ», например скалярное произведение векторов: arxiv (1508.01585v2)
  18. 18. Метрики похожести, страшные и ужасные… • Многое зависит от ваших данных • Их объема, структуры • Фазы Луны • Года по китайскому календарю • Дня и месяца рождения руководителя проекта!
  19. 19. На чем «кодить», production • Тензоры… numpy, nd4j • Python: Theano, Keras, TensorFlow • Lua: Torch7 • Java/Scala: Deeplearning4j • Production…
  20. 20. «Нейробот»  Embedding+encoding - каскад сжатия вопроса/контекста (RNN/FF/CNN, softsign, adam) Слой векторного умножения (dot product) либо другой kernel Корректирующий слой (feed forward + softmax) Ответ сети: похожесть вопроса и ответа (0-1) TF-IDF/Ngram – токенизация TF-IDF/Ngram - токенизация Embedding+encoding - каскад сжатия ответа (RNN/FF/CNN, softsign, adam) "Вопрос" "Ответ" Кластер веб-серверов, Кэширование, REST-API GPUs (TitanX) Возможные ответы на контекст Глубокая нейронная сеть с двумя входами и одним выходом с адаптивной архитектурой. Внутри сети происходит совмещение семантических пространств вопросов и ответов.
  21. 21. TuringТюнинг… • Если мало данных… нейронка «бредит» • Метрики качества: recall@N, уровень «бреда» и т.п. • Обратный индекс • Кластеризация похожих ответов • Многопоточность • Онлайн-дообучение • Экстремальный highload • «Экспериментируем» с мэрией Москвы
  22. 22. Бот-платформа Битрикс24 • https://dev.1c-bitrix.ru/learning/course/?COURSE_ID=93 • Приглашаем дата-сатанистов сайнтистов к сотрудничеству • Пишите NLP + Deep + Convolution+ Adversarial + Autoencoder + Neural Turing Machine + … чат-боты • Всем отличного настроения и качественных моделей! 
  23. 23. Спасибо за внимание! Вопросы? Александр Сербул @AlexSerbul Alexandr Serbul serbul@1c-bitrix.ru

×