004григорьев

146 views

Published on

  • Be the first to comment

  • Be the first to like this

004григорьев

  1. 1. Николай Григорьев Отдел лингвистических технологий Компьютерная лингвистика в Яндексе
  2. 2. Лингвистические методы • Machine Learning • Статистика • Контекстно-свободные грамматики • Словарные и корпусные данные • Онтологии • Языковые модели
  3. 3. Снятие омонимии Снятие разнообразных неоднозначностей: • Морфологическая: Молоко стекло со стола • Синтаксическая: Он видел их семью своими глазами • «Объектная»: Михаил Задорнов: «20% российских семей могут себе позволить ипотеку»
  4. 4. Исправление опечаток • Генерация гипотез • Оценка исходного запроса и каждой гипотезы по языковой модели (language model) • Сравнение разницы вероятностей с функцией ошибки
  5. 5. Тезаурусные расширения
  6. 6. Как заметить расширения?
  7. 7. Подготовка данных для расширений
  8. 8. Контекст запроса: когда нельзя расширять
  9. 9. Расширение в контексте запроса
  10. 10. Персонализируем расширения
  11. 11. Яндекс.Перевод
  12. 12. Голосовые команды Едем от «улица Льва Толстого, 16» до «Азбука Вкуса» через «Лукойл»
  13. 13. Извлечение фактов в почте
  14. 14. Выделение именованных объектов
  15. 15. Выделение именованных объектов
  16. 16. Николай Григорьев grig@yandex-team.ru Отдел лингвистических технологий Спасибо!

×