Как сравнить миллионы описаний фильмов — из десятков источников и на разных языках? Как структурировать полученные данные и для каждого фильма агрегировать их в максимально полную информационную карточку? Речь пойдёт о разных подходах к решению этой задачи (детерминированном, вероятностном, или методом машинного обучения), о необходимых библиотеках и инструментах, а также о сходных задачах.