Текста много, а полезной информации мало. Как извлечь только то что нужно и ничего не пропустить? Система, которая представляется в докладе, обрабатывает огромный массив текстов, автоматически извлекает из них сущности и события интересующей предметной области, после чего они доступны для последующего анализа. Такую систему можно разработать только на open source технологиях, она не требует гигантского количества серверов, зато интенсивно использует технологии Natural Language Processing и Machine Learning.