В документе рассказывается о тематическом моделировании текстов на естественном языке, которое помогает выявить темы в коллекциях документов и преодолеть трудности, связанные с синонимией и полисемией терминов. Описываются различные подходы, в том числе на основе байесовских сетей и латентно-семантического индексирования, а также их применение в таких задачах, как кластеризация, классификация и тематический поиск. Приводится обзор алгоритмов и программных реализаций, иллюстрирующих эффективность тематического моделирования в больших объемах текстовых данных.