Документ описывает проблемы и решения, связанные с аналитикой данных на платформе Рамблер, включая использование batch-обсчета, хранения агрегаций и обработки входных данных. Основное внимание уделяется модернизации механизма хранения сессий, скорости обработки и возможности масштабирования. Представлены недостатки текущих инструментов и платформ, а также результаты и впечатления от используемых технологий таких как Kafka, Spark и ClickHouse.