Документ описывает открытый корпус текстов на русском языке, доступный для пользователей под свободной лицензией и размечаемый сообществом. Основное внимание уделяется принципам работы корпуса, включая его структуру, методы разметки и жизненный цикл текста, а также вызовам, связанным с единообразием и доступностью данных. Заключение подчеркивает важность открытости лингвистических баз данных для развития языкознания и прикладных систем обработки текста.