1. Зачем нужен Sketch Engine
лексикографам?
• Деление на значения
• Описание значения
• Описание конструкций и сочетаемости
• Языковые примеры
2.
3. Каковы достоинства и недостатки веб-
базированных корпусов Sketch Engine
• Большой объем =>
точная статистика
• Легкодоступность
текстов
• Возможность
постоянного
обновления
• Нет равномерного
представления разных
слоев языка =>
статистике не всегда
можно доверять
• «Грязный» - много
ошибок в разметке,
много повторений,
много нецензурной
лексики
7. Почему плохо, что много
нецензурной лексики?
• Корпуса используются не только
лексикографами, но и преподавателями
языка, а также людьми, изучающими язык
• Учебные ресурсы должны быть «чистыми»
• Запросы на нейтральные темы часто дают
нецензурные выдачи
8.
9. Решение
• Sketch Engine – закрытый платный ресурс для
лексикографов с 20 млрд грязным корпусом
• Skell Sketch Engine – открытый бесплатный
ресурс с 1 млрд чистым корпусом, тремя
простыми видами поиска и выдачей коротких
примеров – удобно для широкого, не слишком
искушенного пользователя, для понимания
того, как используется языковая единица, для
создания языковых тренажеров
10.
11.
12.
13.
14. Русского Skell’а нет
• Если вы почистите 1 млрд корпус, то он
будет
• На НКРЯ пока нет таких удобных опций,
которые предоставляет Skell – коллокации
по грамматическим отношениям, близкие
слова, короткие примеры
• Skell очень нужен!