Free Corpus I M S

404 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
404
On SlideShare
0
From Embeds
0
Number of Embeds
16
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Free Corpus I M S

  1. 1. Проект общедоступного многопользовательского корпуса Проблемы и перспективы Дмитрий Грановский
  2. 2. Зачем ещё один? <ul><li>У существующих корпусов: </li></ul><ul><li>Авторские права </li></ul><ul><ul><li>На текст </li></ul></ul><ul><ul><li>На разметку </li></ul></ul><ul><li>Административные ограничения </li></ul><ul><li>Недоступна сама разметка </li></ul>
  3. 3. Что будет уметь? <ul><li>Просмотр и редактирование разметки </li></ul><ul><li>(многопользовательский) </li></ul><ul><li>Возможность скачивания в разных форматах </li></ul><ul><li>Встроенный поиск по популярным запросам </li></ul><ul><li>Обработка «тяжёлых» запросов </li></ul>
  4. 4. Кто будет делать? <ul><li>Техническая часть – группа разработчиков </li></ul><ul><li>Наполнение – пользователи </li></ul>
  5. 5. Откуда брать тексты? <ul><li>Тексты с истекшим авторским правом </li></ul><ul><li>Тексты, на которые авторское право не распространяется </li></ul><ul><li>Тексты под свободной лицензией ( e.g. Википедия) </li></ul><ul><li>Остальное – по договорённости с правообладателем </li></ul>
  6. 6. Задачи инструментария <ul><li>Редактирование </li></ul><ul><li>Хранение </li></ul><ul><li>Поиск </li></ul>
  7. 7. Как можно использовать? <ul><li>Статистические исследования </li></ul><ul><li>Машинное обучение (как обучающий корпус) </li></ul><ul><li>Тестовый корпус для других ресурсов </li></ul>
  8. 8. Проблемы <ul><li>Почему эта модель доступа должна работать? </li></ul><ul><li>Как обеспечить совместную работу многих людей? ( многопользовательский ) </li></ul><ul><li>Как обеспечить целостность данных? </li></ul>
  9. 9. Проблемы <ul><li>Откуда взять столько квалифицированных редакторов? </li></ul><ul><li>Как бороться с ошибками редактирования? </li></ul><ul><li>Как не делать разметку с нуля? </li></ul><ul><li>Как унифицировать разметку? </li></ul>
  10. 10. <ul><li>Ваши вопросы </li></ul>
  11. 11. СПАСИБО! http://mathlingvo.ru Дмитрий Грановский [email_address]

×