Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

корпусная лингвистика

861 views

Published on

Published in: Education, Business, Technology
  • Be the first to comment

  • Be the first to like this

корпусная лингвистика

  1. 1. КОРПУСНАЯ ЛИНГВИСТИКА
  2. 2. ИСТОРИЯ <ul><li>Брауновский корпус, 1963 г </li></ul><ul><li>(БК, англ. Brown Corpus, BC) </li></ul><ul><li>По модели близкой к БК был создан </li></ul><ul><li>Уппсальский корпус русского языка, 1980 г </li></ul>
  3. 3. ОСНОВНЫЕ НАПРАВЛЕНИЯ КОРПУСА <ul><li>Лексикография </li></ul><ul><li>Грамматика </li></ul><ul><li>Лингвистика текста (в том числе устного) </li></ul><ul><li>Лингводидактика </li></ul><ul><li>Многоязычные (переводные) корпусы </li></ul>
  4. 4. ЛЕКСИЧЕСКОЕ УЧЕНИЕ <ul><li>Сэмьюэл Джонсон </li></ul><ul><li>Отказался от расположения слов «по темам», например, отдельно все растения или все морские животные, и положил в основу алфавитный принцип. </li></ul><ul><li>Проработал обширную литературу всех жанров и направлений, отобрал огромное количество примеров и включил их в каждую словарную статью, чтобы проиллюстрировать употребление слова. </li></ul><ul><li>Упорядочил написание и произношение слов </li></ul><ul><li>Впервые поставил на титульном листе название Dictionary – «Словарь» </li></ul>
  5. 5. ОСНОВНЫЕ КОМПЬЮТЕРНЫЕ КОРПУСА <ul><li>1960-е: Брауновский корпус, (США), 1 млн. слов </li></ul><ul><li>1970-е: LOB корпус (Великобритания, Норвегия), 1 млн. </li></ul><ul><li>Уппсальский корпус русского языка (Швеция), 1 млн. </li></ul><ul><li>1990-е: British National Corpus, 100 млн. </li></ul><ul><li>Национальный корпус русского языка, 140 млн. </li></ul><ul><li>Oxford English corpus, 2 млрд. </li></ul>
  6. 6. ТИПЫ КОРПУСНОЙ РАЗМЕТКИ <ul><li>морфологическая </li></ul><ul><li>синтаксическая </li></ul><ul><li>семантическая </li></ul><ul><li>анафорическая </li></ul><ul><li>просодическая </li></ul>
  7. 7. КОРПУСНЫЕ МЕНЕДЖЕРЫ <ul><li>Поиск конкретных словоформ </li></ul><ul><li>Поиск словоформ по леммам </li></ul><ul><li>Поиск группы словоформ в виде разрывной или неразрывной синтагмы </li></ul><ul><li>Поиск словоформ по набору морфологических признаков </li></ul><ul><li>Получение различных лексико-грамматических статистических данных </li></ul><ul><li>Сохранение отобранных строк конкорданса </li></ul>
  8. 8. ПРИМЕРЫ <ul><li>– Национальный корпус русского языка  http://ruscorpora.ru/ </li></ul><ul><li>–  British National Corpus   http://www.natcorp.ox.ac.uk/ </li></ul><ul><li>– International Corpus of English  http://ice-corpora.net/ice/ </li></ul>
  9. 9. НАЦИОНАЛЬНЫЙ КОРПУС РУССКОГО ЯЗЫКА
  10. 10. БРИТАНСКИЙ НАЦИОНАЛЬНЫЙ КОРПУС
  11. 11. МЕЖДУНАРОДНЫЙ КОРПУС АНГЛИЙСКОГО ЯЗЫКА
  12. 12. АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТА
  13. 13. ПОЛЬЗОВАТЕЛИ <ul><li>Прикладные лингвисты </li></ul><ul><li>Лингвисты-теоретики </li></ul><ul><li>Преподаватели </li></ul><ul><li>Компьютерные лингвисты </li></ul><ul><li>Специалисты по общественным наукам (историки, социологи) </li></ul><ul><li>Корпусы, как инструмент для разработки и настройки различных автоматизированных систем </li></ul>
  14. 14. РЕЗУЛЬТАТЫ <ul><li>Все употребления выбранного слова в непосредственном контексте </li></ul><ul><li>Слова, которые чаще всего стоят рядом с выбранным словом </li></ul><ul><li>Наиболее важные различия между двумя наборами текстов </li></ul><ul><li>Как тот или иной писатель использует слова и фразы </li></ul>
  15. 15. СПАСИБО ЗА ВНИМАНИЕ!

×