О возможностях использования
информационных технологий
для развития
функционирования коми языка
Центр инновационных языковых технологий
КРАГСиУ
В последние годы миноритарные языки столкнулись с
проблемой ограниченного доступа языковых сообществ к
современным средствам коммуникации на родном языке, что
приводит к ситуации «цифрового неравенства».
Цифровое неравенство
Сглаживанию этого неравенства в отношении
коми и родственных ему языков России
призвана способствовать Межрегиональная
лаборатория информационной поддержки
функционирования финно-угорских языков
создание базовой инфраструктуры информационного
общества на финно-угорских языках, компьютерного
программного инструментария для обеспечения их
полноценного функционирования в электронном
информационном пространстве
создание и развитие электронных сервисов в области
образования и науки
консолидация усилий, обобщение наработок и результатов
деятельности отдельных специалистов, энтузиастов, групп
учёных, заинтересованных в развитии финно-угорской семьи
языков
Цели и задачи лаборатории
свободная лицензия
кооперация с заинтересованными
сообществами
единые форматы и стандарты
Принципы работы
раскладки клавиатуры
электронные словари
системы проверки правописания
(проверка орфографии)
электронный корпус текстов
морфологический и синтаксический
анализаторы
машинный перевод на русский язык и с
русского языка на финно-угорские
языки
Базовые продукты
Предлагаем принять к использованию международный
стандарт кодирования символов Юникод в качестве
стандарта для коми языка
На основе Юникода уже созданы коми раскладки для
наиболее популярных операционных систем, в которых
единообразно установлены коды коми букв ӧ и і
Раскладки бесплатно устанавливаются, алгоритм их
установки расписан на блоге лаборатории www.komikyv.ru
Раскладка клавиатуры
Поскольку коми символов до недавнего времени не было
в Юникоде, для набора использовались самодельные коми
шрифты
Сейчас коми символы в Юникоде появились, но
полиграфистам не хватает специальных шрифтов
Необходимо рекомендовать Правительству РК
разместить заказ на закупку необходимого количества
лицензионных шрифтов, поддерживающих коми язык для
нужд полиграфии
Коми шрифты
Программа GoldenDict дает возможность
включать разные словари в единую оболочку
Электронные словари создаются на базе
словников существующих бумажных словарей
Обеспечивается доступность словарей
Автоматизируется поиск слова
Возможность создания многофункционального
словаря
Необходимо обеспечить передачу исходников
коми словарей для включения в словарную
программу
Электронные словари
Для коми языка спел-чекер в
настоящее время создаётся на базе
программы HunSpell
Встает вопрос об установлении
рекомендуемых, допустимых и
недопустимых написаний в коми
языке
В дальнейшем возможно создание
более сложной системы на базе HFST
Проверка орфографии
Возможность автоматической проверки правописания –
показатель уровня развития языка
Морфологический анализатор – программа анализа
морфологической структуры языка
Синтаксический анализатор – программа для анализа
синтаксиса
Автоматический анализ грамматики языка выведет
на новый уровень теоретические и прикладные
исследования
Будет дан толчок к дальнейшей стандартизации
языка
Грамматические анализаторы
Перевод текстов коми литературного языка в
электронный текстовой формат
В базе ок. 2 млн. словоупотреблений
Текстовая база – основа электронной
библиотеки и национального корпуса коми
языка
Необходимо приобретение бесконтактного
сканнера
Необходима передача исходников от
издательств, редакций и авторов.
База электронных текстов
На основе автоматического анализа
грамматики, электронных словарей и
корпуса текстов будут созданы
автоматические переводчики
Русско-коми переводчики необходимы
для облегчения перевода
законодательства РК на коми язык
Коми-русские переводчики – для
знакомства лиц, не владеющих языком, с
содержанием коми текстов
Электронные переводчики
Программы распознавания текста (OCR), синтеза и
распознавания речи
Поисковые системы на коми языке
Коми локализация ПО
Создание коми приложений для мобильных устройств
Дистанционное обучение языку
Планируемые направления
работы
Для полноценного использования коми
языка в современных информационных
технологиях необходимо проводить
системную работу с обязательной
государственной поддержкой
Республики Коми (включение и
финансирование проводимых работ
через госзадание, через РЦП,
нормативно-правовая поддержка и т.д.)
Необходимость поддержки
Аттьӧ! Спасибо!

FU-Lab

  • 1.
    О возможностях использования информационныхтехнологий для развития функционирования коми языка Центр инновационных языковых технологий КРАГСиУ
  • 2.
    В последние годыминоритарные языки столкнулись с проблемой ограниченного доступа языковых сообществ к современным средствам коммуникации на родном языке, что приводит к ситуации «цифрового неравенства». Цифровое неравенство Сглаживанию этого неравенства в отношении коми и родственных ему языков России призвана способствовать Межрегиональная лаборатория информационной поддержки функционирования финно-угорских языков
  • 3.
    создание базовой инфраструктурыинформационного общества на финно-угорских языках, компьютерного программного инструментария для обеспечения их полноценного функционирования в электронном информационном пространстве создание и развитие электронных сервисов в области образования и науки консолидация усилий, обобщение наработок и результатов деятельности отдельных специалистов, энтузиастов, групп учёных, заинтересованных в развитии финно-угорской семьи языков Цели и задачи лаборатории
  • 4.
    свободная лицензия кооперация сзаинтересованными сообществами единые форматы и стандарты Принципы работы
  • 5.
    раскладки клавиатуры электронные словари системыпроверки правописания (проверка орфографии) электронный корпус текстов морфологический и синтаксический анализаторы машинный перевод на русский язык и с русского языка на финно-угорские языки Базовые продукты
  • 6.
    Предлагаем принять киспользованию международный стандарт кодирования символов Юникод в качестве стандарта для коми языка На основе Юникода уже созданы коми раскладки для наиболее популярных операционных систем, в которых единообразно установлены коды коми букв ӧ и і Раскладки бесплатно устанавливаются, алгоритм их установки расписан на блоге лаборатории www.komikyv.ru Раскладка клавиатуры
  • 7.
    Поскольку коми символовдо недавнего времени не было в Юникоде, для набора использовались самодельные коми шрифты Сейчас коми символы в Юникоде появились, но полиграфистам не хватает специальных шрифтов Необходимо рекомендовать Правительству РК разместить заказ на закупку необходимого количества лицензионных шрифтов, поддерживающих коми язык для нужд полиграфии Коми шрифты
  • 8.
    Программа GoldenDict даетвозможность включать разные словари в единую оболочку Электронные словари создаются на базе словников существующих бумажных словарей Обеспечивается доступность словарей Автоматизируется поиск слова Возможность создания многофункционального словаря Необходимо обеспечить передачу исходников коми словарей для включения в словарную программу Электронные словари
  • 9.
    Для коми языкаспел-чекер в настоящее время создаётся на базе программы HunSpell Встает вопрос об установлении рекомендуемых, допустимых и недопустимых написаний в коми языке В дальнейшем возможно создание более сложной системы на базе HFST Проверка орфографии Возможность автоматической проверки правописания – показатель уровня развития языка
  • 10.
    Морфологический анализатор –программа анализа морфологической структуры языка Синтаксический анализатор – программа для анализа синтаксиса Автоматический анализ грамматики языка выведет на новый уровень теоретические и прикладные исследования Будет дан толчок к дальнейшей стандартизации языка Грамматические анализаторы
  • 11.
    Перевод текстов комилитературного языка в электронный текстовой формат В базе ок. 2 млн. словоупотреблений Текстовая база – основа электронной библиотеки и национального корпуса коми языка Необходимо приобретение бесконтактного сканнера Необходима передача исходников от издательств, редакций и авторов. База электронных текстов
  • 12.
    На основе автоматическогоанализа грамматики, электронных словарей и корпуса текстов будут созданы автоматические переводчики Русско-коми переводчики необходимы для облегчения перевода законодательства РК на коми язык Коми-русские переводчики – для знакомства лиц, не владеющих языком, с содержанием коми текстов Электронные переводчики
  • 13.
    Программы распознавания текста(OCR), синтеза и распознавания речи Поисковые системы на коми языке Коми локализация ПО Создание коми приложений для мобильных устройств Дистанционное обучение языку Планируемые направления работы
  • 14.
    Для полноценного использованиякоми языка в современных информационных технологиях необходимо проводить системную работу с обязательной государственной поддержкой Республики Коми (включение и финансирование проводимых работ через госзадание, через РЦП, нормативно-правовая поддержка и т.д.) Необходимость поддержки
  • 15.