SlideShare a Scribd company logo
О возможностях использования
информационных технологий
для развития
функционирования коми языка
Центр инновационных языковых технологий
КРАГСиУ
В последние годы миноритарные языки столкнулись с
проблемой ограниченного доступа языковых сообществ к
современным средствам коммуникации на родном языке, что
приводит к ситуации «цифрового неравенства».
Цифровое неравенство
Сглаживанию этого неравенства в отношении
коми и родственных ему языков России
призвана способствовать Межрегиональная
лаборатория информационной поддержки
функционирования финно-угорских языков
создание базовой инфраструктуры информационного
общества на финно-угорских языках, компьютерного
программного инструментария для обеспечения их
полноценного функционирования в электронном
информационном пространстве
создание и развитие электронных сервисов в области
образования и науки
консолидация усилий, обобщение наработок и результатов
деятельности отдельных специалистов, энтузиастов, групп
учёных, заинтересованных в развитии финно-угорской семьи
языков
Цели и задачи лаборатории
свободная лицензия
кооперация с заинтересованными
сообществами
единые форматы и стандарты
Принципы работы
раскладки клавиатуры
электронные словари
системы проверки правописания
(проверка орфографии)
электронный корпус текстов
морфологический и синтаксический
анализаторы
машинный перевод на русский язык и с
русского языка на финно-угорские
языки
Базовые продукты
Предлагаем принять к использованию международный
стандарт кодирования символов Юникод в качестве
стандарта для коми языка
На основе Юникода уже созданы коми раскладки для
наиболее популярных операционных систем, в которых
единообразно установлены коды коми букв ӧ и і
Раскладки бесплатно устанавливаются, алгоритм их
установки расписан на блоге лаборатории www.komikyv.ru
Раскладка клавиатуры
Поскольку коми символов до недавнего времени не было
в Юникоде, для набора использовались самодельные коми
шрифты
Сейчас коми символы в Юникоде появились, но
полиграфистам не хватает специальных шрифтов
Необходимо рекомендовать Правительству РК
разместить заказ на закупку необходимого количества
лицензионных шрифтов, поддерживающих коми язык для
нужд полиграфии
Коми шрифты
Программа GoldenDict дает возможность
включать разные словари в единую оболочку
Электронные словари создаются на базе
словников существующих бумажных словарей
Обеспечивается доступность словарей
Автоматизируется поиск слова
Возможность создания многофункционального
словаря
Необходимо обеспечить передачу исходников
коми словарей для включения в словарную
программу
Электронные словари
Для коми языка спел-чекер в
настоящее время создаётся на базе
программы HunSpell
Встает вопрос об установлении
рекомендуемых, допустимых и
недопустимых написаний в коми
языке
В дальнейшем возможно создание
более сложной системы на базе HFST
Проверка орфографии
Возможность автоматической проверки правописания –
показатель уровня развития языка
Морфологический анализатор – программа анализа
морфологической структуры языка
Синтаксический анализатор – программа для анализа
синтаксиса
Автоматический анализ грамматики языка выведет
на новый уровень теоретические и прикладные
исследования
Будет дан толчок к дальнейшей стандартизации
языка
Грамматические анализаторы
Перевод текстов коми литературного языка в
электронный текстовой формат
В базе ок. 2 млн. словоупотреблений
Текстовая база – основа электронной
библиотеки и национального корпуса коми
языка
Необходимо приобретение бесконтактного
сканнера
Необходима передача исходников от
издательств, редакций и авторов.
База электронных текстов
На основе автоматического анализа
грамматики, электронных словарей и
корпуса текстов будут созданы
автоматические переводчики
Русско-коми переводчики необходимы
для облегчения перевода
законодательства РК на коми язык
Коми-русские переводчики – для
знакомства лиц, не владеющих языком, с
содержанием коми текстов
Электронные переводчики
Программы распознавания текста (OCR), синтеза и
распознавания речи
Поисковые системы на коми языке
Коми локализация ПО
Создание коми приложений для мобильных устройств
Дистанционное обучение языку
Планируемые направления
работы
Для полноценного использования коми
языка в современных информационных
технологиях необходимо проводить
системную работу с обязательной
государственной поддержкой
Республики Коми (включение и
финансирование проводимых работ
через госзадание, через РЦП,
нормативно-правовая поддержка и т.д.)
Необходимость поддержки
Аттьӧ! Спасибо!

More Related Content

Viewers also liked

словари
словарисловари
словари
guestb6ebd36
 
презентация система электронного перевода Soylem 3.
презентация система электронного перевода Soylem 3.презентация система электронного перевода Soylem 3.
презентация система электронного перевода Soylem 3.Berik Badayev
 
интернет для моей специальности
интернет для моей специальностиинтернет для моей специальности
интернет для моей специальностиKristinaIIE105
 
«Облачная» автоматизация переводов: что нового для переводчика-профессионала?
«Облачная» автоматизация переводов: что нового для переводчика-профессионала?«Облачная» автоматизация переводов: что нового для переводчика-профессионала?
«Облачная» автоматизация переводов: что нового для переводчика-профессионала?
ABBYY Language Serivces
 
Ainl2013 molchanov статистические методы в машинном переводе_проблемы роста
Ainl2013 molchanov статистические методы в машинном переводе_проблемы ростаAinl2013 molchanov статистические методы в машинном переводе_проблемы роста
Ainl2013 molchanov статистические методы в машинном переводе_проблемы ростаAINL Conferences
 
Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов
Сергей Балан
 
MT as a Translator's Tool (TFR_11) - in Russian
MT as a Translator's Tool (TFR_11) - in RussianMT as a Translator's Tool (TFR_11) - in Russian
MT as a Translator's Tool (TFR_11) - in Russian
oleg_vigodsky
 
Лекция 5. Инструментарий технического переводчика. Электронные словари, поис...
Лекция 5. Инструментарий технического переводчика. Электронные словари, поис...Лекция 5. Инструментарий технического переводчика. Электронные словари, поис...
Лекция 5. Инструментарий технического переводчика. Электронные словари, поис...
fiadotau
 
Cредства автоматизированного перевода
Cредства автоматизированного переводаCредства автоматизированного перевода
Cредства автоматизированного перевода
Tetyana Struk TrainStation
 
системы автоматизированного перевода
системы автоматизированного переводасистемы автоматизированного перевода
системы автоматизированного переводаMariaSuina
 
MПК3 - SDL - Опыт внедрения решений SDL Trados в российских переводческих ком...
MПК3 - SDL - Опыт внедрения решений SDL Trados в российских переводческих ком...MПК3 - SDL - Опыт внедрения решений SDL Trados в российских переводческих ком...
MПК3 - SDL - Опыт внедрения решений SDL Trados в российских переводческих ком...
mpk-club
 
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
RealSpeaker 2.0
 
визуализация информации
визуализация  информациивизуализация  информации
визуализация информации
Ikarochka
 
Научные журналы: требования международных систем
Научные журналы: требования международных системНаучные журналы: требования международных систем
Научные журналы: требования международных систем
Julia Glavcheva
 
системы распознавания речи в прикладных исследованиях
системы распознавания речи в прикладных исследованияхсистемы распознавания речи в прикладных исследованиях
системы распознавания речи в прикладных исследованиях
mariastyless
 
Системы автоматического распознавания речи
Системы автоматического распознавания речиСистемы автоматического распознавания речи
Системы автоматического распознавания речиArtem Lukanin
 

Viewers also liked (20)

словари
словарисловари
словари
 
презентация система электронного перевода Soylem 3.
презентация система электронного перевода Soylem 3.презентация система электронного перевода Soylem 3.
презентация система электронного перевода Soylem 3.
 
интернет для моей специальности
интернет для моей специальностиинтернет для моей специальности
интернет для моей специальности
 
«Облачная» автоматизация переводов: что нового для переводчика-профессионала?
«Облачная» автоматизация переводов: что нового для переводчика-профессионала?«Облачная» автоматизация переводов: что нового для переводчика-профессионала?
«Облачная» автоматизация переводов: что нового для переводчика-профессионала?
 
Ainl2013 molchanov статистические методы в машинном переводе_проблемы роста
Ainl2013 molchanov статистические методы в машинном переводе_проблемы ростаAinl2013 molchanov статистические методы в машинном переводе_проблемы роста
Ainl2013 molchanov статистические методы в машинном переводе_проблемы роста
 
Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов
 
MT as a Translator's Tool (TFR_11) - in Russian
MT as a Translator's Tool (TFR_11) - in RussianMT as a Translator's Tool (TFR_11) - in Russian
MT as a Translator's Tool (TFR_11) - in Russian
 
Использование систем распознавания текстов
Использование систем распознавания текстовИспользование систем распознавания текстов
Использование систем распознавания текстов
 
Guide russian
Guide russianGuide russian
Guide russian
 
4.5 (1)
4.5 (1)4.5 (1)
4.5 (1)
 
Лекция 5. Инструментарий технического переводчика. Электронные словари, поис...
Лекция 5. Инструментарий технического переводчика. Электронные словари, поис...Лекция 5. Инструментарий технического переводчика. Электронные словари, поис...
Лекция 5. Инструментарий технического переводчика. Электронные словари, поис...
 
Cредства автоматизированного перевода
Cредства автоматизированного переводаCредства автоматизированного перевода
Cредства автоматизированного перевода
 
системы автоматизированного перевода
системы автоматизированного переводасистемы автоматизированного перевода
системы автоматизированного перевода
 
MПК3 - SDL - Опыт внедрения решений SDL Trados в российских переводческих ком...
MПК3 - SDL - Опыт внедрения решений SDL Trados в российских переводческих ком...MПК3 - SDL - Опыт внедрения решений SDL Trados в российских переводческих ком...
MПК3 - SDL - Опыт внедрения решений SDL Trados в российских переводческих ком...
 
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
 
визуализация информации
визуализация  информациивизуализация  информации
визуализация информации
 
Научные журналы: требования международных систем
Научные журналы: требования международных системНаучные журналы: требования международных систем
Научные журналы: требования международных систем
 
системы распознавания речи в прикладных исследованиях
системы распознавания речи в прикладных исследованияхсистемы распознавания речи в прикладных исследованиях
системы распознавания речи в прикладных исследованиях
 
Системы автоматического распознавания речи
Системы автоматического распознавания речиСистемы автоматического распознавания речи
Системы автоматического распознавания речи
 
Promt
PromtPromt
Promt
 

Similar to FU-Lab

Построение внутренней эбс вуза
Построение внутренней эбс вузаПостроение внутренней эбс вуза
Построение внутренней эбс вуза
Nikita Melnikov
 
4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)
Smolensk Computer Science Club
 
Obshstestvennie i kone 17 6 2013
Obshstestvennie i kone 17 6 2013Obshstestvennie i kone 17 6 2013
Obshstestvennie i kone 17 6 2013Aleksey Shklyaev
 
Elib cms
Elib cmsElib cms
Внутрений проект.Долгушин Мирослав
Внутрений проект.Долгушин МирославВнутрений проект.Долгушин Мирослав
Внутрений проект.Долгушин Мирославmiroslaw24
 
ЭОР
ЭОРЭОР
ЭОР
anna_pal
 
компьютер в рки
компьютер в ркикомпьютер в рки
компьютер в ркиburkun
 
The European Library and the Europeana Union. Olaf Janssen presenting in Russ...
The European Library and the Europeana Union. Olaf Janssen presenting in Russ...The European Library and the Europeana Union. Olaf Janssen presenting in Russ...
The European Library and the Europeana Union. Olaf Janssen presenting in Russ...
Olaf Janssen
 
ТЗ на МИРО по РКИ от ММТ
ТЗ на МИРО по РКИ от ММТТЗ на МИРО по РКИ от ММТ
ТЗ на МИРО по РКИ от ММТ
Мультимедиа технологии
 
лингвистическое обеспечение электронных_библиотек
лингвистическое обеспечение электронных_библиотеклингвистическое обеспечение электронных_библиотек
лингвистическое обеспечение электронных_библиотек
Иван Иванов
 
Трансформации и тенденции в развитии операционных систем и программных платформ
Трансформации и тенденции в развитии операционных систем и программных платформТрансформации и тенденции в развитии операционных систем и программных платформ
Трансформации и тенденции в развитии операционных систем и программных платформ
Николай Лавлинский
 
Открытые электронные информационные ресурсы учреждений высшего образования Бе...
Открытые электронные информационные ресурсы учреждений высшего образования Бе...Открытые электронные информационные ресурсы учреждений высшего образования Бе...
Открытые электронные информационные ресурсы учреждений высшего образования Бе...
bntulibrary
 
Elau librery ru_
Elau librery ru_Elau librery ru_
Elau librery ru_uba2010
 
Проект ArmenianWorld
Проект ArmenianWorldПроект ArmenianWorld
Электронные корпуса
Электронные корпусаЭлектронные корпуса
Электронные корпусаanna_pal
 
Фундаментальная и прикладная лингвистика 2012-2013
Фундаментальная и прикладная лингвистика 2012-2013Фундаментальная и прикладная лингвистика 2012-2013
Фундаментальная и прикладная лингвистика 2012-2013
Vilena Bryleva
 
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйствеКорпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйствеWitology
 
Проблемы развития рынка ЭБС. Коллизии законодательства. Критерии оценки колич...
Проблемы развития рынка ЭБС. Коллизии законодательства. Критерии оценки колич...Проблемы развития рынка ЭБС. Коллизии законодательства. Критерии оценки колич...
Проблемы развития рынка ЭБС. Коллизии законодательства. Критерии оценки колич...
Иркутская областная библиотека им. И.И. Молчанова-Сибирского
 

Similar to FU-Lab (20)

Построение внутренней эбс вуза
Построение внутренней эбс вузаПостроение внутренней эбс вуза
Построение внутренней эбс вуза
 
4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)
 
Obshstestvennie i kone 17 6 2013
Obshstestvennie i kone 17 6 2013Obshstestvennie i kone 17 6 2013
Obshstestvennie i kone 17 6 2013
 
Elib cms
Elib cmsElib cms
Elib cms
 
Внутрений проект.Долгушин Мирослав
Внутрений проект.Долгушин МирославВнутрений проект.Долгушин Мирослав
Внутрений проект.Долгушин Мирослав
 
ЭОР
ЭОРЭОР
ЭОР
 
компьютер в рки
компьютер в ркикомпьютер в рки
компьютер в рки
 
The European Library and the Europeana Union. Olaf Janssen presenting in Russ...
The European Library and the Europeana Union. Olaf Janssen presenting in Russ...The European Library and the Europeana Union. Olaf Janssen presenting in Russ...
The European Library and the Europeana Union. Olaf Janssen presenting in Russ...
 
ТЗ на МИРО по РКИ от ММТ
ТЗ на МИРО по РКИ от ММТТЗ на МИРО по РКИ от ММТ
ТЗ на МИРО по РКИ от ММТ
 
лингвистическое обеспечение электронных_библиотек
лингвистическое обеспечение электронных_библиотеклингвистическое обеспечение электронных_библиотек
лингвистическое обеспечение электронных_библиотек
 
Трансформации и тенденции в развитии операционных систем и программных платформ
Трансформации и тенденции в развитии операционных систем и программных платформТрансформации и тенденции в развитии операционных систем и программных платформ
Трансформации и тенденции в развитии операционных систем и программных платформ
 
Lande, Jigalo
Lande, JigaloLande, Jigalo
Lande, Jigalo
 
Открытые электронные информационные ресурсы учреждений высшего образования Бе...
Открытые электронные информационные ресурсы учреждений высшего образования Бе...Открытые электронные информационные ресурсы учреждений высшего образования Бе...
Открытые электронные информационные ресурсы учреждений высшего образования Бе...
 
Elau librery ru_
Elau librery ru_Elau librery ru_
Elau librery ru_
 
Проект ArmenianWorld
Проект ArmenianWorldПроект ArmenianWorld
Проект ArmenianWorld
 
презентация1
презентация1презентация1
презентация1
 
Электронные корпуса
Электронные корпусаЭлектронные корпуса
Электронные корпуса
 
Фундаментальная и прикладная лингвистика 2012-2013
Фундаментальная и прикладная лингвистика 2012-2013Фундаментальная и прикладная лингвистика 2012-2013
Фундаментальная и прикладная лингвистика 2012-2013
 
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйствеКорпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
 
Проблемы развития рынка ЭБС. Коллизии законодательства. Критерии оценки колич...
Проблемы развития рынка ЭБС. Коллизии законодательства. Критерии оценки колич...Проблемы развития рынка ЭБС. Коллизии законодательства. Критерии оценки колич...
Проблемы развития рынка ЭБС. Коллизии законодательства. Критерии оценки колич...
 

More from Чемышев Андрей

Kone project syktyvkar
Kone project syktyvkarKone project syktyvkar
Kone project syktyvkar
Чемышев Андрей
 
Polina
PolinaPolina
Erudit
EruditErudit
Makarova
MakarovaMakarova
Njan
NjanNjan
Starceva
StarcevaStarceva

More from Чемышев Андрей (6)

Kone project syktyvkar
Kone project syktyvkarKone project syktyvkar
Kone project syktyvkar
 
Polina
PolinaPolina
Polina
 
Erudit
EruditErudit
Erudit
 
Makarova
MakarovaMakarova
Makarova
 
Njan
NjanNjan
Njan
 
Starceva
StarcevaStarceva
Starceva
 

FU-Lab

  • 1. О возможностях использования информационных технологий для развития функционирования коми языка Центр инновационных языковых технологий КРАГСиУ
  • 2. В последние годы миноритарные языки столкнулись с проблемой ограниченного доступа языковых сообществ к современным средствам коммуникации на родном языке, что приводит к ситуации «цифрового неравенства». Цифровое неравенство Сглаживанию этого неравенства в отношении коми и родственных ему языков России призвана способствовать Межрегиональная лаборатория информационной поддержки функционирования финно-угорских языков
  • 3. создание базовой инфраструктуры информационного общества на финно-угорских языках, компьютерного программного инструментария для обеспечения их полноценного функционирования в электронном информационном пространстве создание и развитие электронных сервисов в области образования и науки консолидация усилий, обобщение наработок и результатов деятельности отдельных специалистов, энтузиастов, групп учёных, заинтересованных в развитии финно-угорской семьи языков Цели и задачи лаборатории
  • 4. свободная лицензия кооперация с заинтересованными сообществами единые форматы и стандарты Принципы работы
  • 5. раскладки клавиатуры электронные словари системы проверки правописания (проверка орфографии) электронный корпус текстов морфологический и синтаксический анализаторы машинный перевод на русский язык и с русского языка на финно-угорские языки Базовые продукты
  • 6. Предлагаем принять к использованию международный стандарт кодирования символов Юникод в качестве стандарта для коми языка На основе Юникода уже созданы коми раскладки для наиболее популярных операционных систем, в которых единообразно установлены коды коми букв ӧ и і Раскладки бесплатно устанавливаются, алгоритм их установки расписан на блоге лаборатории www.komikyv.ru Раскладка клавиатуры
  • 7. Поскольку коми символов до недавнего времени не было в Юникоде, для набора использовались самодельные коми шрифты Сейчас коми символы в Юникоде появились, но полиграфистам не хватает специальных шрифтов Необходимо рекомендовать Правительству РК разместить заказ на закупку необходимого количества лицензионных шрифтов, поддерживающих коми язык для нужд полиграфии Коми шрифты
  • 8. Программа GoldenDict дает возможность включать разные словари в единую оболочку Электронные словари создаются на базе словников существующих бумажных словарей Обеспечивается доступность словарей Автоматизируется поиск слова Возможность создания многофункционального словаря Необходимо обеспечить передачу исходников коми словарей для включения в словарную программу Электронные словари
  • 9. Для коми языка спел-чекер в настоящее время создаётся на базе программы HunSpell Встает вопрос об установлении рекомендуемых, допустимых и недопустимых написаний в коми языке В дальнейшем возможно создание более сложной системы на базе HFST Проверка орфографии Возможность автоматической проверки правописания – показатель уровня развития языка
  • 10. Морфологический анализатор – программа анализа морфологической структуры языка Синтаксический анализатор – программа для анализа синтаксиса Автоматический анализ грамматики языка выведет на новый уровень теоретические и прикладные исследования Будет дан толчок к дальнейшей стандартизации языка Грамматические анализаторы
  • 11. Перевод текстов коми литературного языка в электронный текстовой формат В базе ок. 2 млн. словоупотреблений Текстовая база – основа электронной библиотеки и национального корпуса коми языка Необходимо приобретение бесконтактного сканнера Необходима передача исходников от издательств, редакций и авторов. База электронных текстов
  • 12. На основе автоматического анализа грамматики, электронных словарей и корпуса текстов будут созданы автоматические переводчики Русско-коми переводчики необходимы для облегчения перевода законодательства РК на коми язык Коми-русские переводчики – для знакомства лиц, не владеющих языком, с содержанием коми текстов Электронные переводчики
  • 13. Программы распознавания текста (OCR), синтеза и распознавания речи Поисковые системы на коми языке Коми локализация ПО Создание коми приложений для мобильных устройств Дистанционное обучение языку Планируемые направления работы
  • 14. Для полноценного использования коми языка в современных информационных технологиях необходимо проводить системную работу с обязательной государственной поддержкой Республики Коми (включение и финансирование проводимых работ через госзадание, через РЦП, нормативно-правовая поддержка и т.д.) Необходимость поддержки