2016 Дипломный проект Харитончук Сергея Анатольевича на тему "Разработка программного обеспечения для автоматизированного распознавания позывных радиостанций"
2016 Дипломный проект Харитончук Сергея Анатольевича на тему "Разработка программного обеспечения для автоматизированного распознавания позывных радиостанций"
1. Московский государственный университет
информационных технологий,
радиотехники и электроники
Кафедра КБ-3 „Управление и моделирование систем“
Дипломный проект на тему:
„Разработка программного обеспечения
для автоматизированного распознавания
позывных радиостанций“
Выполнил: Харитончук Сергей Анатольевич
Руководитель: Мельников Алексей Олегович
3. Постановка задачи
Обзор методов распознавания речи
Реализация алгоритма распознавания речи на
основе скрытых марковских моделей
Обучение программы распознавания лексем
позывных
Разработка алгоритма анализа правильности
позывного
12. Словарь
107 слов (три – четыре слова на букву и одно слово на цифру)
593 букв во всех словах
~ 5 букв на слово
A А Alfa America Анна Антон 4 4 7 4 5 20 1 1 1 1
B Б Bravo Boston Борис 3 5 6 5 0 16 1 1 1 0
C Ц Charlie Canada центр цапля 4 7 6 5 5 23 1 1 1 1
D Д Delta Denmark Дмитрий 3 5 7 7 0 19 1 1 1 0
E Е Echo Ecuador Елена 3 4 7 5 0 16 1 1 1 0
F Ф Foxtrot Florida Федор 3 7 7 5 0 19 1 1 1 0
G Г Golf Germany Галина 3 4 7 6 0 17 1 1 1 0
H Х Hotel Henry Харитон 3 5 5 7 0 17 1 1 1 0
I И Italy India Иван 3 5 5 4 0 14 1 1 1 0
J Й Julliet Japan Иван_краткий йот 4 7 5 12 3 27 1 1 1 1
K К Kilo Kentuky киловатт Константин 4 4 7 8 10 29 1 1 1 1
L Л Lima London Леонид 3 4 6 6 0 16 1 1 1 0
M М Mike Mexico Михаил Мария 3 4 6 6 5 21 1 1 1 1
N Н Norway November Николай 3 6 8 7 0 21 1 1 1 0
O О Oscar Ontario Ольга 3 5 7 5 0 17 1 1 1 0
P П Papa Portugal Павел 3 4 8 5 0 17 1 1 1 0
Q Щ Quebec Queen Щука 3 6 5 4 0 15 1 1 1 0
R Р Radio Romeo Роман радио 4 5 5 5 5 20 1 1 1 1
S С Sierra Santiago Сергей 3 6 8 6 0 20 1 1 1 0
T Т Tango Tokyo Тамара Татьяна 4 5 5 6 7 23 1 1 1 1
U У Uniform United Ульяна 3 7 6 6 0 19 1 1 1 0
V Ж Victoria Victory Жук 3 8 7 3 0 18 1 1 1 0
W В Wiskey Washington Василий 3 6 10 7 0 23 1 1 1 0
X Ь X-ray икс знак мягкий_знак 4 5 3 4 11 23 1 1 1 1
Y Ы Yankey Yokohama Игрек 3 6 8 5 0 19 1 1 1 0
Z З Zebra Zulu Зинаида Зоя 4 5 4 7 3 19 1 1 1 1
14. Структура затрат на разработку ПО
Основная заработная плата 37%
Дополнительная заработная
плата 4,5%
Отчисления на социальные
нужды 13%
Материалы 1,5%
Стоимость машинного времени
10%
Накладные расходы 34%
15. Выводы
Данное программное обеспечение позволяет
распознавать речь на основе скрытых марковских
моделей
Данное программное обеспечение позволяет
определять правильность позывных
Здравствуйте уважаемые члены государственной экзаменационной комиссии. Вашему вниманию предоставляется дипломный проект на тему…
Наш мир населен любителями - увлеченными людьми, посвящающими свой досуг какому-то любимому делу. С момента изобретения радио и по сегодняшний день основным применением его является передача информации из одного пункта в другой - радиосвязь. Так же появилось увлечение особого рода. Оно позволяет объединить воедино азарт охотника и страсть коллекционера, заставляет заниматься конструированием, требует умения говорить на иностранных языках, побуждает знакомиться с географией и радиотехникой. Речь идет о коротковолновом радиолюбительстве.
Задачами проекта является… (по слайду)
Искусственные нейронные сети способны решать задачи распознавания образов. При статическом подходе нейронная сеть анализирует звуковой сигнал целиком и делает разовый вывод. При динамическом подходе нейронная сеть анализирует небольшой отрезок сигнала (окно). Окно пробегает весь звуковой сигнал и нейронная сеть делает серию выводов. Далее на основе этих «локальных» выводов делается обобщенный «глобальный» вывод.
Использование скрытых марковских моделей для распознавания речи основано на двух приближениях:
1) Речь может быть разбита на фрагменты, соответствующие состояниям в СММ, параметры речи в пределах каждого фрагмента считаются постоянными.
2) Вероятность каждого фрагмента зависит только от текущего состояния системы и не зависит от предыдущих состояний.
Модель называется «скрытой», так как нас, как правило, не интересует конкретная последовательность состояний, в которой пребывает система.
Многочисленные работы и исследования показали, что применение скрытых марковских моделей помогает достичь наиболее высоких результатов при построении систем распознавания речи.
На вход подаётся wav файл, который мы делим на фрэймы по 10 мс с перекрытием
Каждый полученный фрейм умножаем на окно Хемминга
Применяем быстрое преобразование Фурье, получаем спектр. Выбираем из спектра 2 наиболее часто встречающиеся частоты и формируем из них пару
Кластеризируем полученные точки.
Применяем распределение Гаусса, получаем Гауссианы, которые будут состояниями СММ
При помощи алгоритма Баума-Вэлша уточняем гауссианы (мужской род)
Позывной делится на две части. По второй части можно предположить о категории радиолюбителя. Первую часть можно разделить ещё на две части. Первая указывает страну, в которой расположена радиостанция, вторая округ. Россия, 1 округ – Мурманск, 3 категория