Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Mdanshina 290113
1. Методика автоматизированной расшифровки знаменных песнопений
Актуальность:
· необходимость представления рукописей в электронном виде для обеспечения их
доступности более широкому кругу людей
· необходимость получения словарей, которые будут использоваться для перевода
1
знаменных песнопений в нотолинейную нотацию
· необходимость не только визуального контроля, но и с помощью прослушивания
мелодии
· необходимость получения справочной информации о знаменных песнопениях
Цель:
· Разработка компонентной методики расшифровки знаменных песнопений
Задачи:
· изучение особенностей знаменных песнопений
· анализ существующих методов расшифровки и перевода
· разработка методов обработки знаменных песнопений
· разработка методов проверки правильности введенных двоезнаменников
· разработка методики автоматизированной расшифровки знаменных песнопений
· проектирование и реализация программного комплекса АСНИ АЭ
Особенности знамен
Исследуемые рукописи:
1) Круг древнего знаменного пения 1884 г - 1367 страниц
2) Ирмологий 17 в. - 68 страниц
3) Сборник попевок Соловецкого собрания - 213 страниц
Пример пометной рукописи
Пример беспометной рукописи
Пример азбуки Пример двоезнаменника
2. Методы исследования и перевода
2
знаменных песнопений
Исследование древних безлинейных певческих нотаций:
1. Ретроспективный подход – от известного к неизвестному (путем сравнения, сопоставления)
2. Прогрессивный подход – от древнейших к более поздним формам (логика, сравнение с византийской
нотацией)
Типы систем машинного перевода:
· Основанные на правилах (грамматики)
· Семантические
· Память перевода
· Основанные на примерах (корпус текста во время
перевода используется как база знаний - словари
попевок, системы продукций с приоритетами)
· Статистические (используется модель Шеннона)
Аналогии структур с точки зрения перевода в музыке Употребление в практике различных
и языке типов столповой нотаций
Века
XI-XII XIII XIV XV XVI XVII XVIII XIX XX
Нотации
Столповая
С
В
А
Линейная
Квадратная
Круглая
A. Знамена + «киноварные пометы» (определяют
высоту) + признаки
B. Знамена + «киноварные пометы»
C. Беспометная нотация
Сложность перевода знаменных песнопений в нотолинейную нотацию
Знамя – графическое изображение ноты Попевка – последовательность знамен с
Особенности знамен особенные значением (переводом).
· Перевод, представленный в азбуках,
неоднозначен Особенности попевок
· Одно знамя может представляться · Большое количество попевок (>2 000)
несколькими нотами · Попевки объединялись в сборники
· Не все знамена представлены в азбуках · Зависимость перевода от текста
4. Методы перевода
4
Структурная схема перевода
Песнопение База Словарь
(.xml) Эксперт знаний (.xml)
Оператор
Песнопение Песнопение
в нотной (.xml)
нотации
(.xml)
АС
Расшифровки АС Эксперт
Модуль Исследования
знаменных
ввода База данных знаменных
песнопений
песнопений песнопений
Словарь
(.xml)
Словарь
(.xml)
Словарь
Песнопение (.xml) Модуль
(.xml) воспроизведения
Песнопение
песнопений
в нотной
Песнопение нотации
в нотной (.xml)
нотации
(.xml)
Эксперт
Используемые методы:
1. Расшифровка.
1) Статистический машинный перевод. Кодирование нот
N-граммная языковая модель
2) Продукционная модель
3) Смешанная модель (N-граммы + правила
продукционной модели)
2.Исследование знаменных песнопений
1) Представление песнопений в формате XML
2) Разработка формата, позволяющего учитывать
«перекрытия» структур (одно знамя может входить в
несколько попевок)
Кодирование знамен
Всего закодировано 202 знамени
5. Ввод песнопений в БД в программе IPSM
5
С помощью веб-приложения
· Для ввода нот предусмотрены специальные подсказки
· Текущая страница для ввода отображается на экране
· Сохранение дополнительной информации о песнопении (название, страница)
Загрузка XML-Файла
· Добавление песнопений, набранных в MS Word
· Специальный формат XML-файла
Кодирование знамен
· Выделено 202 знамени
· Знамена разделены на 6 групп (максимум 7 подгрупп)
· От 10 до 66 знамен в группе
В результате БД содержит:
· 29376 записей из «Круга…»
· 234 записи приложения к «Кругу..»
· 10897 записей двоезнаменника
· 16914 записей сборника попевок
6. Статистическая модель (1) 6
Статистический машинный перевод
Модель языка
Модель языка (Language Model/LM) – это набор n-грамм моноязычного корпуса с их вероятностными характеристиками.
Методы сглаживания вероятностных параметров языковых моделей (для редких n-грамм)
1) Метод Лапласа 2) Адаптивный метод 3) Откат (backoff)
Модель языка со сглаживанием Модель языка
7. Статистическая модель (2)
7
Построение модели перевода
Модель перевода
количество раз, когда
где C(n,z) - последовательность знамен z
переводится нотами n
Алгоритм декодирования
где z – триграмма знамен, n – перевод триграммы (ноты), p(z|n) —
условная вероятность того, что переводу n соответствовал
исходный фрагмент z
Пример перевода
Пример крюковой рукописи Выделенные триграммы
Использованные правила модели перевода Выбор лучшего варианта перевода
Итоговый вариант перевода
8. Музыкальный редактор
8
Вывод песнопения в крюковой нотации
Пример азбуки в xml-формате
Пример песнопений в xml-формате
Вывод песнопения в нотолинейной нотации Функции:
1. Вывод на экран исходного файла в
крюковой нотации и перекодированного
файла в линейной нотации, просмотра
исходных песнопений и азбук
2. Перевод песнопения из крюковой
нотации в линейную, формирование кода,
который используется компонентом
вывода для отображения полученного
результата
3. Проигрывание мелодии
Новые требования:
1. Возможность остановить, поставить на
паузу проигрываемую мелодию.
2. Подсветка проигрываемого знамени и
ноты
3. Возможность редактирования словаря
и перевода песнопения
4. Интерфейс для эксперта, который
позволяет понимать какое правило было
применено и почему.
9. Сборник попевок
9
Описание структуры песнопения XML
Древнерусскую музыкальную рукопись можно описать с <xsl:key name='popevka-search'
помощью теории множеств следующим образом: match="popevka" use="@name"/>
В={P}, где P={G}, G={C}, C={S}, S={p,Z}, <xsl:for-each select="key('popevka-search',
Z={<T,k,w>}, T=[t1,t2,…,t3] 'popevka-name')">
Где B – рукопись, P – часть, G – глас, C – раздел, </xsl:for-each>
S – песнопение, p – попевка, Z – знамя, t – помета, k – код,
w – слог.
Знамена
Знамена сборника попевок
Сборник попевок
Словарь с правилами перевода
Двознаменник «Ирмологий»
«Сборник Соловецкого собрания»
Перевод рукописи с помощью словаря
«Круг древнего знаменного пения»
10. Статистика по знаменам и нотам
10
Знаменный частотный словарь
Наиболее частотные комбинации Группировка по знаменам
11. Алгоритмы
Алгоритм группировки знамен
11
Алгоритм вывода знамени на экран
Начало Выбрать все символы из
базы
Определить букву и
стиль
Разделить знамена
на 6 групп
Отобразить буквы
шрифтом Andrew Semio
Все группы Да
Курсивный стиль? просмотрели ? Нет
Да Да
Нет
Отобразить букву
курсивным шрифтом Записать первый символ
Жирный стиль? Записать деревья групп в
Да
итоговый массив
Нет
Отобразить букву
жирным шрифтом
Конец
Конец Все дочерние узлы
просмотрели ?
Нет
Построить дерево для
дочерней вершины
Алгоритм перевода крюковой рукописи с помощью
продукционного словаря
Алгоритм ввода рукописей в БД
Считать символы
рукописи
Авторизация в системе
Все знамена
Да
перевели?
Нет Выбрать рукопись
Конец
Все правила словаря
Нет применили? Да
Выбрать страницу
Все правила
Применить правило азбуки
Нет
применили? Ввести знамена
Да
Применить правило
Ввести доп. информацию
Конец о знамени
Сохранить
12. Алгоритм декодирования знаменных
песнопений
12
Начало
Создать таблицу для
перевода Проигрывание динамически составленной музыкальной
последовательности
Разбить рукопись
на N-граммы Запись в файл vars.txt нотного кода
(триграммы)
Все знамена
Да Конец Запись в файл vrem.txt временного кода
переведены?
Нет
Найти первое Считывание нотного и временного кода
непереведенное знамя
Определить все N-
граммы, в которые
входит текущее знамя
Все N-граммы да все звуки проиграли?
обработали?
нет
Нет
Определить
Конец
вероятность N-граммы в
соответствии с моделью
Да перевода
Получение кода знамени
Выбрать максимальную
вероятность
Записать перевод
знамен в таблицу
перевода
13. Экранные формы 13
Страница сайта проекта «Компьютерная семиография» - «Песнопения»
Страница сайта проекта «Компьютерная семиография» - «Сервисы»
Страница сайта проекта «Компьютерная семиография» - «Двоезнаменник»