Estimación del pitch en señales monofónicas de voz cantada - Presentation Transcript
Estimación del pitch en señales monofónicas de voz cantada Andrés Eduardo Coca Salazar Departamento de Música Universidad de Caldas Grupo de control y procesamiento digital de señales Universidad Nacional de Colombia Sede Manizales
Introducción
Algoritmos para la estimación del pitch
Marco experimental
Resultados
Conclusiones
Contenido
Planteamiento del problema
La estimación del pitch para señales de voz cantada requieren de
un tratamiento diferente al utilizado en la estimación para señales
de voz hablada.
Los algoritmos existentes para la estimación del pitch para señales
de voz cantada se deben adecuar.
Se deben crear algoritmos nuevos especiales para este tipo de
señales.
Diferencias entre la voz cantada y la voz hablada Canto Habla Control del pitch Pitch es involuntario 2 octavas Menos de una Octava Oscila en una frecuencia media Intervalos musicales Intensidad: 40-60dB Intensidad: hasta 120dB Planteamiento del problema
Algoritmos para la estimación del pitch
La vibración de las cuerdas vocales no necesariamente es periódica
Las transiciones de sonoridad
Ruidos acústicos de fondo
Errores típicos de la estimación
Doble-pitch: La frecuencia es el doble de la esperada. Errores de octava.
Medios-pitch: La frecuencia es la mitad de la esperada.
Factores que dificultan la extracción Tipos de estimación TIEMPO Forma de onda FAC Cepstral FRECUENCIA FFT MIXTA WT
Separación y acumulación armónica (SAA)
Especial para aplicaciones musicales
Nombre de la nota musical y su numero de octava.
Se basa en la serie armónica. Análisis de Fourier de señales periódicas.
Escala de los armónicos
Apropiado: Instrumentos de teclado y algunos de viento.
No apropiados: Las voces y los instrumentos de cuerda.
Frecuencias microtonalístas
Algoritmos para la estimación del pitch
Etapas del algoritmo SAA Etapa para hallar el nombre de la nota a Algoritmos para la estimación del pitch Se usa la escala cromática
Etapa para el valor de frecuencia a = # semitonos b = # de octava Etapa para hallar el número de octava b Algoritmos para la estimación del pitch Algoritmo SAA
12 señales musicales 6 octavas Creación de las señales musicales para SAA Energía más significativa Algoritmos para la estimación del pitch Algoritmo SAA
Se busca que posición ocupa el valor más significativo en la escala de los armónicos.
Primeros nueve armónicos de la serie sin repetir los que son iguales.
Acordes Tónica: 5ªJusta: 3ªM : 7ªm: Búsqueda en la escala de los armónicos Algoritmos para la estimación del pitch Algoritmo SAA
Máxima verosimilitud (ML) Se busca en un conjunto de espectros ideales predefinidos el que mayor similitud tenga con el espectro de la trama de análisis. Gran similitud Si el error de la diferencia es mínima Cuando el producto es máximo Algoritmos para la estimación del pitch
Representación gráfica Diagrama en bloques MIDI Nota Máxima verosimilitud (ML) Algoritmos para la estimación del pitch
Algoritmo ML Creación de las señales musicales de prueba Definir sistema de afinación usado Microtonalísmos Algoritmos para la estimación del pitch Nombre de la nota Únicamente
Crear los valores de frecuencia Crear señales musicales Corrección Hallar número de octavas Hallar el número de notas Algoritmo ML Creación de las señales musicales de prueba Algoritmos para la estimación del pitch
Marco experimental
Características de las muestras Representación en el pentagrama Tabla con los registros musicales Marco experimental D 4 F 2 Bajo F 4 A 2 Barítono Masculino A 4 C 3 Tenor E 5 G 3 Contralto G 5 B 3 Mezzo-soprano A 5 C 4 Soprano Femenino N sup N inf Registro Género
Resultados
Resultados Resultados en el dominio del tiempo Separación y acumulación armónica (SAA) Nombre nota y Nº Octava C3 = 130,81 Hz Tenor
Resultados en el dominio de la frecuencia Resultados Máxima verosimilitud (ML) A3 = 220 Hz Tenor
Resultados con señales de voz cantada Primera frase del Introito del Réquiem en D menor K.626 de Mozart, sección de la contralto. Tabla con las frecuencias Algoritmo ML Resultados 246,94 369,99 349,23 220 329,63 233,08 261,62 277,18 293,66 B ♮ 3 F ♯ 4 F4 A3 E4 B ♭ 3 C ♮ 4 C 4 D4
Test de Kolmogorov-Smirnov Ho = igual distribución de probabilidad Referencia Escala cromática Análisis estadístico Resultados Funciones de distribución acumulativa No Rechaza No Rechaza ML Rechaza Rechaza SAA = 0.01 = 0.05 Método
Prueba de hipótesis t - student SNR = 20 dB Resultados Prueba de inmunidad ante el ruido de fondo No rechaza No rechaza SAA No rechaza No rechaza ML = 0.01 = 0.05 Método
CONCLUSIONES
Los algoritmos ML y SAA, requieren de una afinación exacta de las señales musicales de entrada.
El algoritmo SAA es muy sensible a los errores de octava, y presenta errores esporádicos en el resultado del nombre de la nota, se mejora aplicando la moda del vector.
0 comments
Post a comment