Estimación del pitch en señales monofónicas de voz cantada
1. Estimación del pitch en señales monofónicas de voz cantada Andrés Eduardo Coca Salazar Departamento de Música Universidad de Caldas Grupo de control y procesamiento digital de señales Universidad Nacional de Colombia Sede Manizales
2.
3.
4. Diferencias entre la voz cantada y la voz hablada Canto Habla Control del pitch Pitch es involuntario 2 octavas Menos de una Octava Oscila en una frecuencia media Intervalos musicales Intensidad: 40-60dB Intensidad: hasta 120dB Planteamiento del problema
5.
6.
7. Etapas del algoritmo SAA Etapa para hallar el nombre de la nota a Algoritmos para la estimación del pitch Se usa la escala cromática
8. Etapa para el valor de frecuencia a = # semitonos b = # de octava Etapa para hallar el número de octava b Algoritmos para la estimación del pitch Algoritmo SAA
9. 12 señales musicales 6 octavas Creación de las señales musicales para SAA Energía más significativa Algoritmos para la estimación del pitch Algoritmo SAA
10.
11. Máxima verosimilitud (ML) Se busca en un conjunto de espectros ideales predefinidos el que mayor similitud tenga con el espectro de la trama de análisis. Gran similitud Si el error de la diferencia es mínima Cuando el producto es máximo Algoritmos para la estimación del pitch
13. Algoritmo ML Creación de las señales musicales de prueba Definir sistema de afinación usado Microtonalísmos Algoritmos para la estimación del pitch Nombre de la nota Únicamente
14. Crear los valores de frecuencia Crear señales musicales Corrección Hallar número de octavas Hallar el número de notas Algoritmo ML Creación de las señales musicales de prueba Algoritmos para la estimación del pitch
16. Características de las muestras Representación en el pentagrama Tabla con los registros musicales Marco experimental D 4 F 2 Bajo F 4 A 2 Barítono Masculino A 4 C 3 Tenor E 5 G 3 Contralto G 5 B 3 Mezzo-soprano A 5 C 4 Soprano Femenino N sup N inf Registro Género
18. Resultados Resultados en el dominio del tiempo Separación y acumulación armónica (SAA) Nombre nota y Nº Octava C3 = 130,81 Hz Tenor
19. Resultados en el dominio de la frecuencia Resultados Máxima verosimilitud (ML) A3 = 220 Hz Tenor
20. Resultados con señales de voz cantada Primera frase del Introito del Réquiem en D menor K.626 de Mozart, sección de la contralto. Tabla con las frecuencias Algoritmo ML Resultados 246,94 369,99 349,23 220 329,63 233,08 261,62 277,18 293,66 B ♮ 3 F ♯ 4 F4 A3 E4 B ♭ 3 C ♮ 4 C 4 D4
21. Test de Kolmogorov-Smirnov Ho = igual distribución de probabilidad Referencia Escala cromática Análisis estadístico Resultados Funciones de distribución acumulativa No Rechaza No Rechaza ML Rechaza Rechaza SAA = 0.01 = 0.05 Método
22. Prueba de hipótesis t - student SNR = 20 dB Resultados Prueba de inmunidad ante el ruido de fondo No rechaza No rechaza SAA No rechaza No rechaza ML = 0.01 = 0.05 Método