Unidad2difus multimedia-100527113812-phpapp01 - copia

24 de ene de 2016
LPC LINEAR PREDICTIVE CODEC
INTEGRANTES
MARÍA FERNANDA MARQUEZ
ERNESTO NOBOA
JAIRO JÁCOME

Codificación predictiva lineal (LPC)
24 de ene de 2016
La idea fundamental del modelo LPC es representar a la señal de
voz como una función de excitación constituida por un tren de
pulsos cuasiperiódicos (para sonidos vocalizados) ouna fuente de
ruido aleatorio (para sonidos no vocalizados)

24 de ene de 2016
Características de la voz.
La voz humana se produce cuando el aire es forzado a
salir desde los pulmones, a través de las cuerdas vocales
y a lo largo del tracto vocal. Mientras esto sucede, las
cuerdas vocales vibran produciendo energía de audio
que se concentra en las frecuencias con que éstas
vibran.

24 de ene de 2016
 Ciertas frecuencias resuenan dentro del tracto
vocal, dependiendo estas frecuencias de la
forma y tamaño del tracto. La energía de estas
frecuencias es reforzada por las reflexiones de
las ondas, las cuales se suman entre sí,
mientras que la energía de las otras
frecuencias tiende a disiparse. A estas
reverberaciones de las cuerdas vocales se les
denomina resonancias o formantes.

24 de ene de 2016
 A medida que el tracto vocal varía, moviendo la
lengua, variando la forma de los labios, ó variando la
apertura de la boca, por ejemplo, las frecuencias de
los formantes son controladas.
 Basándose en el modo de excitación, la voz puede
categorizarse en tres clases: sonidos con voz (voiced
sounds) sonidos sin voz (unvoiced sounds) y sonidos
explosivos (plosive sounds).

24 de ene de 2016
 Los sonidos con voz
 En los sonidos sin voz
 Los sonidos explosivos
 Combinación de sonidos

24 de ene de 2016
 La codificación LPC (linear Predictive Coding)
basa su funcionamiento en el modelaje del
tracto vocal. El modelo asume que cada
muestra de voz representa una combinación
lineal de las muestras anteriores.

24 de ene de 2016
La codificación predictiva lineal o LPC es un tipo de codificador ampliamente
utilizado en audio digital.
En sistemas de procesado de voz, se usa partiendo de la idea de que la voz
puede modelarse como una combinación lineal de p muestras anteriores más
una señal de error.
Donde los coeficientes
se denominan coeficientes LPC (del inglés linear prediction coding).

24 de ene de 2016
 Para esto utiliza una ecuación en la que cada
muestra de voz se expresa como una
combinación lineal de las muestras anteriores.
 Los coeficientes de la ecuación (coeficientes
de predicción) caracterizan el tracto vocal y el
sistema requiere estimarlos
 Esta estimación se realiza minimizando el error
medio cuadrático entre la predicción de la
señal y la señal misma

24 de ene de 2016
 El tracto vocal es modelado como un tubo principal con
un generador de frecuencias al final del mismo. La
glotis (el espacio entre las cuerdas vocales) produce el
sonido del timbre, el cual es caracterizado por su
intensidad (loudness) y frecuencia (pitch). El tracto
vocal (la garganta y la boca) forma el tubo. A este tubo
principal se encuentran concatenados otros tubos
acústicos que, junto con el principal, caracterizan las
resonancias del tracto vocal

24 de ene de 2016
Generador
(Frecuencia
Amplitud)
Modelo de tracto vocal

24 de ene de 2016
 LPC analiza la señal de la voz estimando los
formantes (frecuencias de resonancia de las
cuerdas vocales) y calculando la intensidad y
la frecuencia de los mismos.
 El problema básico de un sistema LPC
consiste en determinar el modelo del tracto
vocal a partir de la señal de voz

24 de ene de 2016
 LPC divide la señal de voz en segmentos
temporales de alrededor de 20 mseg. (lo que
equivaldría a 160 muestras PCM).

24 de ene de 2016
 Hoy día se puede codificar la voz con LPC a
velocidades entre 2.4 y 4.8 Kbps con una señal de voz
reconstruida con una calidad razonable.
Desafortunadamente, ciertos sonidos no se pueden
reproducir fielmente con este método. La
representación del tracto vocal por una serie de tubos
acústicos concatenados no permite representar los
sonidos nasales, los cuales, requieren una
representación matemática mucho más compleja

24 de ene de 2016
 Adicionalmente, el modelaje del tracto vocal
también conlleva a que la señal reconstruida
difiera de la real, debido a las diferencias entre
el modelo y el tracto vocal real. La principal
ventaja de la utilización del LPC es su
capacidad de producir voz inteligible a muy
bajas velocidades (entre 2,4 y 4,8 Kbps).

24 de ene de 2016
 Sin embargo, al utilizar este tipo de
codificación generalmente se hace imposible
reconocer, a partir de la voz sintetizada, a la
persona que la origina. La razón de esto es
que las características del tracto vocal varían
enormemente de persona a persona, lo cual
hace el modelaje sumamente difícil.

Unidad2difus multimedia-100527113812-phpapp01 - copia

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (7)

Unidad2difus multimedia-100527113812-phpapp01 - copia