Principios de audio digital
Upcoming SlideShare
Loading in...5
×
 

Principios de audio digital

on

  • 265 views

Principios básicos de audio digital

Principios básicos de audio digital

Statistics

Views

Total Views
265
Views on SlideShare
265
Embed Views
0

Actions

Likes
0
Downloads
7
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

CC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Principios de audio digital Principios de audio digital Presentation Transcript

  • Principios de audio digital Enrique Alexandre (@e_alexandre)
  • Conversión analógico/digital
  • Conversión analógico/digital tiempo
  • Conversión analógico/digital tiempo
  • Conversión analógico/digital Muestreo (muestras/s = Hz) tiempo
  • Conversión analógico/digital Muestreo (muestras/s = Hz) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 muestras
  • Conversión analógico/digital Cuantificación (bits/muestra) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 muestras
  • Conversión analógico/digital Cuantificación (bits/muestra) 11 10 01 00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 muestras
  • Conversión analógico/digital Cuantificación (bits/muestra) 11 10 01 00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 muestras
  • Variación de la frecuencia de muestreo • Fichero original (44100 Hz, “calidad CD”) • Remuestreado a 22050 Hz • Remuestreado a 16000 Hz • Remuestreado a 8000 Hz • Remuestreado a 6000 Hz
  • Ejemplo de variación del número de bits por muestra •Fichero original (16 bits por muestra) •8 bits por muestra •7 bits por muestra •6 bits por muestra •5 bits por muestra •4 bits por muestra
  • Codificación de audio
  • ¿Con o sin pérdidas? • Codificadores con pérdidas (mp3, aac, wma, etc.): • Utilizan modelos perceptuales para eliminar la información irrelevante. • Es imposible reconstruir exactamente la señal original a partir de la codificada. • Codificadores sin pérdidas (.flac, .alac, .ape, etc.): • Se limitan a eliminar la información redundante. • Se puede reconstruir de forma exacta la señal original a partir de la codificada.
  • ATC ATC-ABS ATAC 1977 OCF MUSICAM PXFM ASPEC 1992 Layer I, Layer II Layer III 1994 ATRAC PASC AC-3 PAC TWIN-VQ ASC 1995 MPEG-2 AAC 1997 MPEG-4 AUDIO 1999
  • ISO/IEC MPEG-1 • Estándar “semi-abierto”: • Partes normativas e informativas. • Uno o dos canales: • Un solo canal monofónico • Dos canales monofónicos independientes • Dos canales stereo • Joint-stereo • Frecuencias de muestreo: 32 kHz (broadcast), 44.1 kHz (consumer) y 48 kHz (professional). • Bitrates: 32-192 kbps (mono) y 64-384 kbps (stereo).
  • ISO/IEC MPEG-1 • Tres capas independientes con distintas complejidades: • Capa I: • Proporciona transparencia a 384 kbps. • Complejidad media-baja. • Aplicaciones: Philips Digital Compact Cassette (DCC). • Capa II: • Proporciona transparencia a 256 kbps. • Complejidad media. • Aplicaciones: DAB, DVB, radiodifusión
  • ISO/IEC MPEG-1 • Capa III (mp3) • Proporciona transparencia a 192 kbps. • Complejidad alta. • Aplicaciones: ISDN (RDSI), Internet.
  • Nuevas variantes • mp3PRO • Proporciona el doble de rendimiento que el mp3 • Compatible hacia atrás con mp3 • mp3HD • Codificador sin pérdidas compatible hacia atrás con mp3
  • mp3: Licencias
  • Codificación estéreo • Objetivo: aprovechar las posibles redundancias (parecido) entre los dos canales de audio. • Herramientas disponibles en el modo Joint Stereo: • Mid/Side Stereo (M/S): Se transmite suma y diferencia en lugar de los canales originales. • Intensity Stereo: Se transmite la energía y la panorámica. Funciona a altas frecuencias (>3kHz).
  • ISO/IEC MPEG-2 BC • Ampliación compatible hacia atrás con MPEG-1. • Características añadidas: • Frecuencias de muestreo mitad (24, 22.05 y 16 kHz) para aplicaciones con menor ancho de banda. • Codificación multicanal (5.1). • Existe un MPEG-2.5, formato propietario del Fraunhofer, que permite frecuencias de muestreo inferiores (8, 11.025 y 12 kHz).
  • ISO/IEC MPEG-2 NBC / AAC • Nuevo esquema, no compatible con los anteriores, que proporciona mejor rendimiento de codificación. • Tres modos de operación: • LC (Low Complexity) • Main Profile • SSR (Scalable Sampling Rate) • Proporciona transparencia a 128 kbps (stereo) y 320 kbps (5.1) • Aplicaciones comerciales: • Apple iTunes, Sony PSP, Operadoras móviles (Movistar, Orange, etc,), DRM (Digital Radio Mondiale), DVB, etc.
  • Variante: HE-AAC ó aacPlus • La misma idea que el mp3PRO • Buena calidad de sonido estéreo a 48 kbps
  • ISO/IEC MPEG-4 • No es un nuevo esquema de codificación en sí, sino un conjunto de codificadores ya existentes unificados bajo un mismo estándar. • Un fichero MPEG-4 puede contener audio, video, audio sintético, etc. • Extensiones .mp4, .m4a y .3gp
  • Otros codificadores Ogg Vorbis Musepack Otros ! !
  • Ogg Vorbis • Codificador de audio libre • Proporciona una calidad muy parecida a un MPEG-2 AAC • Soporta frecuencias de muestreo desde 8kHz hasta 192 kHz • Soporta desde 1 canal hasta 255
  • Musepack • Codec basado en MPEG-1 Capa II • Pensado para proporcionar muy alta calidad de audio a tasas binarias elevadas • Extensión: .mpc
  • Otros codecs propietarios • Windows Media Audio (WMA) • Free Lossless Audio Codec (FLAC) • RealAudio
  • Resumen: codificadores con pérdidas Formato Año Gratis Bitrate Canales Latencia mp3 1993 No 8-320 kbps 2 > 100ms AAC 1997 No 8-529 kbps 48 20-405ms AC-3 1992 No 32-640kbps 6 40.6 ms Musepack 1997 Si 3-1300 kbps 8 ? Vorbis 2000 Si Variable 255 > 100ms WMA 1999 Si (Windows) 8-768 kbps 2 > 100ms
  • Resumen: codificadores sin pérdidas Formato Velocidad Compresión Híbrido (c/ pérdidas) Código abierto Multicanal Wavpack Muy rápido 58% Si Sí Sí ALAC Rápido 58.5% No Sí (decod) Sí FLAC Muy rápido 58.7% No Sí Sí Monkey’s Rápido 55.5% No Sí Sí
  • Diccionario de extensiones • Formatos estándar • .aif: AIFF, Audio Interchange File Format • .wav: Waveform Audio • . bwf: Broadcast wave (extensión al .wav) • .raw: Raw audio file (Como un .wav pero sin cabecera)
  • Diccionario de extensiones • Codificadores con pérdidas: • .mp3: MPEG-1 Capa III • .mp4: MPEG-4 (audio y/o video) • .m4a: MPEG-4 audio • .m4p: Ficheros del iTunes con DRM • .m4v, .mp4v, .cmp, .divx, .xvid: MPEG-4 Video • .3gp, .3g2: MPEG-4 en móviles • .wma: Windows Media Audio • .ogg: Ogg Vorbis
  • Diccionario de extensiones • Codificadores sin pérdidas • .flac: FLAC, Free Lossless Audio Coder • .m4a: Apple Lossless audio coder
  • Aplicaciones
  • Palabras clave • Esteganografía: Ocultar la información • Criptografía: Proteger el contenido de los mensajes • Watermarking: Proteger la información oculta.
  • Criptografía • El objetivo es proteger el contenido de un mensaje, haciéndolo ilegible para todo el mundo excepto emisor y receptor. • Métodos: • Clave simétrica • Clave pública • La clave pública se utiliza para el encriptado • La privada para el desencriptado • La criptografía es la base de los sistemas DRM (Digital Rights Management) ! !
  • Limitaciones • El “agujero analógico” • Obsolescencia. ¿Qué pasa cuando la tecnología cambia? • ¿Es legal grabar un CD con música? • No toda la piratería es indeseada (p.e. Microsoft) • El DRM puede aumentar la piratería
  • Watermarking • Son técnicas que persiguen introducir información en una señal digital • Se puede marcar un fichero para luego poder rastrearlo • Dos tipos: • Visible • Invisible
  • Tipos de sistemas • Ciegos: La señal original no es necesaria para la detección final. • No ciegos: Se necesita la señal original para poder detectar la marca • Frágiles: Son sensibles a modificaciones sobre la señal que lleva la marca. Se usan para detectar cambios en la señal (autenticidad) • Robustos: Son muy resistentes a modificaciones. Se usan para protección de copias o control del copyright.
  • Esteganografía • El objetivo es ocultar información de modo que nadie pueda ser capaz de saber que existe un “mensaje oculto”. Es una aplicación del watermarking. • Técnicas típicas: • Ocultar mensajes en los bits menos significativos de una imagen ruidosa • Tinta invisible • Cifrado nulo: News Eight Weather: Tonight increasing snow. Unexpected precipitation smothers eastern towns. Be extremely cautious and use snowtires especially heading east. The [highway is not] knowingly slippery. Highway evacuation is suspected. Police report emergency situations in downtown ending near Tuesday Newt is upset because he thinks he is President
  • Si eliminamos todos menos los 2 últimos bits de cada componente de color y aumentamos el brillo Ejemplo