• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
 

SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren

on

  • 491 views

 

Statistics

Views

Total Views
491
Views on SlideShare
230
Embed Views
261

Actions

Likes
0
Downloads
0
Comments
0

1 Embed 261

http://www.hki.uni-koeln.de 261

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren Presentation Transcript

    • Universität zu Köln. Historisch-Kulturwissenschaftliche InformationsverarbeitungJan G. Wieners // jan.wieners@uni-koeln.deBasisinformationstechnologie IISommersemester 201319. Juni 2013 – Audio / Video: Kompressionsverfahren
    • Video Container Matroska MP4 Codecs DivX Xvid H.264 Verfahren der Videokompression Intra-coding Vektorquantisierung Konturbasierte Codierung Inter-coding Differenzcodierung BewegungskompensationAudio Sampling KompressionThemenüberblick
    • VideoContainer und Codecs
    • Bildnachweis: „Kill Bill“ (2003)
    • Bildnachweis: „Kill Bill“ (2003)Bitraten (37 sec.):◦ 1 Mbps (~5 MB)◦ 500 Kbps (~3 MB)◦ 100 Kbps (~1,6 MB)Konstante Bitrate (CBR)vs.Variable Bitrate (VBR)
    •  ~25 Bilder pro Sekunde  25 fps (frames per second) Auflösung Farbtiefe (Quantisierung) z.B. 24 Bit pro Pixel Rechenexempel unkomprimiertes Video: 720 * 576 * 24 = 9.953.280 Bit pro Frame = ~1,2 MB / Frame(9.953.280 / 8 / 1024) 1,2 MB * 25 Frames = 30 MB/ sec. 30 MB * 60 sec. = 1.800 MB / min. 1,8 GB * 60 min. = 108 GB / std.Speicherplatzbedarf von Videomaterial
    • DVD & Co.Quelle: http://www.bluray-disc.de/faq/was-ist-der-unterschied-zwischen-blu-ray-und-der-dvd
    • ContainerCodecs  Von den Begriffen Compressor und Decompressor• Codecs: Mathematische Algorithmen, mit deren Hilfe Video- und Audiodaten reduziert werden.• Hardware-Codecs: Hardwarebausteine, die die Kompression in Echtzeit durchführen.• Software-Codecs
    • MKV: Matroska Media Containerhttp://matroska.org/technical/whatis/index.html
    • Matroska Media ContainerMatroska• Unterstützt Videocodecs:• MPEG-1, MPEG-2, MPEG-4• H.264• RealVideo, WMV, Theora, Dirac• …• Unterstützt Audiocodecs:• MP3• AAC, AC3, DTS, WAV, Vorbis, FLAC
    • Container: mp4Mp4 Von der Moving Picture Expert Group (MPEG) (gegründet 1988) beschränkt auffolgende Formate: Video: MPEG-4 (Part 2, Part 10 (AVC/H.264)), MPEG-2 und MPEG-1 Audio: AAC, MP3, MP2, MP1, AC-3 Bilder: JPEG, PNG Grafik und Text: BIFS (z. B. können Untertitel in dieses Formatumgewandelt werden) Dateiendungen: .m4v, .mp4v: Video (MPEG-4-Videoströme) .m4a: nur für Audio .m4b: (Audiobook): Hörbücher, in die Lesezeichen gesetzt werden können .m4p: (Protected): DRM-geschützte AAC-Audiodateien .m4r: (Ringtone): Klingeltöne für iPhone
    • MPEG: Standards
    • Codec: DivXDivX <= DivX ;-) 3.11 (1999): Veränderter MS MPEG 4 Codec: u.a.: Erhöhung der maximalen Bitrate MS MPEG 4: 256 kbps DivX: bis 6 mbps Erzeugt kein ISO-konformes MPEG 4 Video > DivX ;-) 3.11: Neuentwicklung, patentierter Codec Unterstützt u.a.: Multipass Encoding (variable Bitrate) Komplexe Szenen erhalten eine höhere Bitrate zugewiesen, langsame Szenen eineniedrigere Bitrate 2000: Gründung der Firma DivXNetworks  Open Source Projekt OpenDivX, basierend auf der MPEG-4 Referenzimplementierung des EU-Projektes „MoMuSys“ (Mobile Multimedia Systems) Nach Veröffentlichung von DivX 4.0 (August 2001): Fokus auf kommerzielle Interessen, dieEntwicklungsarbeiten an OpenDivX werden eingestellt Kodiereffizienz schlechter als bei DivX ;-) DivX 5: Erstes kommerzielles Produkt …DivX 9.1.2 (2013-05)Linktipp: http://www.heise.de/ct/artikel/DivX-im-Griff-288448.html
    • Coded: XvidXvid Freie MPEG-4 Implementierung (GNU GeneralPublic License), basierend auf OpenDivXQuelltext Techniken: B-Frames Quarter Pixel Compensation …
    • Codec: H.264H.264• 2003 als Standard verabschiedet: MPEG-4 Part 10oder auch AVC (Advanced Video Coding) Zehnter Teil des MPEG-4 Standards (MPEG-4/Part 10, ISO/IEC 14496-10)• Datei-/Containerformat: mp4• Verwendung:• HDTV / Blu-Ray• Freier, quelloffener Encoder: x264(http://www.videolan.org/developers/x264.html)
    • H.264Variable block-size motion compensation (VBSMC) with block sizes as large as 16×16 aas small as 4×4, enabling precise segmentation of moving regions.
    • Videokompression: Möglichkeiten in der Beseitigung von RedundanzenVideokompression???
    • Wie ließe sich diese Videosequenz komprimieren?http://skateboarding.ru/gallery/data/media/81/sequence_mini.jpg
    • Videokompression: Möglichkeiten in der Beseitigung von RedundanzenVideokompressionBild- bzw. Framedimensionen (Höhe und Breite)- Eigenschaften der Pixel (Helligkeit, Farbe)- Eigenschaften des jeweils betrachteten FramesZeitliche Dimension
    • Welche der beiden Videosequenzen lässt sich besser /stärker komprimieren? Warum?http://skateboarding.ru/gallery/data/media/81/sequence_mini.jpg / http://mamboaustralia.com/isfucked/wp-content/uploads/2011/05/CHEADLE_CULBURRA_SEQUENCE1.jpg
    • Unterscheidung: Intra-coding (auch: spatial coding): Redundanz auseinem Frame entfernen (räumliche Redundanz),Kompression teilweise analog zu JPEG Vektorquantisierung Konturbasierte Codierungvs. Inter-coding (auch: temporal coding): Redundanzzwischen Frames entfernen (temporale Redundanz) Differenzkodierung (frame differencing) BewegungskompensationVideokompression
    • Idee und Verfahrensweise: Aufteilung des Frames in Blöcke (4x4, 8x8, etc.) Suche nach ähnlichen Blöcken Ähnliche Blöcke im Bild ersetzen durch „Durchschnittsblock“ Zwei Schritte: Training: Erstellung der Tabelle (Codebuch) mit häufig vorkommenden Blöcken Häufig verwendet: Linde–Buzo–Gray Algorithmus Berücksichtigung der Ähnlichkeit der notierten Blöcke Dekoder muss über das gleiche Codebuch verfügenVorteile: Schnelle Decodierung Gute Kompression bei vielen ähnlichen BlöckenNachteile: Codierung aufwändig, da ähnliche Blöcke gesucht werden müssenPraxis: Verwendung in Codecs: Indeo, CinepakIntra-Coding: Vektorquantisierung
    • Idee und Verfahrensweise: Trennung in Textur und Kontur Konturen beschreiben (z.B.) durch Bézier-Kurven Texturen kodieren (z.B. mit DCT)Praxis: Verwendung ansatzweise in MPEG-4Knackpunkt: ObjekterkennungIntra-Coding: Konturbasierte Codierung
    • Inter-coding
    • Bildnachweis: http://www.ipway.rs/h264/Doc/wp_h264_31669_en_0803_lo.pdft = 1 t = 2 t = 3…Kompression…?
    • t = 1Frame vollständig gespeichert I-Framet = 2Aus dem vorhergehendenFrame berechnetes Frame P-Frame…Kompression!t = 3Aus dem vorhergehendenFrame berechnetes Frame P-FrameBildnachweis: http://www.ipway.rs/h264/Doc/wp_h264_31669_en_0803_lo.pdf
    • Speichern der Differenzen zwischen Start- undFolgeframe, z.B. pixelweiseDifferenzcodierungBildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 180.
    • Intra- vs. Predicted- vs. Bidirectional Frames: Das Intra-Frame (I-Frame, auch: Key Frame / Schlüsselbild)wird nur unter Berücksichtigung der eigenen Bildinformationkodiert Predicted Frames (P-Frames) werden aus denvorhergehenden I-Frames berechnet. Bidirectional Frames beziehen sich sowohl auf die vorhergehenden I- und P-Framesals auch auf die folgenden I- und P-Frames.Praxis MPEG-1 / -2: Ein I-Frame pro ½ Sek. MPEG-4: Ein I-Frame ~ alle 10 Sek.Unterscheidung I: Frame-Typen (in MPEG)
    • Verfahrensweise Startframe und spätere I-Frames intracodiertübertragen Unterschiede zum Folgeframe bestimmen, als Bildinterpretieren und dieses Bild komprimierenDifferenzcodierungBildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 180.
    • Verfahrensweise: Objektbewegungen zwischen Frames identifizieren Speicherung der Veränderungen als Bewegungsvektoren(motion vector) Zu übertragen: Differenzbild BewegungsvektorenBewegungskompensation (Motion Compensation)Bildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 182.
    • Blockbasierte Bewegungskompensation Verwendung u.a. im MPEG-2 StandardGrob: Jedes Frame des Videomaterials wird in n*m großePixelblöcke unterteilt Um die Bewegungskompensation zu leisten, werdendie Pixelblöcke von Frame zu Frame miteinanderverglichen Ähneln sich die Pixelblöcke (z.B. Kreuzkorrelation), sowird nur der Verschiebungsvektor gespeichert, umden sich der Block verschiebtBewegungskompensation
    • Video Container Matroska MP4 Codecs DivX Xvid H.264 Verfahren der Videokompression Intra-coding Vektorquantisierung Konturbasierte Codierung Interframe-coding Differenzcodierung BewegungskompensationThemenüberblick
    • Audiokompression
    • Hörbeispiel
    • Akustische Signale = zumeist periodische SignaleAudio: Basics AmplitudeMaximalwert eines Signalsinnerhalb einer Phase SchwingungsdauerZeit, bis eine Schwingungwieder ihrenAusgangszustand erreicht WellenlängeFrequenz, ausgedrückt inHertz (Hz, 1Hz = 1Schwingung pro Sekunde)AmplitudeSchwingungsdauer
    • Von analog nach digital:Sampling  Digitalisierung vonAudiodatenGrundfragen Sampling:1. Wahl der geeignetenAbtastrate (Sampling Rate)2. Wahl der geeignetenAuflösungEine Problemstellung: Sampling
    • Je häufiger die Schallwelle auf ihren Druckabgetastet wird, desto besser wird der originaleTon digital repräsentiert.Zu wenige Abtastpunkte führen zu geradenLinien, zu langen Wellen oder zu gezacktenKurven.Abtastrate (Sampling Rate)
    • Wahl der Abtastrate auf Basis des Nyquist-Shannon-Abtasttheorems. „Wenn ein kontinuierliches Signal miteiner oberen Grenzfrequenz von fmax mit einerAbtastrate von mehr als 2*fmax abgetastet wird, kannman das Ursprungssignal ohne Informationsverlust ausdem abgetasteten Signal rekonstruieren.“(Malaka, Butz, Hußmann: Medieninformatik. München: Pearson, 2009, S. 63.)Das Abtasttheorem und die Praxis: Da menschlicheOhren Schallwellen von maximal 22.000 Hz (= 22 kHz)wahrnehmen können, liegt die erforderliche Nyquist-Rate bei 44.000 Hz. Qualitativ hochwertige Audio-Digitalisate haben darum eineAbtastrate von 44.100 Hz.Shannon-Nyquist
    • Bekanntestes (und einfachstes) Abtastverfahren:PCM (Pulse Code Modulation)  Für jedenAbtastzeitpunkt: Messung eines SignalwertesBekannte Audio-Formate, die PCM verwenden:WAV, AIFFPulse Code Modulation
    • Quantisierung: Abtasttiefe
    • Wie groß ist der Speicherplatzbedarf (unkomprimiert) einerklassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit60-minütiger Laufzeit?Speicherplatzbedarf
    • Wie groß ist der Speicherplatzbedarf (unkomprimiert) einerklassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit60-minütiger Laufzeit?Lösung Das Audiosignal wird standardmäßig mit 44,1 KHz abgetastet. Die Abtasttiefe liegt bei 16 Bit. Daraus folgt:44,1kHz * 2 * 16bit * 60 min * 60 s = 635 MegabyteSpeicherplatzbedarf
    • HörschwellenmaskierungSignale werden aus Frequenzspektrum entfernt,die jenseits der (menschlichen) HörschwelleliegenFrequenzmaskierung Entfernung von Signalen, die von Signalen miteiner anderen Frequenz übertönt werdenKompression: Psychoakkustische AspekteBildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:24h_wecker.jpg&filetimestamp=20090809180759
    • Temporale Maskierung Auch zeitliche Abstände zwischen Tönen habeneinen Einfluss auf die Hörbarkeit: Geht einem starken Ton A ein schwächerer Ton B inähnlicher oder gleicher Frequenz voraus oder folgt ihm,so gibt es zeitliche Abstände von bestimmter Dauer, indenen Ton B nicht zu hören ist.Kompression: Psychoakkustische AspekteBildnachweis: http://www.itwissen.info/definition/lexikon/Maskierung-masking.html
    • /
    • Aufgabe 1 (1 Punkt)Welche Arten von Redundanz werden bei der Videokompression beseitigt? ErläuternSie in diesem Kontext die Begriffe Intra- und Inter-Coding und beschreiben Sie diegrundlegende Funktionsweise des Verfahrens „Motion Compensation“.Aufgabe 2 (1 Punkt)Beschreiben Sie die Vorgehensweise bei der Digitalisierung von Audiosignalen.Beschreiben Sie in diesem Zusammenhang die folgenden Begriffe: Abtastrate (Sampling Rate) PCM Abtasttiefe (Quantisierung)Aufgabe 3 (1 Punkt)Welche Phänomene menschlicher Wahrnehmung (Stichwort: „Maskierung“) machtman sich bei der Audiodaten-kompression zunutze?Aufgabe 4 (1 Punkt)Informieren Sie sich im WWW über das mp3-Format. In welchem Zusammenhangsteht mp3 mit der Moving Picture Experts Group?Hausaufgaben