Your SlideShare is downloading. ×
0
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren

734

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
734
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
1
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Universität zu Köln. Historisch-Kulturwissenschaftliche InformationsverarbeitungJan G. Wieners // jan.wieners@uni-koeln.deBasisinformationstechnologie IISommersemester 201319. Juni 2013 – Audio / Video: Kompressionsverfahren
  • 2. Video Container Matroska MP4 Codecs DivX Xvid H.264 Verfahren der Videokompression Intra-coding Vektorquantisierung Konturbasierte Codierung Inter-coding Differenzcodierung BewegungskompensationAudio Sampling KompressionThemenüberblick
  • 3. VideoContainer und Codecs
  • 4. Bildnachweis: „Kill Bill“ (2003)
  • 5. Bildnachweis: „Kill Bill“ (2003)Bitraten (37 sec.):◦ 1 Mbps (~5 MB)◦ 500 Kbps (~3 MB)◦ 100 Kbps (~1,6 MB)Konstante Bitrate (CBR)vs.Variable Bitrate (VBR)
  • 6.  ~25 Bilder pro Sekunde  25 fps (frames per second) Auflösung Farbtiefe (Quantisierung) z.B. 24 Bit pro Pixel Rechenexempel unkomprimiertes Video: 720 * 576 * 24 = 9.953.280 Bit pro Frame = ~1,2 MB / Frame(9.953.280 / 8 / 1024) 1,2 MB * 25 Frames = 30 MB/ sec. 30 MB * 60 sec. = 1.800 MB / min. 1,8 GB * 60 min. = 108 GB / std.Speicherplatzbedarf von Videomaterial
  • 7. DVD & Co.Quelle: http://www.bluray-disc.de/faq/was-ist-der-unterschied-zwischen-blu-ray-und-der-dvd
  • 8. ContainerCodecs  Von den Begriffen Compressor und Decompressor• Codecs: Mathematische Algorithmen, mit deren Hilfe Video- und Audiodaten reduziert werden.• Hardware-Codecs: Hardwarebausteine, die die Kompression in Echtzeit durchführen.• Software-Codecs
  • 9. MKV: Matroska Media Containerhttp://matroska.org/technical/whatis/index.html
  • 10. Matroska Media ContainerMatroska• Unterstützt Videocodecs:• MPEG-1, MPEG-2, MPEG-4• H.264• RealVideo, WMV, Theora, Dirac• …• Unterstützt Audiocodecs:• MP3• AAC, AC3, DTS, WAV, Vorbis, FLAC
  • 11. Container: mp4Mp4 Von der Moving Picture Expert Group (MPEG) (gegründet 1988) beschränkt auffolgende Formate: Video: MPEG-4 (Part 2, Part 10 (AVC/H.264)), MPEG-2 und MPEG-1 Audio: AAC, MP3, MP2, MP1, AC-3 Bilder: JPEG, PNG Grafik und Text: BIFS (z. B. können Untertitel in dieses Formatumgewandelt werden) Dateiendungen: .m4v, .mp4v: Video (MPEG-4-Videoströme) .m4a: nur für Audio .m4b: (Audiobook): Hörbücher, in die Lesezeichen gesetzt werden können .m4p: (Protected): DRM-geschützte AAC-Audiodateien .m4r: (Ringtone): Klingeltöne für iPhone
  • 12. MPEG: Standards
  • 13. Codec: DivXDivX <= DivX ;-) 3.11 (1999): Veränderter MS MPEG 4 Codec: u.a.: Erhöhung der maximalen Bitrate MS MPEG 4: 256 kbps DivX: bis 6 mbps Erzeugt kein ISO-konformes MPEG 4 Video > DivX ;-) 3.11: Neuentwicklung, patentierter Codec Unterstützt u.a.: Multipass Encoding (variable Bitrate) Komplexe Szenen erhalten eine höhere Bitrate zugewiesen, langsame Szenen eineniedrigere Bitrate 2000: Gründung der Firma DivXNetworks  Open Source Projekt OpenDivX, basierend auf der MPEG-4 Referenzimplementierung des EU-Projektes „MoMuSys“ (Mobile Multimedia Systems) Nach Veröffentlichung von DivX 4.0 (August 2001): Fokus auf kommerzielle Interessen, dieEntwicklungsarbeiten an OpenDivX werden eingestellt Kodiereffizienz schlechter als bei DivX ;-) DivX 5: Erstes kommerzielles Produkt …DivX 9.1.2 (2013-05)Linktipp: http://www.heise.de/ct/artikel/DivX-im-Griff-288448.html
  • 14. Coded: XvidXvid Freie MPEG-4 Implementierung (GNU GeneralPublic License), basierend auf OpenDivXQuelltext Techniken: B-Frames Quarter Pixel Compensation …
  • 15. Codec: H.264H.264• 2003 als Standard verabschiedet: MPEG-4 Part 10oder auch AVC (Advanced Video Coding) Zehnter Teil des MPEG-4 Standards (MPEG-4/Part 10, ISO/IEC 14496-10)• Datei-/Containerformat: mp4• Verwendung:• HDTV / Blu-Ray• Freier, quelloffener Encoder: x264(http://www.videolan.org/developers/x264.html)
  • 16. H.264Variable block-size motion compensation (VBSMC) with block sizes as large as 16×16 aas small as 4×4, enabling precise segmentation of moving regions.
  • 17. Videokompression: Möglichkeiten in der Beseitigung von RedundanzenVideokompression???
  • 18. Wie ließe sich diese Videosequenz komprimieren?http://skateboarding.ru/gallery/data/media/81/sequence_mini.jpg
  • 19. Videokompression: Möglichkeiten in der Beseitigung von RedundanzenVideokompressionBild- bzw. Framedimensionen (Höhe und Breite)- Eigenschaften der Pixel (Helligkeit, Farbe)- Eigenschaften des jeweils betrachteten FramesZeitliche Dimension
  • 20. Welche der beiden Videosequenzen lässt sich besser /stärker komprimieren? Warum?http://skateboarding.ru/gallery/data/media/81/sequence_mini.jpg / http://mamboaustralia.com/isfucked/wp-content/uploads/2011/05/CHEADLE_CULBURRA_SEQUENCE1.jpg
  • 21. Unterscheidung: Intra-coding (auch: spatial coding): Redundanz auseinem Frame entfernen (räumliche Redundanz),Kompression teilweise analog zu JPEG Vektorquantisierung Konturbasierte Codierungvs. Inter-coding (auch: temporal coding): Redundanzzwischen Frames entfernen (temporale Redundanz) Differenzkodierung (frame differencing) BewegungskompensationVideokompression
  • 22. Idee und Verfahrensweise: Aufteilung des Frames in Blöcke (4x4, 8x8, etc.) Suche nach ähnlichen Blöcken Ähnliche Blöcke im Bild ersetzen durch „Durchschnittsblock“ Zwei Schritte: Training: Erstellung der Tabelle (Codebuch) mit häufig vorkommenden Blöcken Häufig verwendet: Linde–Buzo–Gray Algorithmus Berücksichtigung der Ähnlichkeit der notierten Blöcke Dekoder muss über das gleiche Codebuch verfügenVorteile: Schnelle Decodierung Gute Kompression bei vielen ähnlichen BlöckenNachteile: Codierung aufwändig, da ähnliche Blöcke gesucht werden müssenPraxis: Verwendung in Codecs: Indeo, CinepakIntra-Coding: Vektorquantisierung
  • 23. Idee und Verfahrensweise: Trennung in Textur und Kontur Konturen beschreiben (z.B.) durch Bézier-Kurven Texturen kodieren (z.B. mit DCT)Praxis: Verwendung ansatzweise in MPEG-4Knackpunkt: ObjekterkennungIntra-Coding: Konturbasierte Codierung
  • 24. Inter-coding
  • 25. Bildnachweis: http://www.ipway.rs/h264/Doc/wp_h264_31669_en_0803_lo.pdft = 1 t = 2 t = 3…Kompression…?
  • 26. t = 1Frame vollständig gespeichert I-Framet = 2Aus dem vorhergehendenFrame berechnetes Frame P-Frame…Kompression!t = 3Aus dem vorhergehendenFrame berechnetes Frame P-FrameBildnachweis: http://www.ipway.rs/h264/Doc/wp_h264_31669_en_0803_lo.pdf
  • 27. Speichern der Differenzen zwischen Start- undFolgeframe, z.B. pixelweiseDifferenzcodierungBildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 180.
  • 28. Intra- vs. Predicted- vs. Bidirectional Frames: Das Intra-Frame (I-Frame, auch: Key Frame / Schlüsselbild)wird nur unter Berücksichtigung der eigenen Bildinformationkodiert Predicted Frames (P-Frames) werden aus denvorhergehenden I-Frames berechnet. Bidirectional Frames beziehen sich sowohl auf die vorhergehenden I- und P-Framesals auch auf die folgenden I- und P-Frames.Praxis MPEG-1 / -2: Ein I-Frame pro ½ Sek. MPEG-4: Ein I-Frame ~ alle 10 Sek.Unterscheidung I: Frame-Typen (in MPEG)
  • 29. Verfahrensweise Startframe und spätere I-Frames intracodiertübertragen Unterschiede zum Folgeframe bestimmen, als Bildinterpretieren und dieses Bild komprimierenDifferenzcodierungBildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 180.
  • 30. Verfahrensweise: Objektbewegungen zwischen Frames identifizieren Speicherung der Veränderungen als Bewegungsvektoren(motion vector) Zu übertragen: Differenzbild BewegungsvektorenBewegungskompensation (Motion Compensation)Bildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 182.
  • 31. Blockbasierte Bewegungskompensation Verwendung u.a. im MPEG-2 StandardGrob: Jedes Frame des Videomaterials wird in n*m großePixelblöcke unterteilt Um die Bewegungskompensation zu leisten, werdendie Pixelblöcke von Frame zu Frame miteinanderverglichen Ähneln sich die Pixelblöcke (z.B. Kreuzkorrelation), sowird nur der Verschiebungsvektor gespeichert, umden sich der Block verschiebtBewegungskompensation
  • 32. Video Container Matroska MP4 Codecs DivX Xvid H.264 Verfahren der Videokompression Intra-coding Vektorquantisierung Konturbasierte Codierung Interframe-coding Differenzcodierung BewegungskompensationThemenüberblick
  • 33. Audiokompression
  • 34. Hörbeispiel
  • 35. Akustische Signale = zumeist periodische SignaleAudio: Basics AmplitudeMaximalwert eines Signalsinnerhalb einer Phase SchwingungsdauerZeit, bis eine Schwingungwieder ihrenAusgangszustand erreicht WellenlängeFrequenz, ausgedrückt inHertz (Hz, 1Hz = 1Schwingung pro Sekunde)AmplitudeSchwingungsdauer
  • 36. Von analog nach digital:Sampling  Digitalisierung vonAudiodatenGrundfragen Sampling:1. Wahl der geeignetenAbtastrate (Sampling Rate)2. Wahl der geeignetenAuflösungEine Problemstellung: Sampling
  • 37. Je häufiger die Schallwelle auf ihren Druckabgetastet wird, desto besser wird der originaleTon digital repräsentiert.Zu wenige Abtastpunkte führen zu geradenLinien, zu langen Wellen oder zu gezacktenKurven.Abtastrate (Sampling Rate)
  • 38. Wahl der Abtastrate auf Basis des Nyquist-Shannon-Abtasttheorems. „Wenn ein kontinuierliches Signal miteiner oberen Grenzfrequenz von fmax mit einerAbtastrate von mehr als 2*fmax abgetastet wird, kannman das Ursprungssignal ohne Informationsverlust ausdem abgetasteten Signal rekonstruieren.“(Malaka, Butz, Hußmann: Medieninformatik. München: Pearson, 2009, S. 63.)Das Abtasttheorem und die Praxis: Da menschlicheOhren Schallwellen von maximal 22.000 Hz (= 22 kHz)wahrnehmen können, liegt die erforderliche Nyquist-Rate bei 44.000 Hz. Qualitativ hochwertige Audio-Digitalisate haben darum eineAbtastrate von 44.100 Hz.Shannon-Nyquist
  • 39. Bekanntestes (und einfachstes) Abtastverfahren:PCM (Pulse Code Modulation)  Für jedenAbtastzeitpunkt: Messung eines SignalwertesBekannte Audio-Formate, die PCM verwenden:WAV, AIFFPulse Code Modulation
  • 40. Quantisierung: Abtasttiefe
  • 41. Wie groß ist der Speicherplatzbedarf (unkomprimiert) einerklassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit60-minütiger Laufzeit?Speicherplatzbedarf
  • 42. Wie groß ist der Speicherplatzbedarf (unkomprimiert) einerklassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit60-minütiger Laufzeit?Lösung Das Audiosignal wird standardmäßig mit 44,1 KHz abgetastet. Die Abtasttiefe liegt bei 16 Bit. Daraus folgt:44,1kHz * 2 * 16bit * 60 min * 60 s = 635 MegabyteSpeicherplatzbedarf
  • 43. HörschwellenmaskierungSignale werden aus Frequenzspektrum entfernt,die jenseits der (menschlichen) HörschwelleliegenFrequenzmaskierung Entfernung von Signalen, die von Signalen miteiner anderen Frequenz übertönt werdenKompression: Psychoakkustische AspekteBildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:24h_wecker.jpg&filetimestamp=20090809180759
  • 44. Temporale Maskierung Auch zeitliche Abstände zwischen Tönen habeneinen Einfluss auf die Hörbarkeit: Geht einem starken Ton A ein schwächerer Ton B inähnlicher oder gleicher Frequenz voraus oder folgt ihm,so gibt es zeitliche Abstände von bestimmter Dauer, indenen Ton B nicht zu hören ist.Kompression: Psychoakkustische AspekteBildnachweis: http://www.itwissen.info/definition/lexikon/Maskierung-masking.html
  • 45. /
  • 46. Aufgabe 1 (1 Punkt)Welche Arten von Redundanz werden bei der Videokompression beseitigt? ErläuternSie in diesem Kontext die Begriffe Intra- und Inter-Coding und beschreiben Sie diegrundlegende Funktionsweise des Verfahrens „Motion Compensation“.Aufgabe 2 (1 Punkt)Beschreiben Sie die Vorgehensweise bei der Digitalisierung von Audiosignalen.Beschreiben Sie in diesem Zusammenhang die folgenden Begriffe: Abtastrate (Sampling Rate) PCM Abtasttiefe (Quantisierung)Aufgabe 3 (1 Punkt)Welche Phänomene menschlicher Wahrnehmung (Stichwort: „Maskierung“) machtman sich bei der Audiodaten-kompression zunutze?Aufgabe 4 (1 Punkt)Informieren Sie sich im WWW über das mp3-Format. In welchem Zusammenhangsteht mp3 mit der Moving Picture Experts Group?Hausaufgaben

×