Your SlideShare is downloading. ×
Bit SoSem 2014 | Basisinformationstechnologie II - 06: Algorithmen der Bildverarbeitung II: Computervision - Vorverarbeitung
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Bit SoSem 2014 | Basisinformationstechnologie II - 06: Algorithmen der Bildverarbeitung II: Computervision - Vorverarbeitung

327
views

Published on

Published in: Education

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
327
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Auflösungsvermögen
    Das menschliche Auge besitzt ca. 6 Mio. Zapfenzellen und 120 Mio. Stabzellen; das Sensor-Array einer typischen CCD-Kamera 440.000 Bildpunkte (Video) bzw. 5-16 MegaPixel (Photo)
    Eine analoge 35mm Kleinbildkamera erreicht eine Auflösung von ca. 20 Megapixel (!)
    Verarbeitungsleistung
    Trotz relativ langsamer „Schaltzeiten“ im Millisekundenbereich garantiert parallele Verarbeitung eine extrem hohe Verarbeitungsleistung des menschl. visuellen Systems
    Farbensehen
    Das menschliche Auge kann ca. 100 Grauwerte und 7 Mio. Farben unterscheiden; digitale Graustufenbilder enthalten bis zu 256 Graustufen und bis zu 16,7 Mio Farben.
  • Struktur / form?
  • Kaffeehaustäuschung
  • Auflösungsvermögen
    Das menschliche Auge besitzt ca. 6 Mio. Zapfenzellen und 120 Mio. Stabzellen; das Sensor-Array einer typischen CCD-Kamera 440.000 Bildpunkte (Video) bzw. 5-16 MegaPixel (Photo)
    Eine analoge 35mm Kleinbildkamera erreicht eine Auflösung von ca. 20 Megapixel (!)
    Verarbeitungsleistung
    Trotz relativ langsamer „Schaltzeiten“ im Millisekundenbereich garantiert parallele Verarbeitung eine extrem hohe Verarbeitungsleistung des menschl. visuellen Systems
    Farbensehen
    Das menschliche Auge kann ca. 100 Grauwerte und 7 Mio. Farben unterscheiden; digitale Graustufenbilder enthalten bis zu 256 Graustufen und bis zu 16,7 Mio Farben.
  • Bedeutung?
  • Woher wissen Suchmaschinen, was in einer Rastergrafik dargestellt ist?
    Annotation: Metainformationen, ausgefülltes alt-Attribut des <img> Tags
    Bildanalyse
  • Woher wissen Algorithmen, dass sich auf der Platine eine kalte Lötstelle befindet?
  • Alle Pixelwerte um einen Wert n erhöhen
  • Punktoperation
  • Der Mittelwert-Filter ersetzt jedes Pixel durch den Mittelwert seiner Umgebungspixel. Dabei wird jedes Umgebungspixel gleich gewichtet. Dies hat zur Folge, dass der Mittelwert-Filter nicht nur Rauschen glättet, sondern auch Kanten im Bild verwischt.
    Er berechnet als neuen Pixelwert das arithmetische Mittel der Umgebungspixel.
  • Faltungsmatrix Gaußscher Filter
  • Anwendungsfall: PLANETS
  • Transcript

    • 1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // jan.wieners@uni-koeln.de Basisinformationstechnologie II Sommersemester 2014 04. Juni 2014 – Algorithmen der Bildverarbeitung II: Computervision – Vorverarbeitung
    • 2. Maschinelles Sehen / Computer Vision  Problemstellung: Algorithmische sinnliche Wahrnehmung?  Vorverarbeitung: Verbesserung des Quellmaterials  Punktoperationen  Binarisierung  Histogrammausgleich  Binarisierung, Schwellwertausgleich  Filter  Medianfilter  Geometrische Operationen  Merkmalsextraktion: Kantendetektion  Algorithmische „kognitive“ Wahrnehmung:  Künstliche Neuronale Netze Themenüberblick
    • 3. Übungsaufgaben Kompression
    • 4. Welches Verfahren würden Sie wählen, um die Binärfolge 0000 0011 1111 0000 zu komprimieren? Erläutern Sie Ihre Wahl.
    • 5. Welches Verfahren würden Sie wählen, um die Binärfolge 0000 0011 1111 0000 zu komprimieren? Erläutern Sie Ihre Wahl.  z.B.: (6, 0) (6, 1) (4, 0)
    • 6. Erläutern Sie ausführlich die Funktionsweise der Huffman- Kodierung anhand der Zeichenkette „torokokorot“ (ohne Anführungszeichen).
    • 7. Bildverarbeitung und maschinelles Sehen
    • 8. Sinnliche Wahrnehmung Photorezeptorenschicht der Netzhaut: ~ 6 Millionen Zapfen ~ 120 Millionen Stäbchen
    • 9. „Alles […], was ich bisher am ehesten für wahr angenommen, habe ich von den Sinnen oder durch Vermittelung der Sinne empfangen. Nun aber bin ich dahinter gekommen, daß diese uns bisweilen täuschen, und es ist ein Gebot der Klugheit, niemals denen ganz zu trauen, die auch nur einmal uns getäuscht haben.“ (Descartes, René: Meditationen über die Grundlagen der Philosophie mit den sämtlichen Einwänden und Erwiderungen. Hamburg: meiner, 1994. S. 12)
    • 10. …und Algorithmen / Computer / Rechner?
    • 11. rot, rot, grün, grün, grün, grün, grün, rot, rot, rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, rot, rot, blau, rot, blau, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, blau, rot, rot, rot, rot, rot, blau, rot, rot, rot, blau, rot, rot, rot, blau, rot, rot, rot, rot, rot, blau, blau, blau, rot, rot, rot
    • 12. rot, rot, grün, grün, grün, grün, grün, rot, rot, rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, rot, rot, blau, rot, blau, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, blau, rot, rot, rot, rot, rot, blau, rot, rot, rot, blau, rot, rot, rot, blau, rot, rot, rot, rot, rot, blau, blau, blau, rot, rot, rot
    • 13. Maschinelles Sehen / Computer Vision
    • 14. Von der Rastergrafik zur Merkmalsextraktion – Algorithmen & Co.  Vorbereitung bzw. Vorverarbeitung  Punkt-Operationen  Histogramm  Filter  Geometrische Operationen  Drehung, Streckung, Verschiebung des Bildes  Merkmalsextraktion  Clustering Maschinelles Sehen
    • 15. Betrachtung / Veränderung eines Pixels unabhängig von seinen Nachbarpixeln Vorverarbeitung I: Punkt-Operationen
    • 16. Gonzalez und Woods, 2008: „We can summarize by saying that RGB is ideal for image color generation (as in image capture by a color camera or image display in a monitor screen), but its use for color description is much more limited.” Zu viel Information: Umwandlung in Graustufenbild
    • 17. Das IHS-Farbsystem (auch HSI, HSV Farbsystem):  Leuchtstärke (Intensity): Maßeinheit der Helligkeit, resultiert aus dem Durchschnitt der Farbwerte  Sättigung (Saturation): Beschreibt die Farbreinheit  Farbton (Hue): Proportional zur durchschnittlichen Wellenlänge der Farbe; basiert auf Abbildung der Farben in einem Polarkoordinatensystem: Zu viel Information: Umwandlung in Graustufenbild
    • 18. Relevant für Umwandlung in Graustufenbild: Leuchtstärke (Intensity) Algorithmus:  Betrachte jedes Pixel P der Rastergrafik  Weise jedem Farbkanal des betrachteten Pixels P die Summe der Werte der einzelnen Farbkanäle R, G und B zu und dividiere anschließend durch die Anzahl der drei:  𝑃 = 𝑟𝑔𝑏( 𝑃𝑅 + 𝑃𝐺 + 𝑃𝐵 3 , 𝑃𝑅 + 𝑃𝐺 + 𝑃𝐵 3 , 𝑃𝑅 + 𝑃𝐺 + 𝑃𝐵 3 ) Zu viel Information: Umwandlung in Graustufenbild
    • 19. Zu viel Information: Umwandlung in Graustufenbild
    • 20. Histogramm Das Histogramm eines Bildes dokumentiert über eine Liste von 256 Elementen (bei einem 8-Bit Graustufenbild) die Anzahl (y-Achse) der Pixel des Bildes, die mit dem entsprechenden Graustufenwert belegt sind.
    • 21. Histogramm Das Histogramm eines Bildes dokumentiert über eine Liste von 256 Elementen (8-Bit Graustufenbild) die Anzahl der Pixel des Bildes, die mit dem entsprechenden Farb- bzw. Graustufenwert belegt sind. ?
    • 22. Algorithmus:  Betrachte jedes Pixel P der Rastergrafik  Speichere den Graustufenwert des Pixels in einem assoziierten Array: // Initialisiere jede Speicherstelle des Arrays mit 0 array histogram[0-255] = 0; // Iteriere über jedes Pixel des Bildes array histogram[ PR ] += 1; Histogrammerstellung – so funktioniert‘s
    • 23. Histogrammausgleich (automatisch) Z.B.: Lisani, Petro, Sbert 2012: Color and Contrast Enhancement by Controlled Piecewise Affine Histogram Equalization Vgl. http://www.ipol.im/pub/art/2012/lps-pae/
    • 24. Wie lässt sich (algorithmisch) eine Aufhellung des Graustufenbildes vornehmen? Übung: Bildaufhellung?
    • 25. Wie lässt sich (algorithmisch) eine Aufhellung des Graustufenbildes vornehmen? Übung: Bildaufhellung?
    • 26. Algorithmus:  Betrachte jedes Pixel des Bildes  Für jedes dunkle Pixel: Vermindere den Grauwert  Für jedes helle Pixel: Erhöhe den Grauwert Kontrastverstärkung
    • 27. Zu viel Information II: Binarisierung Grundfrage dieses (und der vergangenen Verfahren): Wie lässt sich Bildinformation verwerfen, ohne die Bildcharakteristika (i.e. die Form des Elephanten) zu zerstören?
    • 28. Zu viel Information II: Binarisierung Grundfrage dieses (und der vergangenen Verfahren): Wie lässt sich Bildinformation verwerfen, ohne die Bildcharakteristika (i.e. die Form des Elephanten) zu zerstören?
    • 29. Binarisierung mit konstantem Schwellenwert – so funktioniert‘s Zwei Pixelklassen: Algorithmus:  Betrachte jedes Pixel P der Rastergrafik  Vergleiche den Farb-/Grauwert jedes Pixels mit dem Schwellenwert T.  Ist der Wert kleiner als der Schwellenwert, so wird es schwarz eingefärbt (a).  Ist der Wert größer oder gleich dem Schwellenwert, so wird es weiß eingefärbt (b).
    • 30. Übung: Binarisierung
    • 31. Filter: Betrachtung / Veränderung eines Pixels in Abhängigkeit seiner Nachbarpixel Achtung: Weil Originalpixel für das Ergebnis der Filterung relevant (und unabdingbar) ist: Nutzung eines Zwischenbildes als Ausgabe- oder Eingabepuffer. Filter
    • 32.  Lineare Filter (LSI-Filter, linear shift-invariant filters): Jedes Pixel im Verarbeitungsfenster wird mit einem vordefinierten Wert aus einer Faltungs- bzw. Filtermatrix multipliziert.  Nichtlineare Filter: U.a. heuristische Ansätze Heuristik (vgl. Prechtl / Burkard): „Lehre bzw. Theorie der Verfahren zum Finden von Neuem und Problemlösen.“ Filter
    • 33.  Berechnet einfachen arithmetischen Mittelwert der Pixelwerte in der Nachbarschaft unter der Filtermaske  Faltungsmatrix 𝑀 = 1 9 1 1 1 1 1 1 1 1 1  Pro / Contra:  Rauschen reduziert  Glättung / „Blurring“  Kanten verwischen Einfacher Mittelwertfilter Quelle: Handels 2009: Medizinische Bildverarbeitung.
    • 34. Einfacher Mittelwertfilter: 3x3 Pixel „Hotspot“
    • 35. Einfacher Mittelwertfilter – so schaut‘s aus
    • 36. 𝑀 = 1 16 1 2 1 2 4 2 1 2 1
    • 37. Was tun bei Bildrauschen?
    • 38. Algorithmus Medianfilter (Rangordnungsfilter):  Rangordnungsfilter betrachten die Nachbarschaftspixel jedes Pixels, speichern die gefundenen Farb- bzw. Graustufenwerte und sortieren die so gewonnenen Werte in aufsteigender Reihenfolge.  Aus einer 3x3 Pixelmatrix resultiert eine Liste, bestehend aus insgesamt neun Werten. Relevant für das Medianfilter ist das Element, das sich in der Mitte der sortierten Liste der Pixelwerte befindet.  Das Medianfilter selektiert den Pixelwert des fünften Listenelements und weist dem Pixel in der Mitte der Matrix den Median, d.h. den fünften Wert der Liste zu. Beispiel Nichtlinearer Filter: Medianfilter
    • 39. Medianfilter: Anwendungsbeispiele Bildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:Medianfilterp.png&filetimestamp=20070810172335
    • 40. Medianfilter: Anwendungsbeispiele Bildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:Cydonia_medianrp.jpg&filetimestamp=20050313005105
    • 41. Übung Medianfilter
    • 42. ? ? ?
    • 43. Merkmalsextraktion: Kantendetektion
    • 44. Laplace-Operator / -Filter
    • 45. Sobel-Operator Vgl.: http://de.wikipedia.org/wiki/Sobel-Operator http://old.hki.uni-koeln.de/teach/ws0405/VIP/tag7/index.html
    • 46. “Same Same But Different – Comparing Rendering Environments for Interactive Digital Objects” (Guttenbrunner, Rauber, Thaller, Wieners): http://www.euromed2010.eu/e- proceedings/content/full/140.pdf
    • 47.  Künstliche Neuronale Netze, z.B. Hopfield-Netz  Clustering Beispiel: Selbstorganisierende Karte …eine Portion KI…
    • 48.  Filter & Co. Mit HTML5 und JavaScript: http://www.html5rocks.com/en/tutorials/canvas/imagefi lters/?redirect_from_locale=de  OpenCV (Open Source Computer Vision): http://opencv.org/  OCRopus(tm) open source document analysis and OCR system: www.code.google.com/p/ocropus/  Framework (PC) für Playstation „Move“: http://code.google.com/p/moveframework/  Kinect for Windows SDK: http://www.microsoft.com/en- us/kinectforwindows/develop/developer- downloads.aspx Weiterführendes
    • 49. /