SlideShare a Scribd company logo
Metody detekce obrazu                                              Pavel Cagaš, Brno 2012



Výběr tématu
Volba tématu práce pro mě, jako pro studenta informatiky, nebyla těžká. Studuji obor, který
se zabývá počítačovou grafikou a zpracováním obrazu. Metody detekce obrazu jsou velmi
podstatnou součástí počítačového vidění, což je schopnost systémů provádět automatizovanou
činnost na základě zpracování obrazu z kamery. To je téma, které mě zajímá a má velkou
budoucnost.


Anotace
Práce se věnuje metodám pro vyhledávání významných bodů v obraze a jejich využití pro
další zpracování obrazu. Hlavně tedy uvedení do kontextu počítačového vidění a stručnému
vysvětlení základních principů fungování těchto metod. Významné body jsou důležité pro
první analýzu a identifikují místa s vlastnostmi vhodnými pro další práci s obrazem. Jsou zde
uvedeny metody SIFT(Scale Invariant Feature Transform) a SURF(Speeded Up Robust
Feature), které jsou vhodné pro vyhledávání struktur použitelných pro zjištění korespondencí
mezi obrázky. Obě metody jsou měřítkově nezávislé, druhá zmíněná metoda je však rychlejší
a tedy vhodnější pro zpracování obrazu v reálném čase.


Klíčová slova
Počítačové vidění, strojové vidění, významný bod, klíčový bod, Gaussián, SIFT, SURF
Metody detekce obrazu

Historie zpracování obrazu v počítači má počátky v 70. letech, kdy začala být výpočetní
technika na dostatečně vysoké úrovni pro zpracování objemu dat spojeném s obrazovou
informací. Vznikl nový obor, který se začal nazývat počítačové vidění. Tento název se
používá k označení obecných systémů vykonávajících automatizovanou činnost na základě
zpracování obrazu z kamery. Pro aplikace počítačového vidění v průmyslu se používá název
strojové vidění. Jedním z cílů strojového vidění je automatizovat procesy, které museli ještě
donedávna vykonávat lidé. Správně aplikovaný systém strojového vidění, schopný vykonávat
svou činnost bezchybně a neúnavně tak vede ke zkvalitnění a zefektivnění práce na poli
nejrůznějších průmyslových oborů.

Zrak je pro člověka jedním z nejdůležitějších smyslů. Předává mozku většinu informací
z našeho okolí. Je tedy logické, že se vědci začali zabývat problémem strojového vidění.
Přimět počítač správně obraz analyzovat a doopravdy mu „rozumět“ tak skýtá ohromný
potenciál. Jenže co přesně znamená rozumět obrazu? Pro člověka je to přirozená vlastnost
identifikovat jednotlivé předměty na základě vlastních zkušeností a roztřídit je do různých
skupin. Stroje ale tuto schopnost nemají. Přestože jsme schopni pomocí moderních kamer
digitálně zachytit obraz ve velmi vysoké kvalitě, pro počítač je to pouze posloupnost čísel.
Dovede určit barvu, tedy číselnou hodnotu každého obrazového bodu. Nedovede však
rozpoznat jednotlivé předměty, ze kterých se obraz skládá, a udělat si představu o jejich
uspořádání. Proto je potřeba navrhnout algoritmy, které analyzují obrazová data a vyhledají
v nich struktury a vzory vhodné k dalšímu zpracování. Rysem chytře implementovaných
systémů je, že nezpracovávají všechny informace bez ohledu na jejich význam. Místo toho
jsou schopny rozpoznat části, které jsou vhodné k dalšímu zpracování, a dále se jim
přednostně věnovat, případně nepotřebné části úplně vyloučit. Mezi vhodné části se dají
zařadit oblasti s rychlou změnou intenzity, často to bývají hrany a rohy objektů. Mezi první
pokusy o vyhledání takových míst patří Moravcův algoritmus [2] ze 70. let. Od té doby bylo
vyvinuto mnoho dalších algoritmů zaměřených na různé problémy při řešení nezávislosti na
deformaci obrazu.

SIFT, který je momentálně nejpopulárnějším algoritmem pro detekci obrazu a za jehož
vznikem stojí David G. Lowe [3], docela komplikovaný algoritmus. Používá se pro hledání
odpovídajících vzorů nebo rysů v obraze. Má hodně částí výpočtu a může se stát zavádějícím.
Pro představu je tedy vhodnější následující rozdělení. Nejdříve se vytvoří měřítkově
invariantní struktura. Výsledná metoda však není jen měřítkově invariantní, jak se to může
z názvu zdát, ale je také invariantní vůči rotaci, nasvícení a úhlu pohledu kamery. Dalším
krokem je detekce významných bodů užitím aproximace pomocí Laplaceovy funkce použité
na Gaussián. Dále nalezneme klíčové body obrazu. Jsou to body kde je Gaussián, tedy vektor
maximální změny, největší. Tak pravděpodobně nalezneme místa, ve kterých je velký rozdíl
kontrastů, tedy hrany a rohy objektů. Málo kontrastní oblasti se odstraní. Tímto se algoritmus
stane robustnějším. Dále se vypočítá orientace každého klíčového bodu. Všechny další
výpočty jsou prováděny relativně k orientaci, čímž se hledání objektů v obraze stane rotačně
invariantním. Posledním krokem je vytvoření unikátní stopy pomocí histogramu pro každý
klíčový bod. Jestliže je například oko klíčovým místem, jsme schopni ho odlišit od ostatních
klíčových míst jako uši, nos, prsty atd.
SIFT a SURF algoritmy používají mírně odlišné způsoby detekce objektů. SIFT staví
pyramidu obrazů a každou vrstvu filtruje gaussovským rozostřením a následně je odčítá pro
dosažení největšího rozdílu. Metoda SURF funguje velice podobně, ale obsahuje navíc další
optimalizace. Doba vyhodnocení těchto dvou metod je závislá na okolnostech. Ovlivňují ji
některé faktory jako velikost a kvalita snímku, typ obrázku (scenérie nebo textura), a také
parametry algoritmů. První část pokusu [4] používá snímky stěn pomalovaných grafity.
Velikost snímků je pouhých 300 x 240 pixelů. Parametry obou algoritmů mají stejné
nastavení. Doba vyhodnocení se počítá pro kompletní zpracování, které obsahuje detekci
i přiřazení vzorů. Přestože metoda SIFT je pomalejší, graf ukazuje větší počet nalezených
korespondencí.




                    počet nalezených shod stejného obrázku užitím obou metod


SURF je rychlá metoda s obstojným výkonem stejně jako SIFT, ale není stabilní vůči rotaci
a změnám v osvětlení. Volba metody záleží hlavně na potřebě konkrétní aplikace.

Počítačové vidění je rychle se vyvíjející oblast informatiky a v současnosti na jeho rozvoji
pracuje spousta velkých firem včetně firmy Google. Počítačové vidění a zejména detekce
obrazu totiž skrývá ohromný potenciál a využití. Už dlouho je možné v obraze strojově
rozeznat obličeje, například některé digitální fotoaparáty takové funkce mají. Kdo však první
navrhne funkční systém, který detekované obličeje také rozezná a přiřadí je existujícím
osobám, ocitne se na čele vývoje a také velmi zbohatne. Je jen otázkou času, kdo to bude.
Literatura
[1] Wikipedia, the free encyclopedia. http://en.wikipedia.org/wiki/.

[2] H. P. Moravec. Towards automatic visual obstacle avoidance. In Proceedings of the
International Joint Conference on Artificial Intelligence, Department of Computer Science,
Carnegie-Mellon University, 1977

[3] D. G. Lowe. Distinctive image features from scale-invariant keypoints. International
Journal of Computer Vision, 60(2):91-110, 2004

[4] http://www.cscjournals.org/csc/manuscript/Journals/IJIP/volume3/Issue4/IJIP-51.pdf

More Related Content

Similar to Zaverecny ukol KPI

Strojové učení z rychlíku
Strojové učení z rychlíkuStrojové učení z rychlíku
Strojové učení z rychlíku
michalillich
 
Optika digitálních přístrojů
Optika digitálních přístrojůOptika digitálních přístrojů
Optika digitálních přístrojůhnatekmar
 
Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020
Taste Medio
 
Úvod do analýzy - 2 část
Úvod do analýzy -  2 částÚvod do analýzy -  2 část
Úvod do analýzy - 2 část
Martin Paták
 
Vizualizace chemickych struktur na www
Vizualizace chemickych struktur na wwwVizualizace chemickych struktur na www
Vizualizace chemickych struktur na wwwMartin Slavík
 
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016   produktivita a efektivita v digitálním světě - v1.0125. 2. 2016   produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
Jan Janca
 
Herink Webtesty Ocni Kamerou Co Na Strankach Navstevnik Opravdu Dela
Herink Webtesty Ocni Kamerou   Co Na Strankach Navstevnik Opravdu DelaHerink Webtesty Ocni Kamerou   Co Na Strankach Navstevnik Opravdu Dela
Herink Webtesty Ocni Kamerou Co Na Strankach Navstevnik Opravdu DelaEtarget
 
Závěrečný úkol KPI
Závěrečný úkol KPIZávěrečný úkol KPI
Závěrečný úkol KPI
HelgaHeraldicka
 
Procesy redesignu ve velké společnosti? Pohled Heureky prakticky
Procesy redesignu ve velké společnosti? Pohled Heureky praktickyProcesy redesignu ve velké společnosti? Pohled Heureky prakticky
Procesy redesignu ve velké společnosti? Pohled Heureky prakticky
Marek Brumlich
 
Netextové informace
Netextové informaceNetextové informace
Netextové informace
CEINVE
 
Smact a průmysl 4.0
Smact a průmysl 4.0Smact a průmysl 4.0
Smact a průmysl 4.0
Jaroslav Smarda
 
Social media monitoring
Social media monitoringSocial media monitoring
Social media monitoring
Josef Šlerka
 

Similar to Zaverecny ukol KPI (14)

Strojové učení z rychlíku
Strojové učení z rychlíkuStrojové učení z rychlíku
Strojové učení z rychlíku
 
Optika digitálních přístrojů
Optika digitálních přístrojůOptika digitálních přístrojů
Optika digitálních přístrojů
 
Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020
 
Úvod do analýzy - 2 část
Úvod do analýzy -  2 částÚvod do analýzy -  2 část
Úvod do analýzy - 2 část
 
Vizualizace chemickych struktur na www
Vizualizace chemickych struktur na wwwVizualizace chemickych struktur na www
Vizualizace chemickych struktur na www
 
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016   produktivita a efektivita v digitálním světě - v1.0125. 2. 2016   produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
 
Herink Webtesty Ocni Kamerou Co Na Strankach Navstevnik Opravdu Dela
Herink Webtesty Ocni Kamerou   Co Na Strankach Navstevnik Opravdu DelaHerink Webtesty Ocni Kamerou   Co Na Strankach Navstevnik Opravdu Dela
Herink Webtesty Ocni Kamerou Co Na Strankach Navstevnik Opravdu Dela
 
Linuxalt 2010
Linuxalt 2010Linuxalt 2010
Linuxalt 2010
 
Závěrečný úkol KPI
Závěrečný úkol KPIZávěrečný úkol KPI
Závěrečný úkol KPI
 
Procesy redesignu ve velké společnosti? Pohled Heureky prakticky
Procesy redesignu ve velké společnosti? Pohled Heureky praktickyProcesy redesignu ve velké společnosti? Pohled Heureky prakticky
Procesy redesignu ve velké společnosti? Pohled Heureky prakticky
 
Kamerové senzory 2013
Kamerové senzory 2013Kamerové senzory 2013
Kamerové senzory 2013
 
Netextové informace
Netextové informaceNetextové informace
Netextové informace
 
Smact a průmysl 4.0
Smact a průmysl 4.0Smact a průmysl 4.0
Smact a průmysl 4.0
 
Social media monitoring
Social media monitoringSocial media monitoring
Social media monitoring
 

Zaverecny ukol KPI

  • 1. Metody detekce obrazu Pavel Cagaš, Brno 2012 Výběr tématu Volba tématu práce pro mě, jako pro studenta informatiky, nebyla těžká. Studuji obor, který se zabývá počítačovou grafikou a zpracováním obrazu. Metody detekce obrazu jsou velmi podstatnou součástí počítačového vidění, což je schopnost systémů provádět automatizovanou činnost na základě zpracování obrazu z kamery. To je téma, které mě zajímá a má velkou budoucnost. Anotace Práce se věnuje metodám pro vyhledávání významných bodů v obraze a jejich využití pro další zpracování obrazu. Hlavně tedy uvedení do kontextu počítačového vidění a stručnému vysvětlení základních principů fungování těchto metod. Významné body jsou důležité pro první analýzu a identifikují místa s vlastnostmi vhodnými pro další práci s obrazem. Jsou zde uvedeny metody SIFT(Scale Invariant Feature Transform) a SURF(Speeded Up Robust Feature), které jsou vhodné pro vyhledávání struktur použitelných pro zjištění korespondencí mezi obrázky. Obě metody jsou měřítkově nezávislé, druhá zmíněná metoda je však rychlejší a tedy vhodnější pro zpracování obrazu v reálném čase. Klíčová slova Počítačové vidění, strojové vidění, významný bod, klíčový bod, Gaussián, SIFT, SURF
  • 2. Metody detekce obrazu Historie zpracování obrazu v počítači má počátky v 70. letech, kdy začala být výpočetní technika na dostatečně vysoké úrovni pro zpracování objemu dat spojeném s obrazovou informací. Vznikl nový obor, který se začal nazývat počítačové vidění. Tento název se používá k označení obecných systémů vykonávajících automatizovanou činnost na základě zpracování obrazu z kamery. Pro aplikace počítačového vidění v průmyslu se používá název strojové vidění. Jedním z cílů strojového vidění je automatizovat procesy, které museli ještě donedávna vykonávat lidé. Správně aplikovaný systém strojového vidění, schopný vykonávat svou činnost bezchybně a neúnavně tak vede ke zkvalitnění a zefektivnění práce na poli nejrůznějších průmyslových oborů. Zrak je pro člověka jedním z nejdůležitějších smyslů. Předává mozku většinu informací z našeho okolí. Je tedy logické, že se vědci začali zabývat problémem strojového vidění. Přimět počítač správně obraz analyzovat a doopravdy mu „rozumět“ tak skýtá ohromný potenciál. Jenže co přesně znamená rozumět obrazu? Pro člověka je to přirozená vlastnost identifikovat jednotlivé předměty na základě vlastních zkušeností a roztřídit je do různých skupin. Stroje ale tuto schopnost nemají. Přestože jsme schopni pomocí moderních kamer digitálně zachytit obraz ve velmi vysoké kvalitě, pro počítač je to pouze posloupnost čísel. Dovede určit barvu, tedy číselnou hodnotu každého obrazového bodu. Nedovede však rozpoznat jednotlivé předměty, ze kterých se obraz skládá, a udělat si představu o jejich uspořádání. Proto je potřeba navrhnout algoritmy, které analyzují obrazová data a vyhledají v nich struktury a vzory vhodné k dalšímu zpracování. Rysem chytře implementovaných systémů je, že nezpracovávají všechny informace bez ohledu na jejich význam. Místo toho jsou schopny rozpoznat části, které jsou vhodné k dalšímu zpracování, a dále se jim přednostně věnovat, případně nepotřebné části úplně vyloučit. Mezi vhodné části se dají zařadit oblasti s rychlou změnou intenzity, často to bývají hrany a rohy objektů. Mezi první pokusy o vyhledání takových míst patří Moravcův algoritmus [2] ze 70. let. Od té doby bylo vyvinuto mnoho dalších algoritmů zaměřených na různé problémy při řešení nezávislosti na deformaci obrazu. SIFT, který je momentálně nejpopulárnějším algoritmem pro detekci obrazu a za jehož vznikem stojí David G. Lowe [3], docela komplikovaný algoritmus. Používá se pro hledání odpovídajících vzorů nebo rysů v obraze. Má hodně částí výpočtu a může se stát zavádějícím. Pro představu je tedy vhodnější následující rozdělení. Nejdříve se vytvoří měřítkově invariantní struktura. Výsledná metoda však není jen měřítkově invariantní, jak se to může z názvu zdát, ale je také invariantní vůči rotaci, nasvícení a úhlu pohledu kamery. Dalším krokem je detekce významných bodů užitím aproximace pomocí Laplaceovy funkce použité na Gaussián. Dále nalezneme klíčové body obrazu. Jsou to body kde je Gaussián, tedy vektor maximální změny, největší. Tak pravděpodobně nalezneme místa, ve kterých je velký rozdíl kontrastů, tedy hrany a rohy objektů. Málo kontrastní oblasti se odstraní. Tímto se algoritmus stane robustnějším. Dále se vypočítá orientace každého klíčového bodu. Všechny další výpočty jsou prováděny relativně k orientaci, čímž se hledání objektů v obraze stane rotačně invariantním. Posledním krokem je vytvoření unikátní stopy pomocí histogramu pro každý klíčový bod. Jestliže je například oko klíčovým místem, jsme schopni ho odlišit od ostatních klíčových míst jako uši, nos, prsty atd. SIFT a SURF algoritmy používají mírně odlišné způsoby detekce objektů. SIFT staví pyramidu obrazů a každou vrstvu filtruje gaussovským rozostřením a následně je odčítá pro dosažení největšího rozdílu. Metoda SURF funguje velice podobně, ale obsahuje navíc další optimalizace. Doba vyhodnocení těchto dvou metod je závislá na okolnostech. Ovlivňují ji
  • 3. některé faktory jako velikost a kvalita snímku, typ obrázku (scenérie nebo textura), a také parametry algoritmů. První část pokusu [4] používá snímky stěn pomalovaných grafity. Velikost snímků je pouhých 300 x 240 pixelů. Parametry obou algoritmů mají stejné nastavení. Doba vyhodnocení se počítá pro kompletní zpracování, které obsahuje detekci i přiřazení vzorů. Přestože metoda SIFT je pomalejší, graf ukazuje větší počet nalezených korespondencí. počet nalezených shod stejného obrázku užitím obou metod SURF je rychlá metoda s obstojným výkonem stejně jako SIFT, ale není stabilní vůči rotaci a změnám v osvětlení. Volba metody záleží hlavně na potřebě konkrétní aplikace. Počítačové vidění je rychle se vyvíjející oblast informatiky a v současnosti na jeho rozvoji pracuje spousta velkých firem včetně firmy Google. Počítačové vidění a zejména detekce obrazu totiž skrývá ohromný potenciál a využití. Už dlouho je možné v obraze strojově rozeznat obličeje, například některé digitální fotoaparáty takové funkce mají. Kdo však první navrhne funkční systém, který detekované obličeje také rozezná a přiřadí je existujícím osobám, ocitne se na čele vývoje a také velmi zbohatne. Je jen otázkou času, kdo to bude.
  • 4. Literatura [1] Wikipedia, the free encyclopedia. http://en.wikipedia.org/wiki/. [2] H. P. Moravec. Towards automatic visual obstacle avoidance. In Proceedings of the International Joint Conference on Artificial Intelligence, Department of Computer Science, Carnegie-Mellon University, 1977 [3] D. G. Lowe. Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision, 60(2):91-110, 2004 [4] http://www.cscjournals.org/csc/manuscript/Journals/IJIP/volume3/Issue4/IJIP-51.pdf