İmage processing var olan resmi okunulabilir ve daha fazla geliştirmek için resmi yumuşatıp, keskinleştirip, kontrast ayarı, uzatma ve bir çok farklı yöntemle yeni bir resim oluşturma işlemidir.
PANORAMİK
Daha kaliteli güzel resimler çıkarmak için daha küçük parçaları birleştirip büyük parçayı oluşturmak bir puzzle gibi. Oldu size panoramik muhteşem resimler
Sadece bunlar değil aynı zamanda gökyüzenden çekilen yerlerin birleştirilip bize muhteşem haritalar sunması.
Sağlık sektöründe image prossesing çok önemli bir yer alır bunlardan MRI ise görüntü işleme uygulamarının en başlarını çekenlerinden biridir. MRI gördüğünüz üzere beynin 2 boyutlu ve 3 boyutlu görüntülerin oluşturur. Yada isterseniz vücudun başka bölümleri.
https://www.youtube.com/watch?v=QMLbTEQJCaI
Araç geliyor hemen kamera ile plakamız okunup aracın girme işlemi gerçekleşiyor
Bunu gerek otoban giriş ve çıkışlarında görebilirsiniz. Yada basit olarak Marinada otoparka girerken bir bilet almazsınız direk giriş yaparsınız. Sizin plakanız okunmuştur. Ve çıkışta o plaka üzerinde ki ücreti ödeyip çıkarsınız.
https://www.youtube.com/watch?v=QMLbTEQJCaI
https://www.youtube.com/watch?v=QMLbTEQJCaI
Biometric ve görüntü işleme parmak izi, yüz biometriği ve göz görüntüsü oluşturup güvenlik sistemlerinde kullanılmaktadır. Telefonlarımızda olan güvenlik açmak için parmak okutma yada bende olmayan yüz tanıma sistemi ile açılan telefonlar var
Şu and bile neredeyse küçük ölçekli şirketlerde dahil olmak üzere giriş çıkışları parmak okuyucu ile yapmaktadır. Bu sayede eskiden giriş çıkışları kartla yapıp sahtekarlığı ve maliyeti düşürmüşlerdir
yapay zeka ve görüntü işleme tekniklerini kullanan GBG IDscan, kimlik doğrulama ve belge otomasyon çözümleri sağliyoruz.
1) belge türü tanıma, veri çıkarma ve belge kimlik doğrulaması
2) Tarayıcılar, cep telefonları ve web kameraları da dahil olmak üzere çok çeşitli görüntü yakalama cihazlarından doküman görüntüleri yakalamak için etkili bir mekanizma.
3) Pasaport ehliyet gibi kimlik belgelerinin görüntülerinden saniyeler içinde otomatik olarak tanır, doğrulamak ve verileri ayıklayabilen bir yazılım servisidir.
Dunyanin en buyuk firmalari basta olmak uzere bir cok firmaya kimlik dogrulama ve belge otomasyon sistemi sunuyoruz.
Banka
Apple
Amazon
Night Club
https://www.idscan.com/
IDscan awarded Best of Show at Finovate Europe 2016
http://nightclub.co.uk/
Kiosk denilken makinelerimiz var kendileri wifi ile bağlanıp bilgileri aktarır.
Buradaki süreç söyledir.
Database direk kendi içindedir. Giren kişileri buraya kaydedilir. Bloklu kişi geldiyse bloklanır. Buradaki sistemde sql cache yapılıyor. Bloklu bır kişi olunca sql veritabanın güncelliyor.
Face ve driving licence
http://nightclub.co.uk/
Kiosk denilken makinelerimiz var kendileri wifi ile bağlanıp bilgileri aktarır.
Buradaki süreç söyledir.
Database direk kendi içindedir. Giren kişileri buraya kaydedilir. Bloklu kişi geldiyse bloklanır. Buradaki sistemde sql cache yapılıyor. Bloklu bır kişi olunca sql veritabanın güncelliyor.
BANKA
Bir banka otomasyon sisteminde dökümanlar gösterilip bilgiler kaydedilir.
İngilterde bir hesap açtırmak gerçekten zor bir iştir. Hesap açtırmadan önce belgelerinizi getirirsiniz daha sonra bir randevu alırsınız. Arkasında o randevu tarihinde açtırırsınız
DİKKAT
BANKA lar içn bu videoyu izle bankalar için bilgi verdikten sonra
Bu linki aç ve bilgileri ver
https://www.idscan.com/gaming/
oyunlar için olan ekranı aç flash olan tanıtım ekranında oyun alanı için tanıt
Taranan bir pasaporttan nasıl bilgiler elde edileceğini görebilirsiniz. Bu bilgileri alıp pasaportun gerçek olup olmadığını anlayıp daha sonrada bilgileri sistemlerine kaydederiz
Bu bilgilerden sonra nasıl bir ekran görüntüsüne sahibiz bilgisini ver
https://www.idscan.com/human-resources/
Bir çok resim gürültülüdür biz image processing işleminde buna noisy diyoruz. Bir çok aplikasyon vardır bu gürültüyü kaldırmak için. Gürültüyü kaldırmak çok önemlidiri neredeyse her resim gürültülüdür.
https://www.youtube.com/watch?v=fVclEUy_Zpk
Düşük kontrastlı resimlerde biz gerekli bütün bilgileri göremeyiz bu yönden kontrastı geliştirip gizlenmiş bilgileri açığa çıkarırız
Kenar algılama image processing için önemli yöntemlerden biridir. Resimdeki değeri hızlı bir şekilde okumamızı sağlar
Watermark, image processing için önemli içeriklerinden biridir. Özellikle şu an ki günümüzde instagram ve facebookda paylaşılan resimler başkaları tarafından kötüye kullanılıp yada resmi satmak istediğinizde oluşan sıkıntılar.
Sahibinden.com web sitesi içinde örnek ver. Sahtekarlar aynı resmi kopyalayıp yeni ilan koyuyorlar.
Digital Inpainting Dijital İçboyama, çok eski resimleri düşünün büyünannenizin gençlikten kalma resmi yada büyük büyük annenizin gençlikten kalma resmi, resimler eski ve çizgiler var siz yeni bir resim yapmıyorsunuz bu resmi boş olan yerlerini dolduruyorsunuz,
City Planning Şehir Planlama , inşaat mühendisliği için çok önemlidir şehrin ne tarafa doğru büyüdüğünü görüp o şekile analiz etmek için kullanılır.
Region Detection Bolge tespiti segmantasyon olarak orneğini vermiştim zaten, farklı bir patern bulup onu diğer paternlerde arındırıp anlamlar çıkartarsınız
Comperession Sıkıştırma büyük bilgi için küçük bir alana sıkıştırma
Coding Kodlama
3d image normal kameradan çekilen bir imagi 3d haline getirmek
Ben burada matematisel bir şey göstermiyeceğim. Ama şunu bilmelisinizki matematik yapmak zorundasınız. Kodlama yapmak zorundasınız. Diyorsanız ki ben bunları yapacağım hoş geldiniz image processing
Ve birazcık daha ayrıntıya girelim.
Relationship the other fields
İmage Processing’in diğerleriyle ilişkisi, image analysis and Computer Vision
Image Processing:image sıklıkla resimden anlam çıkarmak için yapılır. enhancement.noisy removal,restoraion, compression
Image Analiz: Resmin içindeki bilgileri analiz eder
Computer Vision: Bir insan gözü gibi resmi yorumlamayı dener.
Computer vision ise bilgisayara nesnlerin ne olduğunu öğretmek ona bir insanın bakış açısı özelliği kazandırmak
Object Recognation ->Nesne Tanıma
Motion tracking->Hareket takibi
2d görüntüden 3d görüntü çıkartır
Peki daha kompleks olan bir yapı nasıl işler. Bir resmi yorumlamak için önce onun ne olduğunun bilinmesi gerekir işte burada araya data giriyor. Eskiden tüm dataları gözden geçirmek bir bilgisayar için 1 yıl alırken gelişen teknolojiyle bu çok daha hızlı olabiliyor.
3 yaşındaki bir çocuk gördüğü gördüğü resimdeki bilgileri bize aktarıyorken. Bizimde amacımız bilgisayara bir insan gözü gibi resmi yorumlamasını sağlamak.
Dronler ormanda uçarken bize orman yangınlarını haber veremiyor, heryerde güvenlik kamerası olmasına rağmen bir insanı boğuldunu bze haber veremiyor yada bir işyeri soygununda bize soygun oluyor şeklinde haber veremiyor.
Neden kör peki çünkü biz bir resim çekeriz, bu resmi makine
her bir pixeli için İki boyutlu bir dizi haline dönüştürür. Fakat bunlar cansız bir sayıdır, bir anlam içermez. Görerek biz anlayabiliyoruz.
Ve aslında biz bunu en baştan bu yana kusursuzca yapabiliyorduk. Tabiyki bu işi yapan sadece göz değil asıl iş beyindeydi
Görsellik gözle başlar,fakat beyinle halledilir.
Bir nesne gelir ve o nesne işlenip çıkar
Nasıl yapıyoruz bunu
Şekil ve renklerden bir object model oluşturuyoruz
Matematik diliyle bir bilgisayar algoritması oluşurup, kedi yuvarlak bir yüze sahiptir, tombul bir vücudu vardır, iki sivri kulağı vardır ve uzun bir kuyruk.
Bunlar bizim için yeterli diyor ve işte bu bir kedidir. Çıktısı alıyoruz.
Ya bu kedi, nasıl bir şekil oluşturacağız.
Şimdi yeni bir şekil görüş açısı ve bir model oluşturacağız
Tamam oluşturalım
Peki kedi kendini gizlemiş tam anlamıyla vücudu yoksa
Ya bu tatlı kediler
Şimdi bir sadecce bir kedi için sonsuz object model oluşturacağız ve bu sadece bir kedi için ya diğerleri
Ve şimdi gelmek istediğmiz yere gelelim
Hiç kimse bir çocuğua nasıl görmesi gerektiğini söylemiyor, ilk yıllarında bile, Çocuklar kendi başlarına gerçek yaşam tecrübeleri ve örneklerle öğreniyorlar
Eğer bir çocuğun gözünü bir biyolojik kamera gibi düşünürsek, yaklaşık her 200 milisaniyede resim çekiyor ve gerçek dünyayla ilgili milyonlarca resim oluyor
Burdan anladık yapmamız gereken verileri toplamak
Ve ortaya datalar çıkıyor
Şimdi size bir şirket hakkında bahsetmek istiyorum ismi imageNET
Fei Fei Li ve Kai Li ImageNet projecti devreye soktu
Ve milyonlarca resim indirdiler crowdsourcing yaparak aynı Amazon mechanical turk gibi
https://www.mturk.com/mturk/welcome
Ve bu kadar büyük olaylardan inanılmaz olan gerçekşti bize free olarak kullanmamızı sağladı
Sponsor firmalar tabiyki en büyük firmalar
Google amazon gbi
http://www.image-net.org
Sadece bir kedi kategorisi için 62 binden fazla kedi olan bir data sunuyor bize
Şimdi milyonlarca resim girip match ederek resmi nesneyi tanımamız sağlıyor
Convolutional Neural Network bir beyin sistemi gibi çalışıp nesneyi tanımamız sağlayacak
Ne dir bu convolutional network
Daha fazla ayrıntı için bu linki okuyabilirsiniz
http://neuralnetworksanddeeplearning.com/chap1.html
Ve bunları
https://www.youtube.com/watch?v=aircAruvnKk&t=988s
https://www.youtube.com/watch?v=IHZwWFHWa-w
https://www.youtube.com/watch?v=tIeHLnjs5U8
Bir nöron için değerler kümesi gelir ve o da bir sonuç çıkarır
Ve çıkan sonuçtakn oluşan diğer nöronlar yinde kendilerine bir çıktı oluşturur oda diğer nörona değeri gönderir
Ve böylece sonunda gerçek çıktımıza ulaşabiliriz
Neural network nedir 28X28 boyutunda bir resim vardir ve her bir pixeline degerler verilip bu degerlerle bu resmin ne oldugunu anlariz
Ve gördüğünüz üzere bilgisayar artık bir resimde bunları tanımlayabiliyor
Ve tabiyki hala çözemediği sorunlar var
Peki ya sadece nesneleri tanımlamamı, hatırlacağınız üzere en başta 3 yaşındaki çocuk tanımlamaktan ziyade nesnleri yorumlayabiliyordu. Şimdi gördüğünüz üzere nesnelerin tanımlanması yerine yorumlanabiliyor
Biz keke baktığımızda özel bir kek olduğunu anlayabiliyoruz ama bilgisayara hala anlayamıyor