Deep Learning yöntemlerinden birisi olan AutoEncoder kullanarak Fraud tespiti nasıl yapılır. Tensorflow backendi ile birlikte AutoEncoder yapısı ve Fraud Tespitindeki etkisi nelerdir.
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
AutoEncoder kullanarak Fraud Tespiti
1. AUTOENCODER KULLANARAK
FRAUD TESPITI
• Fraud Nedir?
• Geleneksel yollardan Fraud Tespiti nasıl yapılır?
• Fraud Tespitine Makine Öğrenmesi yaklaşımı?
• AuotuEncoder kullanarak Fraud Tespiti Nasıl yapılır?
2. FRAUD NEDIR?
Fraud özünde sahtecilik/dolandırıcılık anlamı taşıyan mali veya
itibari kayba yol açan, adli soruşturma gerektiren eylemlerin
tümüne denir.
3. FRAUD NEDIR?
Ödeme sistemleri anlamında fraud ise başkalarının kredi kartı
veya bankacılık kartını kullanarak yapılan dolandırıcılıktır.
4. FRAUD NEDIR?
Fraud işlem 2 çeşit yapılır.
• Fiziki ortamda gerçekleştirilen sahtecilikler (CP-Card Present
Fraud)
• Sanal ortamda gerçekleştirilen sahtecilikler (CNP-Card Not
Present Fraud)
7. EN ÇOK FRAUD IŞLEM OLAN
PLATFORMLAR
• Uygulama indirme mağazaları (iTunes, Google Play, Facebook)
• Bilet satışı yapan web siteleri ve havayolu şirketleri (uçak ve
otobüs bileti)
• GSM siteleri (TL yükleme)
• Elektronik ürün satışı yapan web siteleri ile giyim ve aksesuar
satışı yapan dikey segmentteki websiteleridir.
8. GELENEKSEL YOLLAR ILE
FRAUD TESPITI
• Kartların arkasında bulunan CVV/CVC29 güvenlik kodunu
kopyalamak pek mümkün olmadığı için internet üzerinden
yapılacak ödeme işlemlerinde alıcıların bu kodu sorgulaması
gerekir.
• Ödeme yapılan bağlantının geçerli bir IP olup olmadığı kontrol
edilebilir, domain adresinin tespit edilmesi ve beklenmeyen
durumlarda bankadan bilgi talep edilmesi, ödeme alan firmalar
için önemli bir adım.
• E-ticaret firmalarının ürünler ya da ödeme miktarı için günlük
üst limit belirlemesi defraud kontrol adımları arasında yer alır.
9. GELENEKSEL YOLLAR ILE
FRAUD TESPITI
• Ödeme esnasında kart bilgileri, kart numarası ya da son
kullanım tarihi gibi bilgilerin 2 defadan fazla girilmesi
durumunda karta bloke koyulabilir.
• Ödeme alan ve ürün ya da hizmet teslim eden firmaların
yapabileceği fraud kontrol uygulamalarından biri de teslim
aşamasında kimlik talep etmeleri. Kimlik kartı ibrazı
aşamasında ürünü teslim alan kişiyle ödeme yapan kişinin
bilgilerinin aynı olup olmadığı kontrol edilebilir.
• Aynı şekilde ödeme yapılmadan önce kişisel bilgilerin girilmesi
istenilmelidir. Burada güvenilir olmayan sitelerden alınan mail
adreslerine dikkat etmek önemli.
10. GELENEKSEL YOLLAR ILE
FRAUD TESPITI
• Şüphe çekecek miktarda alışveriş yapıldıysa teyit amacıyla
telefonla kart sahibine ulaşılmalı ve işlem onayı alınmalı.
• Aynı kart ya da kullanıcıdan arka arkya siparişler alınması
durumunda kart sahibiyle işlem sahibinin aynı kişi olduğu
teyit edilmeli.
11. FRAUD HACMI VE
STANDARTLAR HESAPLAMA
• Bases Point (Baz Puan) = (toplam fraud /toplam ciro)
x10.000
• Max Fraud = 4/10.000
• Avrupa Bölgesi Max Fraud = 8/10.000
• Dünya Geneli Max Fraud = 11/10.000
• Türkiye Geneli Fraud = 2/10.000
12. FRAUD HACMI VE
STANDARTLAR HESAPLAMA
• Nilson raporuna göre 2016’da Amerikada 9 Milyar$ fraud
işlem olmuştur.
• Aynı raporun öngörüsüne göre 2020’de 12 Milyar$’a
çıkacaktır.
• 2017’de Paypal ve MasterCard gelirleri 10 Milyar$’dır.
13. FRAUD TESPITINE MAKINE ÖĞRENMESI
YAKLAŞIMI
• Supervised Learning
• Random Forest
• Support Vector Machine
• K-Nearest Neighbors
• Neural Networks and Deep Neural Networks
• Unsupervised Learning
• Cluster Based Anomaly Detection
• Markov Chain
• Isolation Forest
• One class SVM
14. AUTOENCODER NEDIR?
• Otomatik kodlayıcı, girdi katmanındaki değerleri çıktı katmanına kopyalayan bir
sinir ağıdır. Yani, sinir ağına girdi olarak verdiğimiz veriyi, çıktı katmanında tekrar
oluştururuz
15. AUTOENCODER NEDIR?
• Otomatik kodlayıcı, veri setini eğitirken belirgin olarak (explicit) etiketlerin
belirlenmediği bir denetimsiz öğrenme modelidir.
• Otomatik kodlayıcı, veriyi eğitirken kendi etiketlerini kendi ürettiği için öz-
denetimli (self-supervised) bir öğrenme modeli olarak da geçer.
19. AUTOENCODER NEDIR?
• AE datayı reconstruct ederken yukarıdaki loss fonksiyonunu kullanır
ve hata oranını düşürmek için neural nework’teki weight’leri
gradient’lerle yani partial derivative’lerle update eder. Böylece x’ ; x’e
yaklaşmış olur ve AE loss fonksiyonunu minimize eder.
20. AUTOENCODER NEDIR?
• x’ ve z’yi bulmak için kullanılan formüller yukarıdaki gibidir. Feed
Forward Neural Network’ün çalışma yapısı ile benzerlik gösterir .
Resimdeki σ activasyon fonksiyonunu temsil etmektedir. (1) sayesinde
hidden space’deki value’leri (z) bulurken , (2 ) sayesinde z’yi kullanarak
output layer’daki value’lar (x’) hesaplandı .
21. AUTOENCODER PARAMETRELERI
• Kod Büyüklüğü (Code Size): Orta katmandaki düğümlerin az sayıda olması daha
çok veri sıkıştırma anlamına gelmektedir.
• Katman Sayısı (Number of Layer) : Otomatik kodlayıcı istediğimiz derinliğe sahip
olabilir.
22. AUTOENCODER PARAMETRELERI
• Katmanlardaki Düğüm Sayısı (Number of Nodes per Layer): Üzerinde çalıştığımız
otomatik kodlayıcı mimarisine istif edilmiş otomatik kodlayıcı (stacked
autoencoder) denilmektedir.
• Kayıp Fonksiyonu (Loss Function): Kayıp fonksiyonu olarak eğer girdimiz [0,1]
arasında bir dağılıma sahip ise binary crossentropy değilse de ortalama kare hata
(mean squarred error) kullanabilmekteyiz.