MEETUP APRILE - Ganomaly - Anomaly Detection.pdf

Anomaly Detection a partire da Ganomaly:
patch-wise training e transfer learning
&

Chi è Daniele Moltisanti?
• Data Scientist - Sky
• 26 Anni
• Backgroung Ing. Informatica - Politecnico di Milano
• Specializzato in algoritmi di Deep Learning

Fondatore di stAI tuned
Open Knowledge Community:
Divulgazione di contenuti relativi a AI applicati a settori specifici

Riconoscimento di Anomalie
• Descrizione del problema
• Esistenti soluzioni al problema

Dominio: immagini relative a lastre di acciaio
Obiettivo: estrarre la maschera di anomalia
Risultato: Riconoscimento delle anomalie
Descrizione del problema

Descrizione del problema
Obiettivo
Si cerca un modello matematico che misuri il grado di anomalia di ogni pixel
> L'anomaly score map associa ad ogni pixel un valore di
anomalia (anomaly score)
> Pixel con un alto valore di anomalia vengono riconosciuti
anomali
Regione Anomala
Regione Normale
Modello
Matematico
Anomaly Score
Map
Maschera di
Anomalia

Soluzioni esistenti al problema
Classificatore
Metodi di
Apprendimento Supervisionato
Metodi di
Apprendimento Semi-Supervisionato
Autoencoder AnoGAN Ganomaly
> I modelli supervisionati apprendono i pattern delle
immagini normali e di quelle anomale
> Si basano su un dataset di immagini etichettate
> Poco efficaci nel caso in cui le anomalie mutino le loro
caratteristiche

Classificatore
Metodi di
> Classifica un'intera immagine nelle due classi possibili:
Normale o Anomala
> La Rete Neurale Convoluzionale è un noto classificatore
Metodi di

Classificatore
Metodi di
> I modelli semi-supervisionati apprendono il comportamento
delle sole immagini normali
> Calcolano l'anomaly score di un'immagine
> Sfruttano il valore di anomaly score per definire la presenza
anomalia
Metodi di

Classificatore
Metodi di
> Rientra tra i modelli di ricostruzione
> Riconosce anomala un'intera immagine che
presenta un alto anomaly score
Encoder Decoder
Anomaly
Score
Metodi di

Classificatore
Metodi di
Generatore
Discriminatore
Reale
Generata
Rappresentazione
latente
> Fa parte dei modelli GAN-based
> Apprende come generare di immagini normali
> L'anomaly score viene calcolato attraverso l'errore di
apprendimento
> Alti valori di anomaly score corrispondono ad alte
probabilità di avere un'immagine anomala
> Riconosce la regione anomala mediante l'errore tra
un'immagine e quella fornita dal generatore
Metodi di

Classificatore
Metodi di
Generatore
Discriminatore
Reale
Generata
Encoder Decoder Encoder
Classficatore
> Fa parte dei modelli GAN-based
> Apprende come generare immagini normali
> L'anomaly score viene calcolato attraverso l'errore degli
encoding
> Riconosce anomala un'intera immagini che misura
un'alta anomaly score
> Applicato su immagini di dimensioni ridotte (32 x 32)
Metodi di

Approccio Proposto
• Patch-wise Training e Patch-Ganomaly
• TL-Ganomaly
• Post-Processing: apprendimento di filtri

Patch-wise Training
Approccio Proposto
Patch-wise Training
Da immagini a patch:
> Tecnica di apprendimento basata su porzioni di immagini
(patch)
> Da ogni immagine viene estratto un numero N di patches
> Il training set di immagini viene trasformato in un patch set

Patch-wise Training
Approccio Proposto
256 x 1600
Patch
32
32
Patch-wise Training
(patch)

Patch-wise Training
Approccio Proposto
Training Set
Patch Set
(patch)
Patch-wise Training

Patch-wise Training
Approccio Proposto
Addestramento:
> Apprendimento basato su un training set di patch
> La patch è definita anomala se il suo centro appartiene alla regione anomala
> La patch normale presenta il suo centro privo di anomalie
Patch
Training Modello Patch-wise
Patch-wise Training

Patch-wise Training
Approccio Proposto
Patch
Anomala
Maschera di Anomalia Patch
Regione Anomala
Addestramento:
Patch-wise Training

Patch-wise Training
Approccio Proposto
Maschera di Anomalia Patch
Patch
Normale
Regione Anomala
Addestramento:
Patch-wise Training

Patch-Ganomaly
Approccio Proposto
> Si basa sull'architettura di Ganomaly
> Caratterizzato da una rete generatrice (Generatore) e una rete antagonista (Discriminatore)
> Sfrutta la tecnica del patch-wise training
> Analizza patch piuttosto che intere immagini
Generatore
Discriminatore
x
z
x'
z'
Reale
Generata
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D

Approccio Proposto
Patch-Ganomaly
> Il training set è formato da sole patch normali
> Il modello apprende come generare patch normali, attreverso il Generatore
> L'addestramento di basa sull'ottimizzazione del Generatore e del Discriminatore
Addestramento
Generatore
Discriminatore
x
z
x'
z'
Reale
Generata
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D

Approccio Proposto
Patch-Ganomaly
> La funzione obiettivo (objective function) del Generatore tiene
conto di tre funzioni di perdita (loss functions):
 Errore di Ricostruzione
 Errore degli Encoding
 Errore delle Feature
Generatore
Discriminatore
x
z
x'
z'
Reale
Generata
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D
Addestramento

Approccio Proposto
Patch-Ganomaly
Generatore
Discriminatore
x
z
x'
z'
Reale
Generata
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D
�푐� = � − �' 1
Misura la differenza tra l'immagine in input e quella generata
Addestramento

Approccio Proposto
Patch-Ganomaly
Generatore
Discriminatore
x
z
x'
z'
Reale
Generata
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D
�푒푐 = � − �' 2
Misura la differenza tra gli encoding dell'immagine in input e quella
generata
Addestramento

Approccio Proposto
Patch-Ganomaly
�푎� = �(�) − �(�') 2
Misura la differenza tra le feature estratte dalle due immagini
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D
Generatore
Discriminatore
x
z
x'
z'
Reale
Generata
f(x)
f(x')
Addestramento

Approccio Proposto
Patch-Ganomaly
�푔푒 = �
푐� �푐� + �
푒푐 �푒푐 + �
푎� �푎�
> La funzione obiettivo (objective function) del Generatore è la
somma pesata delle tre loss functions:
Generatore
Discriminatore
x
z
x'
z'
Reale
Generata
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D
Addestramento

> La funzione obiettivo (objective function) del Discriminatore tiene
conto della seguente funzione di perdita (loss function):
 Binary Cross Entropy
Approccio Proposto
Patch-Ganomaly
Valuta l'entropia delle distribuzioni relative alle patch
del training set x e quelle generate x'
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D
Generatore
Discriminatore
x
z
x'
z'
out(x)
out(x')
�퐷� =
�퐵� (1, �� (�)) + �퐵� (0, �� (�'))
2
Addestramento

Approccio Proposto
Patch-Ganomaly
> Il modello è addestrato per generare patch normali
> Una patch anomala tende ad essere ricostruita come una patch normale
> Una patch anomala determina un alto errore degli encoding rispetto al caso di patch
normali
> L'anomaly score è definito sulla base dell'errore relativo agli encoding
Generatore
Discriminatore
x
z
x'
z'
Reale
Generata
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D
Fase di Test

Approccio Proposto
Patch-Ganomaly
> Il modello è addestrato a generare patch normali
normali
> L'anomaly score è definito sulla base dell'errore relativo agli encoding
Generatore
Discriminatore
x
z
x'
z'
Reale
Generata
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D
Fase di Test

Approccio Proposto
Patch-Ganomaly
> Il modello è addestrato a generare patch normali
normali
> L'anomaly score è definito sulla base dell'errore degli encoding
Generatore
Discriminatore
x
z
x'
z'
Reale
Generata
Kernel
Conv 2D
Conv Tran. 2D
Activation Map
Latent Vector
Classification
Output
Batch Norm. 2D
�(�) = � − �' 2
Fase di Test

Approccio Proposto
Patch-Ganomaly
Inferenza
Patch Normale
Modello
Patch-Ganomaly
Anomaly
Score
A partire da una patch, Patch-Ganomaly calcola l'anomaly score ad esso relativo

Approccio Proposto
Patch-Ganomaly
Inferenza
Patch Anomala
Modello
Patch-Ganomaly
Anomaly
Score
A partire da una patch, Patch-Ganomaly calcola l'anomaly score ad esso relativo

Approccio Proposto
Patch-Ganomaly
Inferenza
> Estrazione delle patch che compongono un'immagine
> Inferenza del modello Patch-Ganomaly sulle patch estratte
> Gli anomaly score delle patch formano l'anomaly score map associata all'immagine
256 x 1600 Patch
... ... ...
32
32

Approccio Proposto
Patch-Ganomaly
Inferenza
256 x 1600 Patch
... ... ...
32
32
Modello
Patch-Ganomaly

Approccio Proposto
Patch-Ganomaly
Inferenza
... ...
256 x 1600 Patch
... ... ...
32
32
Modello
Patch-Ganomaly
Anomaly
Score Map

Approccio Proposto
Patch-Ganomaly
Inferenza
256 x 1600 Patch
... ...
...
32
32
Modello
Patch-Ganomaly
Anomaly
Score Map

Approccio Proposto
Patch-Ganomaly
Inferenza
Anomaly
Score Map
> Valori di anomaly score elevati sono associati a pixel anomali
> La soglia di decisione definisce il confine tra uno score normale e uno score anomalo
> La fase di thresholding permette di ottenere questa soglia
> La soglia permette di discriminare i pixel normali da quelli anomali

Approccio Proposto
Patch-Ganomaly
Inferenza
Anomaly
Score Map
Thresholding
Normale
Anomalia
Soglia

Approccio Proposto
Patch-Ganomaly
Inferenza
Anomaly
Score Map
Thresholding Maschera di
Anomalia
Regione Anomala
Regione Normale
Normale
Anomalia
Soglia

Thresholding
Approccio Proposto
Patch-Ganomaly
> Estazione delle patch normali dal training set di immagini
> Si valutano gli anomaly score relativi alle patch normali del traning set
> L'istogramma mostra la frequenza degli anomaly score delle patch normali
> Il quantile al 95% degli anomaly score rappresenta la soglia di decisione
Training Set
Patch Normali
Normale
Anomalia
Soglia

Thresholding
Approccio Proposto
Patch-Ganomaly
> L'istogramma mostra la frequenza degli anomaly score delle patch normali
Training Set
Patch Normali Modello
Patch-Ganomaly
Anomaly Score
Normale
Anomalia
Soglia

Thresholding
Approccio Proposto
Patch-Ganomaly
Training Set
Patch Normali Modello
Patch-Ganomaly
Anomaly Score Istogramma degli
Anomaly Score
Normale
Anomalia
Soglia
> L'istogramma mostra la frequenza degli anomaly score relativi alle patch normali

Thresholding
Approccio Proposto
Patch-Ganomaly
Istogramma degli
Anomaly Score
Quantile al 95 %
Normale
Anomalia
Soglia
Soglia
di
decisione
> L'istogramma mostra la frequenza degli anomaly score relativi alle patch normali

Esperimenti
• Dataset e Modelli di riferimento
• Patch-Ganomaly
• TL-Ganomaly

Dataset
Esperimenti
Si contraddistinguono tre tipologie di anomalie nel dataset:
> Difetti di tipo 1
> Difetti di tipo 2
> Difetti di tipo 3

Dataset
Esperimenti
> Difetti di tipo 1: sparsi e di piccole dimensioni
> Difetti di tipo 2
> Difetti di tipo 3
Pixel Anomali

Dataset
Esperimenti
> Difetti di tipo 1
> Difetti di tipo 2: forme geometriche lineari
> Difetti di tipo 3
Pixel Anomali

Dataset
Esperimenti
> Difetti di tipo 1
> Difetti di tipo 2
> Difetti di tipo 3: difetti densi e omogenei
Pixel Anomali

Test Set
Esperimenti
In fase di sperimentazione vengono utilizzati due test set:
> Test set Strutturato: composto solamente da immagini aventi lo stesso tipo di difetto
> Test set Generico: formato da immagini di qualunque difetto
Dataset

Esperimenti:
Modelli di Riferimento

Esperimenti
Il modello proposto, Patch-Ganomaly, viene confrontato con due modelli di riferimento:
> Modello Supervionato: Rete Neurale Convoluzionale (CNN) fully-connected
> Modello Semi-Supervisionato: Convolutional Autoencoder

Esperimenti
Kernel
Conv 2D
Max Pooling Activation
Function
Classification Output
Fully connected Layer

Esperimenti
Kernel
Conv 2D
Conv Transpose 2D Activation Map Latent Vector
Batch Normalization 2D

Esperimenti
> Addestrati sfruttando la tecnica del patch-wise
training
> Training set di 30.000 patch
Anomaly Score:
> Autoencoder: errore di ricostruzione
> CNN: binary cross entropy
Kernel
Conv 2D
Kernel
Conv 2D
Function

Esperimenti
training
Anomaly Score:
Kernel
Conv 2D

Esperimenti
training
Anomaly Score:
Kernel
Conv 2D
Function

Esperimenti:
Test set Strutturato

Difetti di tipo 1
Esperimenti
Immagine 1
Immagine 2
Immagine Originale
Maschera di Anomalia
Immagine Originale
Pixel Anomali
Pixel Anomali

Esperimenti
Convolutional Autoencoder
CNN Fully-connected
Patch-Ganomaly
Difetti di tipo 1
Immagine 1
Pixel Riconosciuti Anomali
Pixel Anomali

Esperimenti
Difetti di tipo 1
Immagine 2
CNN Fully-connected
Patch-Ganomaly
Pixel Anomali

Difetti di tipo 2
Esperimenti
Immagine 3
Immagine 4
Immagine Originale
Immagine Originale
Pixel Anomali
Pixel Anomali

CNN Fully-connected
Patch-Ganomaly
Esperimenti
Difetti di tipo 2
Immagine 3
Pixel Anomali

CNN Fully-connected
Patch-Ganomaly
Esperimenti
Difetti di tipo 2
Immagine 4
Pixel Anomali

Difetti di tipo 3
Esperimenti
Immagine 5
Immagine 6
Immagine Originale
Immagine Originale
Pixel Anomali
Pixel Anomali

CNN Fully-connected
Patch-Ganomaly
Esperimenti
Difetti di tipo 3
Immagine 5
Pixel Anomali

Esperimenti
Difetti di tipo 3
Immagine 6
CNN Fully-connected
Patch-Ganomaly
Pixel Anomali

Esperimenti:
Test set Generico

> Su un test set di 120 immagini:
Test Set Generico
Esperimenti

> Si basa sul modello Patch-Ganomaly
> Introduce la tecnica del transfer learning Patch-Ganomaly
> Sfrutta la rete pre-addestrata VGG16
Approccio Proposto
TL-Ganomaly

> Si basa sul modello Patch-Ganomaly
> Introduce la tecnica del transfer learning Patch-Ganomaly
> Sfrutta la rete pre-addestrata VGG16
Approccio Proposto
TL-Ganomaly
Average Pooling
Conv 2D
Max Pooling ReLU Classification Output

> Rete di classificazione addestrata su 1000 classi
> Gestisce in input immagini aventi dimensione 224 x 224
> Riduce l'input di un fattore 32
Approccio Proposto
VGG16
Average Pooling
Conv 2D
Max Pooling ReLU Classification Output
TL-Ganomaly

TL-Ganomaly:
Adattamento della VGG16

Approccio Proposto
TL-Ganomaly
32 x 32 x 64
16 x 16 x 128
8 x 8 x 256
4 x 4 x 256
2 x 2 x 512
Kernel: 2 x 2
1 x 1 x 100
Patch-Ganomaly
Generatore
Discriminatore
Reale
Generata
Classficatore
VGG16 Adattata
> Estrazione della rappresentazione latente
> Riduzione dei layer della VGG16
> Adattamento della rappresentazione latente della
VGG16 al vettore latente di Patch-Ganomaly
> L'encoder del modello TL-Ganomaly diventa la
VGG16 adattata

Approccio Proposto
TL-Ganomaly
32 x 32 x 64
16 x 16 x 128
8 x 8 x 256
4 x 4 x 256
2 x 2 x 512
1 x 1 x 100
Patch-Ganomaly
Generatore
Discriminatore
Reale
Generata
Classficatore
VGG16 al vettore latente di Patch-
Ganomaly
VGG16 adattata
VGG16 Adattata

Approccio Proposto
TL-Ganomaly
32 x 32 x 64
16 x 16 x 128
8 x 8 x 256
4 x 4 x 256
2 x 2 x 512
1 x 1 x 100
Generatore
Discriminatore
Reale
Generata
Decoder
Classficatore
VGG 16
Adattata
VGG 16
Adattata
TL-Ganomaly
VGG16 Adattata
VGG16 al vettore latente di Patch-Ganomaly
VGG16 adattata

Approccio Proposto
TL-Ganomaly
Generatore
Discriminatore
VGG 16 Adattata VGG 16 Adattata
Kernel
Conv 2D
Batch Norm. 2D

Esperimenti
Patch-Ganomaly
TL-Ganomaly
Difetti di tipo 1
Immagine 1
Pixel Anomali

Esperimenti
Difetti di tipo 1
Immagine 2
TL-Ganomaly
Patch-Ganomaly
Pixel Anomali

Esperimenti
Difetti di tipo 2
Immagine 3
TL-Ganomaly
Patch-Ganomaly
Pixel Anomali

Esperimenti
Difetti di tipo 2
Immagine 4
TL-Ganomaly
Patch-Ganomaly
Pixel Anomali

Esperimenti
Difetti di tipo 3
Immagine 5
TL-Ganomaly
Patch-Ganomaly
Pixel Anomali

Esperimenti
Difetti di tipo 3
Immagine 6
TL-Ganomaly
Patch-Ganomaly
Pixel Anomali

Test Set Generico
Esperimenti
> Su un test set di 120 immagini: > Segmentazione migliore: Patch-Ganomaly
> Migliore Precisione: TL-Ganomaly

Approccio Proposto
Post-Processing
> Migliorativo per i problemi di segmentazione
> Applicazione di un filtro all'anomaly score map
Anomaly Score Map Filtro Anomaly Score Map
Filtrata

Approccio Proposto
Obiettivi:
 Migliorare le soluzioni fornite per la segmentazione delle regioni normale e anomala
Soluzioni:
 Modello Conv-Processing
Post-Processing

Conv-Processing
> Modello Supervisionato
> Fornisce il filtro convoluzionale
Approccio Proposto
Modello
Conv-Processing
Anomaly Score Map Filtro Convoluzionale

Conv-Processing:
Addestramento

Addestramento
> Rete Neurale: un layer Convoluzionale
> Training set etichettato: anomaly score map e
maschere di anomalia
> Apprende i parametri del kernel
convoluzionale
Approccio Proposto
Kernel: 3 x 3
x x'
Input Output
Conv 2D
Sigmoid

Esperimenti
• Dataset e Modelli di riferimento
• Patch-Ganomaly e TL-Ganomaly

Primo confronto tra:
> Patch-Ganomaly con filtro convoluzionale costante in
post-processing
> Patch-Ganomaly con filtro convoluzionale fornito dal
modello Conv-Processing (PG-Detector)
Esperimenti
Post-Processing
Modello
Patch-Ganomaly
0,11 0,11 0,11
0,11 0,11 0,11
0,11 0,11 0,11
Modello
Patch-Ganomaly
0,36 0 0,28
0,35 0,4 0,37
0,25 0,26 0,31
PG-Detector
Filtro Conv. Costante
Filtro Conv. Appreso

Secondo confronto tra:
> TL-Ganomaly con filtro convoluzionale costante in
post-processing
> TL-Ganomaly con filtro convoluzionale fornito dal
modello Conv-Processing (TL-Detector)
Esperimenti
Post-Processing
Modello
TL-Ganomaly
Modello
TL-Ganomaly
TL-Detector
Filtro Conv. Appreso
0,17 0 0,23
0,2 0,05 0,24
0,21 0,17 0,21
0,11 0,11 0,11
0,11 0,11 0,11
0,11 0,11 0,11
Filtro Conv. Costante

Immagini Test
Esperimenti
Immagine Originale Maschera di Anomalia
Pixel Anomali
PG-Detector
Difetto di tipo 1
Difetto di tipo 2
Difetto di tipo 3

Esperimenti
Difetti di tipo 1
PG-Detector
Pixel Anomali
Patch-Ganomaly Conv. Costante
PG-Detector

Esperimenti
Difetti di tipo 2
PG-Detector
Pixel Anomali
PG-Detector

Esperimenti
Difetti di tipo 3
PG-Detector
Pixel Anomali
PG-Detector

Su un test set di 120 immagini:
Risultati
Esperimenti
> PG-Detector apporta migliorie in termini di
Precision
> Fornisce soluzioni con meno falsi positivi
PG-Detector

Difetto di tipo 1
Difetto di tipo 2
Difetto di tipo 3
Immagini Test
Esperimenti
Immagine Originale Maschera di Anomalia
Pixel Anomali
TL-Detector

Esperimenti
Difetti di tipo 1
TL-Detector
Pixel Anomali
TL-Detector
TL-Ganomaly Conv. Costante

Esperimenti
Difetti di tipo 2
TL-Detector
Pixel Anomali
TL-Detector

Esperimenti
Difetti di tipo 3
TL-Detector
Pixel Anomali
TL-Detector

Risultati
Esperimenti
TL-Detector
Su un test set di 120 immagini: > TL-Detector apporta migliorie in termini di
Recall
> Fornisce una segmentazione delle regioni più
efficace

Grazie per l'attenzione!
Esperimenti
TL-Detector

MEETUP APRILE - Ganomaly - Anomaly Detection.pdf

Recommended

Recommended

More Related Content

More from Deep Learning Italia

More from Deep Learning Italia (20)

MEETUP APRILE - Ganomaly - Anomaly Detection.pdf