SlideShare a Scribd company logo
1 of 18
VDCNN
STUDIO E CONFRONTO
Daniele D’Armiento
Fisico
Harman/Samsung
Very Deep Convolutional Network
Dataset
https://github.com/LC-John/Yahoo-Answers-Topic-Classification-Dataset
Dataset
 AG’s news
 AG is a collection of more than 1 million news articles, gathered from more than 2000 news
sources by ComeToMyHead, an academic news search engine. The dataset is provided by the
academic comunity for research purposes.
For more information, please refer to the link
http://www.di.unipi.it/~gulli/AG_corpus_of_news_articles.html
 The AG's news topic classification dataset is constructed by Xiang Zhang from the dataset
above. It is used as a text classification benchmark in the following paper: Xiang Zhang, Junbo
Zhao, Yann LeCun. Character-level Convolutional Networks for Text Classification
Dataset
 The AG's news topic classification dataset is constructed by choosing 4 largest
classes from the original corpus:
 World
 Sports
 Business
 Sci/Tech
Each class contains 30,000 training samples and 1,900 testing samples.
The total number of training samples is 120,000 and testing 7,600.
Dataset
Alcuni esempi
 "4“ , "Calif. Aims to Limit Farm-Related Smog (AP)“ , "AP - Southern California's smog-fighting agency went
after emissions of the bovine variety Friday, adopting the nation's first rules to reduce air pollution from dairy cow ma
 "1“ , "Panama-Cuba 'pardon' row worsens“ , "Panama recalls its Havana ambassador after Cuba threatened
to cut ties if jailed anti-Castro activists are pardoned."nure.“
 "2“ , "Dickens Departs“ , "Tony Dickens resigns as head coach at Northwestern six months after leading
the Wildcats to the Maryland 4A boys basketball title.“
 "3“ , "Tata CS celebrates profits uplift“ , "Indian software giant Tata CS unveils sharply higher profits in its
first set of results since its stock market launch."
Dataset
 Bixby NLU
 L’Insieme di frasi usato per addestrare Bixby a capire l’intenzione
dell’utente
 Tante classi quante sono le «Capsule»,
l’analogo delle Skill di Alexa o le Actions di Google
Esempi:
- «ci sono eventi a parco sempione?»
- «aggiungi un appuntamento in ufficio»
- «qual è la tua squadra di calcio preferita»
- «cancella le email di oggi»
- «aggiungi questo brano alla lista dei favoriti»
Dataset
 Diverse versioni del dataset:
 Originale: 88 classi
 Accorpamento di classi di azioni tra le più simili: 61 cassi
 Successivo accorpamento e selezione di classi più rappresentative: 20 classi
Il dataset non è bilanciato, alcune capsule hanno più frasi di altre
Modello
 Il testo in input viene convertito, lettera per lettera, in vettori di
dimensione 69...
”abcdefghijklmnopqrstuvwxyz0123456789
-,;.!?:’"/| #$%ˆ&*˜‘+=<>()[]{}”
 ...e immediatamente ridotto con embedding a 16
 Input non più lungo di 1024 caratteri (padding)
~ più di 100 parole!
Modello
 64 filtri iniziali (kernels) di dimensione 3
 Blocchi convoluzionali con numero di filtri che raddoppiano
dopo il dimezzamento dovuto al pooling, per mantenere
costante la dimensione della feature map di ciascun layer
if depth == 9:
self.num_conv_block = [1, 1, 1, 1]
elif depth == 17:
self.num_conv_block = [2, 2, 2, 2]
elif depth == 29:
self.num_conv_block = [5, 5, 2, 2]
elif depth == 49:
self.num_conv_block = [8, 8, 5, 3]
Modello
 La maggior parte delle applicazioni di reti convoluzionali all’NLP usano architetture
abbastanza “shallow”, e usano filtri di varia dimensione
(3, 5, 7), al fine di estrarre features tipo N-grammi, con N sufficientemente grande da
abbracciare relazioni tra parole lontante
 Questo paper dimostra che è possibile modellare queste relazioni lontane, sfruttando
piccole convoluzioni (filtri a 3) attraverso un gran numero di livelli, quindi sfruttando la
profondità…
 Impilare 4 layer risulta in un intervallo di 9 elementi, e la rete impara da sola come
combinare al meglio le feature tipo 3-grammi in modo gerarchico.
 Questa architettura si può intendere come l’adattamento al testo della nota rete VGG
che ha dato eccellenti risultati nel riconoscimento delle immagini
Training
 Codice preso da https://github.com/vietnguyen91/Very-deep-cnn-tensorflow
che implementa fedelmente l’articolo
 Implementazione dell’articolo:
learning rate: 0.01
batch size: 128
dichiara di raggiungere convergenza del training dopo 10-15 epoche.
E’ stata usata un GPU K40, almeno 24 minuti per epoca
 Nostra implementazione
learning rate: 0.0005,
batch size: 256 (ove possibile)
Abbiamo usato una GPU Tesla V100, 2 minuti e mezzo per epoca (AG news)
Training: risultati AG news
9 layer 29 layer17 layer
Training: risultati Bixby NLU
88 classi 61 classi
Learning rate
0.001
29 layer
Training: risultati Bixby NLU
Learning rate
0.0005
29 layer
61 classi
Training: risultati Bixby NLU
Bixby
20 classi
29 layer 9 layer
Training: risultati Bixby NLU
Bixby
20 classi
49 layerBatch 16 Batch 128
Training: risultati Bixby NLU
Bixby
20 classi
49 layer
Batch 128
La VDCNN raggiunge
~93% accuracy
zoom

More Related Content

Similar to Vdcnn daniele meetup_27_june

How I did it (in .NET): idiomatic Domain Driven Design
How I did it (in .NET): idiomatic Domain Driven DesignHow I did it (in .NET): idiomatic Domain Driven Design
How I did it (in .NET): idiomatic Domain Driven DesignAndrea Saltarello
 
Syntactical errors detection 2
Syntactical errors detection 2Syntactical errors detection 2
Syntactical errors detection 2LucaPostiglione2
 
Domain Driven Design e CQRS
Domain Driven Design e CQRSDomain Driven Design e CQRS
Domain Driven Design e CQRSManuel Scapolan
 
Working between the clouds
Working between the cloudsWorking between the clouds
Working between the cloudsDavide Cerbo
 
Programmazione mobile: ANDROID
Programmazione mobile: ANDROIDProgrammazione mobile: ANDROID
Programmazione mobile: ANDROIDPaolo Tosato
 
Advanced Database Models and Architectures: Big Data: MySQL VS MongoDB
Advanced Database Models and Architectures: Big Data: MySQL VS MongoDBAdvanced Database Models and Architectures: Big Data: MySQL VS MongoDB
Advanced Database Models and Architectures: Big Data: MySQL VS MongoDBLuca Marignati
 
Machine learning models continuous deployment on azure using devops
Machine learning models continuous deployment on azure using devopsMachine learning models continuous deployment on azure using devops
Machine learning models continuous deployment on azure using devopsIgor Antonacci
 
Configurazione automatica di ambienti di testing per reti di calcolatori - te...
Configurazione automatica di ambienti di testing per reti di calcolatori - te...Configurazione automatica di ambienti di testing per reti di calcolatori - te...
Configurazione automatica di ambienti di testing per reti di calcolatori - te...Bruno Interlandi
 
Digital 1nn0vation saturday pn 2019 - ML.NET
Digital 1nn0vation saturday pn 2019 - ML.NETDigital 1nn0vation saturday pn 2019 - ML.NET
Digital 1nn0vation saturday pn 2019 - ML.NETMarco Zamana
 
Profilazione di applicazioni PHP con XHProf.
Profilazione di applicazioni PHP con XHProf.Profilazione di applicazioni PHP con XHProf.
Profilazione di applicazioni PHP con XHProf.Filippo Matteo Riggio
 
Modello Puzzle per l'AppQuiz
Modello Puzzle per l'AppQuizModello Puzzle per l'AppQuiz
Modello Puzzle per l'AppQuizinformistica
 
Progetto e sviluppo di un sistema di rilevamento di anomalie su sistemi infor...
Progetto e sviluppo di un sistema di rilevamento di anomalie su sistemi infor...Progetto e sviluppo di un sistema di rilevamento di anomalie su sistemi infor...
Progetto e sviluppo di un sistema di rilevamento di anomalie su sistemi infor...MichaelFuser
 
Sperimentazione di Tecnologie di Deep Learning su Sistemi Embedded
Sperimentazione di Tecnologie di Deep Learning su Sistemi EmbeddedSperimentazione di Tecnologie di Deep Learning su Sistemi Embedded
Sperimentazione di Tecnologie di Deep Learning su Sistemi EmbeddedMathiasPoloPerucchin
 
Never Mind the Bollocks: here's the Domain Driven Design
Never Mind the Bollocks: here's the Domain Driven DesignNever Mind the Bollocks: here's the Domain Driven Design
Never Mind the Bollocks: here's the Domain Driven DesignAndrea Saltarello
 

Similar to Vdcnn daniele meetup_27_june (20)

How I did it (in .NET): idiomatic Domain Driven Design
How I did it (in .NET): idiomatic Domain Driven DesignHow I did it (in .NET): idiomatic Domain Driven Design
How I did it (in .NET): idiomatic Domain Driven Design
 
Syntactical errors detection 2
Syntactical errors detection 2Syntactical errors detection 2
Syntactical errors detection 2
 
Bootstrap
BootstrapBootstrap
Bootstrap
 
Domain Driven Design e CQRS
Domain Driven Design e CQRSDomain Driven Design e CQRS
Domain Driven Design e CQRS
 
Working between the clouds
Working between the cloudsWorking between the clouds
Working between the clouds
 
Programmazione mobile: ANDROID
Programmazione mobile: ANDROIDProgrammazione mobile: ANDROID
Programmazione mobile: ANDROID
 
Advanced Database Models and Architectures: Big Data: MySQL VS MongoDB
Advanced Database Models and Architectures: Big Data: MySQL VS MongoDBAdvanced Database Models and Architectures: Big Data: MySQL VS MongoDB
Advanced Database Models and Architectures: Big Data: MySQL VS MongoDB
 
Machine learning models continuous deployment on azure using devops
Machine learning models continuous deployment on azure using devopsMachine learning models continuous deployment on azure using devops
Machine learning models continuous deployment on azure using devops
 
Sentiment analysis
Sentiment analysisSentiment analysis
Sentiment analysis
 
Terza lezioneandroid
Terza lezioneandroidTerza lezioneandroid
Terza lezioneandroid
 
IC2008 Introduzione Did You Know?
IC2008 Introduzione Did You Know?IC2008 Introduzione Did You Know?
IC2008 Introduzione Did You Know?
 
Configurazione automatica di ambienti di testing per reti di calcolatori - te...
Configurazione automatica di ambienti di testing per reti di calcolatori - te...Configurazione automatica di ambienti di testing per reti di calcolatori - te...
Configurazione automatica di ambienti di testing per reti di calcolatori - te...
 
Digital 1nn0vation saturday pn 2019 - ML.NET
Digital 1nn0vation saturday pn 2019 - ML.NETDigital 1nn0vation saturday pn 2019 - ML.NET
Digital 1nn0vation saturday pn 2019 - ML.NET
 
Profilazione di applicazioni PHP con XHProf.
Profilazione di applicazioni PHP con XHProf.Profilazione di applicazioni PHP con XHProf.
Profilazione di applicazioni PHP con XHProf.
 
Modello Puzzle per l'AppQuiz
Modello Puzzle per l'AppQuizModello Puzzle per l'AppQuiz
Modello Puzzle per l'AppQuiz
 
Progetti per l'esame negli ITIS
Progetti per l'esame negli ITISProgetti per l'esame negli ITIS
Progetti per l'esame negli ITIS
 
Database Data Aggregator
Database Data AggregatorDatabase Data Aggregator
Database Data Aggregator
 
Progetto e sviluppo di un sistema di rilevamento di anomalie su sistemi infor...
Progetto e sviluppo di un sistema di rilevamento di anomalie su sistemi infor...Progetto e sviluppo di un sistema di rilevamento di anomalie su sistemi infor...
Progetto e sviluppo di un sistema di rilevamento di anomalie su sistemi infor...
 
Sperimentazione di Tecnologie di Deep Learning su Sistemi Embedded
Sperimentazione di Tecnologie di Deep Learning su Sistemi EmbeddedSperimentazione di Tecnologie di Deep Learning su Sistemi Embedded
Sperimentazione di Tecnologie di Deep Learning su Sistemi Embedded
 
Never Mind the Bollocks: here's the Domain Driven Design
Never Mind the Bollocks: here's the Domain Driven DesignNever Mind the Bollocks: here's the Domain Driven Design
Never Mind the Bollocks: here's the Domain Driven Design
 

More from Deep Learning Italia

Machine Learning driven Quantum Optimization for Marketing
Machine Learning driven Quantum Optimization for MarketingMachine Learning driven Quantum Optimization for Marketing
Machine Learning driven Quantum Optimization for MarketingDeep Learning Italia
 
Modelli linguistici da Eliza a ChatGPT P roblemi , fraintendimenti e prospettive
Modelli linguistici da Eliza a ChatGPT P roblemi , fraintendimenti e prospettiveModelli linguistici da Eliza a ChatGPT P roblemi , fraintendimenti e prospettive
Modelli linguistici da Eliza a ChatGPT P roblemi , fraintendimenti e prospettiveDeep Learning Italia
 
Transformers In Vision From Zero to Hero (DLI).pptx
Transformers In Vision From Zero to Hero (DLI).pptxTransformers In Vision From Zero to Hero (DLI).pptx
Transformers In Vision From Zero to Hero (DLI).pptxDeep Learning Italia
 
Meetup Luglio - Operations Research.pdf
Meetup Luglio - Operations Research.pdfMeetup Luglio - Operations Research.pdf
Meetup Luglio - Operations Research.pdfDeep Learning Italia
 
MEETUP APRILE - Ganomaly - Anomaly Detection.pdf
MEETUP APRILE - Ganomaly - Anomaly Detection.pdfMEETUP APRILE - Ganomaly - Anomaly Detection.pdf
MEETUP APRILE - Ganomaly - Anomaly Detection.pdfDeep Learning Italia
 
The science of can and can t e la computazione quantistica
The science of can and can t e la computazione quantisticaThe science of can and can t e la computazione quantistica
The science of can and can t e la computazione quantisticaDeep Learning Italia
 
Pi school-dli-presentation de nobili
Pi school-dli-presentation de nobiliPi school-dli-presentation de nobili
Pi school-dli-presentation de nobiliDeep Learning Italia
 
Machine Learning Explanations: LIME framework
Machine Learning Explanations: LIME framework Machine Learning Explanations: LIME framework
Machine Learning Explanations: LIME framework Deep Learning Italia
 
Explanation methods for Artificial Intelligence Models
Explanation methods for Artificial Intelligence ModelsExplanation methods for Artificial Intelligence Models
Explanation methods for Artificial Intelligence ModelsDeep Learning Italia
 
Use Cases Machine Learning for Healthcare
Use Cases Machine Learning for HealthcareUse Cases Machine Learning for Healthcare
Use Cases Machine Learning for HealthcareDeep Learning Italia
 
NLG, Training, Inference & Evaluation
NLG, Training, Inference & Evaluation NLG, Training, Inference & Evaluation
NLG, Training, Inference & Evaluation Deep Learning Italia
 
Transformer Seq2Sqe Models: Concepts, Trends & Limitations (DLI)
Transformer Seq2Sqe Models: Concepts, Trends & Limitations (DLI)Transformer Seq2Sqe Models: Concepts, Trends & Limitations (DLI)
Transformer Seq2Sqe Models: Concepts, Trends & Limitations (DLI)Deep Learning Italia
 
Towards quantum machine learning calogero zarbo - meet up
Towards quantum machine learning  calogero zarbo - meet upTowards quantum machine learning  calogero zarbo - meet up
Towards quantum machine learning calogero zarbo - meet upDeep Learning Italia
 
Macaluso antonio meetup dli 2020-12-15
Macaluso antonio  meetup dli 2020-12-15Macaluso antonio  meetup dli 2020-12-15
Macaluso antonio meetup dli 2020-12-15Deep Learning Italia
 

More from Deep Learning Italia (20)

Machine Learning driven Quantum Optimization for Marketing
Machine Learning driven Quantum Optimization for MarketingMachine Learning driven Quantum Optimization for Marketing
Machine Learning driven Quantum Optimization for Marketing
 
Modelli linguistici da Eliza a ChatGPT P roblemi , fraintendimenti e prospettive
Modelli linguistici da Eliza a ChatGPT P roblemi , fraintendimenti e prospettiveModelli linguistici da Eliza a ChatGPT P roblemi , fraintendimenti e prospettive
Modelli linguistici da Eliza a ChatGPT P roblemi , fraintendimenti e prospettive
 
Transformers In Vision From Zero to Hero (DLI).pptx
Transformers In Vision From Zero to Hero (DLI).pptxTransformers In Vision From Zero to Hero (DLI).pptx
Transformers In Vision From Zero to Hero (DLI).pptx
 
Meetup Luglio - Operations Research.pdf
Meetup Luglio - Operations Research.pdfMeetup Luglio - Operations Research.pdf
Meetup Luglio - Operations Research.pdf
 
Meetup Giugno - c-ResUNET.pdf
Meetup Giugno - c-ResUNET.pdfMeetup Giugno - c-ResUNET.pdf
Meetup Giugno - c-ResUNET.pdf
 
MEETUP Maggio - Team Automata
MEETUP Maggio - Team AutomataMEETUP Maggio - Team Automata
MEETUP Maggio - Team Automata
 
MEETUP APRILE - Ganomaly - Anomaly Detection.pdf
MEETUP APRILE - Ganomaly - Anomaly Detection.pdfMEETUP APRILE - Ganomaly - Anomaly Detection.pdf
MEETUP APRILE - Ganomaly - Anomaly Detection.pdf
 
2022_Meetup_Mazza-Marzo.pptx
2022_Meetup_Mazza-Marzo.pptx2022_Meetup_Mazza-Marzo.pptx
2022_Meetup_Mazza-Marzo.pptx
 
Machine Learning Security
Machine Learning SecurityMachine Learning Security
Machine Learning Security
 
The science of can and can t e la computazione quantistica
The science of can and can t e la computazione quantisticaThe science of can and can t e la computazione quantistica
The science of can and can t e la computazione quantistica
 
Dli meetup moccia
Dli meetup mocciaDli meetup moccia
Dli meetup moccia
 
Pi school-dli-presentation de nobili
Pi school-dli-presentation de nobiliPi school-dli-presentation de nobili
Pi school-dli-presentation de nobili
 
Machine Learning Explanations: LIME framework
Machine Learning Explanations: LIME framework Machine Learning Explanations: LIME framework
Machine Learning Explanations: LIME framework
 
Explanation methods for Artificial Intelligence Models
Explanation methods for Artificial Intelligence ModelsExplanation methods for Artificial Intelligence Models
Explanation methods for Artificial Intelligence Models
 
Use Cases Machine Learning for Healthcare
Use Cases Machine Learning for HealthcareUse Cases Machine Learning for Healthcare
Use Cases Machine Learning for Healthcare
 
NLG, Training, Inference & Evaluation
NLG, Training, Inference & Evaluation NLG, Training, Inference & Evaluation
NLG, Training, Inference & Evaluation
 
Transformer Seq2Sqe Models: Concepts, Trends & Limitations (DLI)
Transformer Seq2Sqe Models: Concepts, Trends & Limitations (DLI)Transformer Seq2Sqe Models: Concepts, Trends & Limitations (DLI)
Transformer Seq2Sqe Models: Concepts, Trends & Limitations (DLI)
 
Towards quantum machine learning calogero zarbo - meet up
Towards quantum machine learning  calogero zarbo - meet upTowards quantum machine learning  calogero zarbo - meet up
Towards quantum machine learning calogero zarbo - meet up
 
Macaluso antonio meetup dli 2020-12-15
Macaluso antonio  meetup dli 2020-12-15Macaluso antonio  meetup dli 2020-12-15
Macaluso antonio meetup dli 2020-12-15
 
Data privacy e anonymization in R
Data privacy e anonymization in RData privacy e anonymization in R
Data privacy e anonymization in R
 

Vdcnn daniele meetup_27_june

  • 1. VDCNN STUDIO E CONFRONTO Daniele D’Armiento Fisico Harman/Samsung
  • 4. Dataset  AG’s news  AG is a collection of more than 1 million news articles, gathered from more than 2000 news sources by ComeToMyHead, an academic news search engine. The dataset is provided by the academic comunity for research purposes. For more information, please refer to the link http://www.di.unipi.it/~gulli/AG_corpus_of_news_articles.html  The AG's news topic classification dataset is constructed by Xiang Zhang from the dataset above. It is used as a text classification benchmark in the following paper: Xiang Zhang, Junbo Zhao, Yann LeCun. Character-level Convolutional Networks for Text Classification
  • 5. Dataset  The AG's news topic classification dataset is constructed by choosing 4 largest classes from the original corpus:  World  Sports  Business  Sci/Tech Each class contains 30,000 training samples and 1,900 testing samples. The total number of training samples is 120,000 and testing 7,600.
  • 6. Dataset Alcuni esempi  "4“ , "Calif. Aims to Limit Farm-Related Smog (AP)“ , "AP - Southern California's smog-fighting agency went after emissions of the bovine variety Friday, adopting the nation's first rules to reduce air pollution from dairy cow ma  "1“ , "Panama-Cuba 'pardon' row worsens“ , "Panama recalls its Havana ambassador after Cuba threatened to cut ties if jailed anti-Castro activists are pardoned."nure.“  "2“ , "Dickens Departs“ , "Tony Dickens resigns as head coach at Northwestern six months after leading the Wildcats to the Maryland 4A boys basketball title.“  "3“ , "Tata CS celebrates profits uplift“ , "Indian software giant Tata CS unveils sharply higher profits in its first set of results since its stock market launch."
  • 7. Dataset  Bixby NLU  L’Insieme di frasi usato per addestrare Bixby a capire l’intenzione dell’utente  Tante classi quante sono le «Capsule», l’analogo delle Skill di Alexa o le Actions di Google Esempi: - «ci sono eventi a parco sempione?» - «aggiungi un appuntamento in ufficio» - «qual è la tua squadra di calcio preferita» - «cancella le email di oggi» - «aggiungi questo brano alla lista dei favoriti»
  • 8. Dataset  Diverse versioni del dataset:  Originale: 88 classi  Accorpamento di classi di azioni tra le più simili: 61 cassi  Successivo accorpamento e selezione di classi più rappresentative: 20 classi Il dataset non è bilanciato, alcune capsule hanno più frasi di altre
  • 9. Modello  Il testo in input viene convertito, lettera per lettera, in vettori di dimensione 69... ”abcdefghijklmnopqrstuvwxyz0123456789 -,;.!?:’"/| #$%ˆ&*˜‘+=<>()[]{}”  ...e immediatamente ridotto con embedding a 16  Input non più lungo di 1024 caratteri (padding) ~ più di 100 parole!
  • 10. Modello  64 filtri iniziali (kernels) di dimensione 3  Blocchi convoluzionali con numero di filtri che raddoppiano dopo il dimezzamento dovuto al pooling, per mantenere costante la dimensione della feature map di ciascun layer if depth == 9: self.num_conv_block = [1, 1, 1, 1] elif depth == 17: self.num_conv_block = [2, 2, 2, 2] elif depth == 29: self.num_conv_block = [5, 5, 2, 2] elif depth == 49: self.num_conv_block = [8, 8, 5, 3]
  • 11. Modello  La maggior parte delle applicazioni di reti convoluzionali all’NLP usano architetture abbastanza “shallow”, e usano filtri di varia dimensione (3, 5, 7), al fine di estrarre features tipo N-grammi, con N sufficientemente grande da abbracciare relazioni tra parole lontante  Questo paper dimostra che è possibile modellare queste relazioni lontane, sfruttando piccole convoluzioni (filtri a 3) attraverso un gran numero di livelli, quindi sfruttando la profondità…  Impilare 4 layer risulta in un intervallo di 9 elementi, e la rete impara da sola come combinare al meglio le feature tipo 3-grammi in modo gerarchico.  Questa architettura si può intendere come l’adattamento al testo della nota rete VGG che ha dato eccellenti risultati nel riconoscimento delle immagini
  • 12. Training  Codice preso da https://github.com/vietnguyen91/Very-deep-cnn-tensorflow che implementa fedelmente l’articolo  Implementazione dell’articolo: learning rate: 0.01 batch size: 128 dichiara di raggiungere convergenza del training dopo 10-15 epoche. E’ stata usata un GPU K40, almeno 24 minuti per epoca  Nostra implementazione learning rate: 0.0005, batch size: 256 (ove possibile) Abbiamo usato una GPU Tesla V100, 2 minuti e mezzo per epoca (AG news)
  • 13. Training: risultati AG news 9 layer 29 layer17 layer
  • 14. Training: risultati Bixby NLU 88 classi 61 classi Learning rate 0.001 29 layer
  • 15. Training: risultati Bixby NLU Learning rate 0.0005 29 layer 61 classi
  • 16. Training: risultati Bixby NLU Bixby 20 classi 29 layer 9 layer
  • 17. Training: risultati Bixby NLU Bixby 20 classi 49 layerBatch 16 Batch 128
  • 18. Training: risultati Bixby NLU Bixby 20 classi 49 layer Batch 128 La VDCNN raggiunge ~93% accuracy zoom