SlideShare a Scribd company logo
1 of 14
Download to read offline
Perché comprimere una Rete Neurale ?
Un aggiornamento sull’attività Compression of neural networks for multimedia
content description and analysis (ISO/IEC 15938-17) in MPEG
Diego Gibellino
TIM - Chief Technology and Innovation Office| Video Services
Un caso d’uso: Adaptive Bitrate Streaming
Banda
Buffer
Rete
Neurale
per ABR
Bitrate
corrente
Client
Aggiornamento
App
Aggiornamento
Modello RN
Origin
Video
Server
CDN
Un caso d’uso: Pubblica Sicurezza
Rete
Neurale
Aggiornamento massivo del
Modello RN
Customizzazione del
modello RN in base alle
caratteristiche dell’ambiente
operativo
Un passaggio necessario
Da servizi e prodotti Data Center-centrici o
sviluppi verticali on-chip…
…alla possibilità di distribuire ed
aggiornare modelli basati su reti neurali
attraverso le reti di telecomunicazione
Il problema
Le tecniche di Deep Learning utilizzano reti
neurali di grandi dimensioni:
• Molti layer con nodi e connessioni
• Parametri/pesi associati
230
240
550
1800
0 500 1000 1500 2000
RESNET
YOLO
VGG
DEEPSPEECH
Dimensione di alcuni modelli di RN
comunemente utilizzati (MB)
Da “it works”… a “use it everywhere”
Addestramento
• “impara” parametri e pesi dai dati
• Effettuato tipicamente una sola volta, su server potenti e dedicati (disponibilità GPU)
• possono essere necessari aggiornamenti o customizzazioni del modello
Inferenza
• Utilizza la rete addestrata per effettuare predizioni su dati reali
• Richiede che tutti i parametri della rete vengano trasmessi e processati → obiettivo: minimizzare la
dimensione dei dati
• Spesso viene effettuata su dispositivi con risorse limitate (mobile phones, smart cameras, edge nodes, …) →
obiettivo: requisiti di memoria e complessità computazionale minimi
Le attività in MPEG
• Definizione di una rappresentazione compressa ed interoperabile di
reti neurali
• Basata sul know-how acquisito da MPEG in oltre 30 anni di attività nel
campo della compressione dati (media e metadata)
• Abilita l‘uso di tecniche di reti neurali profonde (deep neural
networks) nelle applicazioni multimediali degli utenti
• Ampio spettro di use case:
• image classification, visual content matching, content coding and audio
classification,…
Timeline
Jul. 2018
Call for
Evidence
Oct. 2018
Call for Proposals
Mar. 2019
Evaluation of
responses starts
Apr. 2020
CD
Oct. 2020
DIS
Apr. 2021
FDIS
Oct. 2021
IS
Core experiments
Call for Proposals
• Rappresentazione di diverse tipologie di reti neurali (reti feedforward
come CNN e autoencoder, recurrent networks come LSTM, ecc.)
• Inferenza possibile anche senza la ricostruzione dell’intera rete
neurale originale
• Ottimizzazione utilizzo reti neurali su device con risorse limitate
(computazionali, di memoria o banda)
• La Call copre un insieme di requisiti base
• Ulteriori funzionalità, come rappresentazioni incrementali, saranno
introdotte in una seconda fase
• 9 Proposte ricevute: analisi e valutazione
I prossimi passi
• Core experiments
• Pruning/sparsification
• Weight approximation
• Entropy coding
• Test che combinano le diverse tecniche proposte per la Call for
Proposals
• Definizione di un “common test model” per l’avvio della fase di
sviluppo cooperativo per il futuro standard
Un gioco di squadra
Partecipazione a
Workshop ML/AI:
• NeurIPS 2018
• ICML 2019
Liaison con
• ISO/IEC SC42 (Artificial Intelligence)
• ITU-T Focus Group on Machine Learning for Future
Networks including 5G (ML5G)
Interazioni con i gruppi che stanno
attualmente definendo i file format
per reti neurali:
• Khronos NNEF
• ONNX
Grazie!
Diego Gibellino
Special thanks to Werner Bailer, Joanneum Research
This work is licensed under a Creative Commons Attribution-NonCommercial-
NoDerivs 3.0 Unported License

More Related Content

Similar to 2019-06-14:2 - Perchè comprimere una rete neurale?

Introduzione Cloud Computing
Introduzione Cloud ComputingIntroduzione Cloud Computing
Introduzione Cloud Computing
steccami
 
Integrazione e sviluppo di una piattaforma per la gestione delle conformità a...
Integrazione e sviluppo di una piattaforma per la gestione delle conformità a...Integrazione e sviluppo di una piattaforma per la gestione delle conformità a...
Integrazione e sviluppo di una piattaforma per la gestione delle conformità a...
Alessandro Umek
 
Il Cloud Computing
Il Cloud ComputingIl Cloud Computing
Il Cloud Computing
zambe92
 
Cloud for sap evento15.4
Cloud for sap evento15.4Cloud for sap evento15.4
Cloud for sap evento15.4
Otello Costa
 
CloudInAction Innovazione Semplice - Marco Salvagno - Kelyan
CloudInAction Innovazione Semplice - Marco Salvagno - KelyanCloudInAction Innovazione Semplice - Marco Salvagno - Kelyan
CloudInAction Innovazione Semplice - Marco Salvagno - Kelyan
Clouditalia Telecomunicazioni
 

Similar to 2019-06-14:2 - Perchè comprimere una rete neurale? (20)

Panduit a TBIZ2011
Panduit a TBIZ2011Panduit a TBIZ2011
Panduit a TBIZ2011
 
Introduzione Cloud Computing
Introduzione Cloud ComputingIntroduzione Cloud Computing
Introduzione Cloud Computing
 
Integrazione e sviluppo di una piattaforma per la gestione delle conformità a...
Integrazione e sviluppo di una piattaforma per la gestione delle conformità a...Integrazione e sviluppo di una piattaforma per la gestione delle conformità a...
Integrazione e sviluppo di una piattaforma per la gestione delle conformità a...
 
Il Cloud Computing
Il Cloud ComputingIl Cloud Computing
Il Cloud Computing
 
Cloud Storage, Gestire i propri costi facendo leva sui servizi di cloud priva...
Cloud Storage, Gestire i propri costi facendo leva sui servizi di cloud priva...Cloud Storage, Gestire i propri costi facendo leva sui servizi di cloud priva...
Cloud Storage, Gestire i propri costi facendo leva sui servizi di cloud priva...
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 
Big Data e la forza degli eventi - Intervento di Dominoni
Big Data e la forza degli eventi - Intervento di DominoniBig Data e la forza degli eventi - Intervento di Dominoni
Big Data e la forza degli eventi - Intervento di Dominoni
 
Cloud Computing Motore Dell Innovazione I C T
Cloud Computing Motore Dell Innovazione  I C TCloud Computing Motore Dell Innovazione  I C T
Cloud Computing Motore Dell Innovazione I C T
 
Analysis and Characterization of Devices and Protocol Stacks for the Internet...
Analysis and Characterization of Devices and Protocol Stacks for the Internet...Analysis and Characterization of Devices and Protocol Stacks for the Internet...
Analysis and Characterization of Devices and Protocol Stacks for the Internet...
 
Cloud for sap evento15.4
Cloud for sap evento15.4Cloud for sap evento15.4
Cloud for sap evento15.4
 
Sperimentazione di Tecnologie di Deep Learning su Sistemi Embedded
Sperimentazione di Tecnologie di Deep Learning su Sistemi EmbeddedSperimentazione di Tecnologie di Deep Learning su Sistemi Embedded
Sperimentazione di Tecnologie di Deep Learning su Sistemi Embedded
 
Lezioni 2009
Lezioni 2009Lezioni 2009
Lezioni 2009
 
2 - Introduzione a Internet (1/2) - 17/18
2 - Introduzione a Internet (1/2) - 17/182 - Introduzione a Internet (1/2) - 17/18
2 - Introduzione a Internet (1/2) - 17/18
 
Cloud Computing Economia Numeri Mercato
Cloud Computing Economia Numeri MercatoCloud Computing Economia Numeri Mercato
Cloud Computing Economia Numeri Mercato
 
Cloud Computing: La nuvola intelligente 2016
Cloud Computing: La nuvola intelligente 2016Cloud Computing: La nuvola intelligente 2016
Cloud Computing: La nuvola intelligente 2016
 
Il nuovo paradigma del Data-Center
Il nuovo paradigma del Data-CenterIl nuovo paradigma del Data-Center
Il nuovo paradigma del Data-Center
 
Tesi Laurea I Livello - Vaiano
Tesi Laurea I Livello - VaianoTesi Laurea I Livello - Vaiano
Tesi Laurea I Livello - Vaiano
 
GWT 2014: Energy Conference - 03 Network Design & Maintenance per le reti tec...
GWT 2014: Energy Conference - 03 Network Design & Maintenance per le reti tec...GWT 2014: Energy Conference - 03 Network Design & Maintenance per le reti tec...
GWT 2014: Energy Conference - 03 Network Design & Maintenance per le reti tec...
 
CloudInAction Innovazione Semplice - Marco Salvagno - Kelyan
CloudInAction Innovazione Semplice - Marco Salvagno - KelyanCloudInAction Innovazione Semplice - Marco Salvagno - Kelyan
CloudInAction Innovazione Semplice - Marco Salvagno - Kelyan
 
Cloud e big data
Cloud e big dataCloud e big data
Cloud e big data
 

More from uninfoit

More from uninfoit (20)

Pillole di normazione tecnica
Pillole di normazione tecnicaPillole di normazione tecnica
Pillole di normazione tecnica
 
Riunione in AIAD-STAN del 16/12/2020
Riunione in AIAD-STAN del 16/12/2020Riunione in AIAD-STAN del 16/12/2020
Riunione in AIAD-STAN del 16/12/2020
 
Le norme, le PdR e le attività di Normazione Tecnica in corso per "Industry 4.0"
Le norme, le PdR e le attività di Normazione Tecnica in corso per "Industry 4.0"Le norme, le PdR e le attività di Normazione Tecnica in corso per "Industry 4.0"
Le norme, le PdR e le attività di Normazione Tecnica in corso per "Industry 4.0"
 
Italian NeTEx Profile group Kick-off Meeting
Italian NeTEx Profile group Kick-off MeetingItalian NeTEx Profile group Kick-off Meeting
Italian NeTEx Profile group Kick-off Meeting
 
Normazione Tecnica e Industria 4.0
Normazione Tecnica e Industria 4.0Normazione Tecnica e Industria 4.0
Normazione Tecnica e Industria 4.0
 
Assemblea dei Soci UNI del 25 novembre 2019
Assemblea dei Soci UNI del 25 novembre 2019Assemblea dei Soci UNI del 25 novembre 2019
Assemblea dei Soci UNI del 25 novembre 2019
 
Confindustria Salerno 21 novembre 2019
Confindustria Salerno 21 novembre 2019Confindustria Salerno 21 novembre 2019
Confindustria Salerno 21 novembre 2019
 
UNINFO at Z-Fact0r event - Bergamo 10 Ottobre
UNINFO at Z-Fact0r event - Bergamo 10 OttobreUNINFO at Z-Fact0r event - Bergamo 10 Ottobre
UNINFO at Z-Fact0r event - Bergamo 10 Ottobre
 
2019-06-14:7 - Neutral Network Compression
2019-06-14:7 - Neutral Network Compression2019-06-14:7 - Neutral Network Compression
2019-06-14:7 - Neutral Network Compression
 
2019-06-14:6 - Reti neurali e compressione immagine
2019-06-14:6 - Reti neurali e compressione immagine2019-06-14:6 - Reti neurali e compressione immagine
2019-06-14:6 - Reti neurali e compressione immagine
 
2019-06-14:5 - Componenti per reti neurali
2019-06-14:5 - Componenti per reti neurali2019-06-14:5 - Componenti per reti neurali
2019-06-14:5 - Componenti per reti neurali
 
2019-06-14:3 - Reti neurali e compressione video
2019-06-14:3 - Reti neurali e compressione video2019-06-14:3 - Reti neurali e compressione video
2019-06-14:3 - Reti neurali e compressione video
 
24/05/2019 Workshop AIDI-UniFI-UNINFO
24/05/2019 Workshop AIDI-UniFI-UNINFO24/05/2019 Workshop AIDI-UniFI-UNINFO
24/05/2019 Workshop AIDI-UniFI-UNINFO
 
20190314 - Seminario UNINFO Security Summit
20190314 - Seminario UNINFO Security Summit 20190314 - Seminario UNINFO Security Summit
20190314 - Seminario UNINFO Security Summit
 
Normazione Tecnica e DLT @ Digital Innovation - 2019 - San Marino
Normazione Tecnica e DLT @ Digital Innovation - 2019 - San MarinoNormazione Tecnica e DLT @ Digital Innovation - 2019 - San Marino
Normazione Tecnica e DLT @ Digital Innovation - 2019 - San Marino
 
Codice di Condotta e Certificazione
Codice di Condotta e CertificazioneCodice di Condotta e Certificazione
Codice di Condotta e Certificazione
 
Stakeholder meeting per CEN/TC353
Stakeholder meeting per CEN/TC353Stakeholder meeting per CEN/TC353
Stakeholder meeting per CEN/TC353
 
Conferenza Nazionale NIS e GDPR - Tor Vergata
Conferenza Nazionale NIS e GDPR - Tor VergataConferenza Nazionale NIS e GDPR - Tor Vergata
Conferenza Nazionale NIS e GDPR - Tor Vergata
 
Normazione Tecnica per Tecnologie Additive
Normazione Tecnica per Tecnologie AdditiveNormazione Tecnica per Tecnologie Additive
Normazione Tecnica per Tecnologie Additive
 
Squillace - Convegno su Sicurezza hardware nei sistemi digitali
Squillace - Convegno su Sicurezza hardware nei sistemi digitaliSquillace - Convegno su Sicurezza hardware nei sistemi digitali
Squillace - Convegno su Sicurezza hardware nei sistemi digitali
 

2019-06-14:2 - Perchè comprimere una rete neurale?

  • 1. Perché comprimere una Rete Neurale ? Un aggiornamento sull’attività Compression of neural networks for multimedia content description and analysis (ISO/IEC 15938-17) in MPEG Diego Gibellino TIM - Chief Technology and Innovation Office| Video Services
  • 2.
  • 3. Un caso d’uso: Adaptive Bitrate Streaming Banda Buffer Rete Neurale per ABR Bitrate corrente Client Aggiornamento App Aggiornamento Modello RN Origin Video Server CDN
  • 4. Un caso d’uso: Pubblica Sicurezza Rete Neurale Aggiornamento massivo del Modello RN Customizzazione del modello RN in base alle caratteristiche dell’ambiente operativo
  • 5. Un passaggio necessario Da servizi e prodotti Data Center-centrici o sviluppi verticali on-chip… …alla possibilità di distribuire ed aggiornare modelli basati su reti neurali attraverso le reti di telecomunicazione
  • 6. Il problema Le tecniche di Deep Learning utilizzano reti neurali di grandi dimensioni: • Molti layer con nodi e connessioni • Parametri/pesi associati 230 240 550 1800 0 500 1000 1500 2000 RESNET YOLO VGG DEEPSPEECH Dimensione di alcuni modelli di RN comunemente utilizzati (MB)
  • 7.
  • 8. Da “it works”… a “use it everywhere” Addestramento • “impara” parametri e pesi dai dati • Effettuato tipicamente una sola volta, su server potenti e dedicati (disponibilità GPU) • possono essere necessari aggiornamenti o customizzazioni del modello Inferenza • Utilizza la rete addestrata per effettuare predizioni su dati reali • Richiede che tutti i parametri della rete vengano trasmessi e processati → obiettivo: minimizzare la dimensione dei dati • Spesso viene effettuata su dispositivi con risorse limitate (mobile phones, smart cameras, edge nodes, …) → obiettivo: requisiti di memoria e complessità computazionale minimi
  • 9. Le attività in MPEG • Definizione di una rappresentazione compressa ed interoperabile di reti neurali • Basata sul know-how acquisito da MPEG in oltre 30 anni di attività nel campo della compressione dati (media e metadata) • Abilita l‘uso di tecniche di reti neurali profonde (deep neural networks) nelle applicazioni multimediali degli utenti • Ampio spettro di use case: • image classification, visual content matching, content coding and audio classification,…
  • 10. Timeline Jul. 2018 Call for Evidence Oct. 2018 Call for Proposals Mar. 2019 Evaluation of responses starts Apr. 2020 CD Oct. 2020 DIS Apr. 2021 FDIS Oct. 2021 IS Core experiments
  • 11. Call for Proposals • Rappresentazione di diverse tipologie di reti neurali (reti feedforward come CNN e autoencoder, recurrent networks come LSTM, ecc.) • Inferenza possibile anche senza la ricostruzione dell’intera rete neurale originale • Ottimizzazione utilizzo reti neurali su device con risorse limitate (computazionali, di memoria o banda) • La Call copre un insieme di requisiti base • Ulteriori funzionalità, come rappresentazioni incrementali, saranno introdotte in una seconda fase • 9 Proposte ricevute: analisi e valutazione
  • 12. I prossimi passi • Core experiments • Pruning/sparsification • Weight approximation • Entropy coding • Test che combinano le diverse tecniche proposte per la Call for Proposals • Definizione di un “common test model” per l’avvio della fase di sviluppo cooperativo per il futuro standard
  • 13. Un gioco di squadra Partecipazione a Workshop ML/AI: • NeurIPS 2018 • ICML 2019 Liaison con • ISO/IEC SC42 (Artificial Intelligence) • ITU-T Focus Group on Machine Learning for Future Networks including 5G (ML5G) Interazioni con i gruppi che stanno attualmente definendo i file format per reti neurali: • Khronos NNEF • ONNX
  • 14. Grazie! Diego Gibellino Special thanks to Werner Bailer, Joanneum Research This work is licensed under a Creative Commons Attribution-NonCommercial- NoDerivs 3.0 Unported License