SlideShare a Scribd company logo
1 of 17
Download to read offline
Open	
  data	
  e	
  acquisti	
  della	
  
pubblica	
  amministrazione:	
  analisi	
  
delle	
  università	
  italiane	
  
Francesco	
  Cavazzana	
  
Tutti	
  i	
  dati	
  sugli	
  acquisti	
  pubblici	
  devono	
  
essere	
  pubblici	
  –	
  Legge	
  190/2012	
  
Ê  Entro	
  il	
  31	
  gennaio	
  di	
  ogni	
  anno,	
  tali	
  informazioni,	
  
relativamente	
  all'anno	
  precedente,	
  sono	
  pubblicate	
  in	
  
Ê  	
  tabelle	
  riassuntive	
  rese	
  liberamente	
  scaricabili	
  
Ê  	
  in	
  un	
  formato	
  digitale	
  standard	
  aperto	
  	
  
Ê  che	
  consenta	
  di	
  analizzare	
  e	
  rielaborare,	
  anche	
  a	
  fini	
  
statistici,	
  i	
  dati	
  informatici.	
  	
  
Ê  L’Autorità	
  competente	
  (AVCP	
  –	
  ANAC)	
  ha	
  stabilito	
  il	
  formato:	
  
Ê  http://dati.avcp.it/schema/datasetAppaltiL190.xsd	
  	
  
Ê  http://dati.avcp.it/schema/datasetIndiceAppaltiL190.xsd	
  
Ê  http://dati.avcp.it/schema/TypesL190.xsd	
  	
  
Principali	
  dati	
  disponibili	
  
Ê  Ogni	
  acquisto	
  dal	
  1/12/12	
  indipendentemente	
  dall’importo	
  
Ê  Descrizione	
  acquisto	
  
Ê  Data	
  inizio	
  e	
  fine	
  fornitura	
  
Ê  Importo	
  aggiudicato	
  e	
  importo	
  liquidato	
  
Ê  Tipo	
  di	
  procedura	
  utilizzata	
  
Ê  Aggiudicatario	
  
Ê  Elenco	
  dei	
  partecipanti	
  alla	
  gara	
  
Possibili	
  utilizzi	
  di	
  questi	
  dati	
  
Ê  Trasparenza	
  
Ê  Anticorruzione	
  
ma	
  anche	
  
Ê  Analisi	
  di	
  benchmark	
  per	
  le	
  amministrazioni	
  pubbliche	
  
Ê  Analisi	
  di	
  mercato	
  
Ê  Monitoraggio	
  della	
  concorrenza	
  
Ê  Individuazione	
  di	
  potenziali	
  clienti	
  (pubblici)	
  
	
  
Obiettivi	
  attesi	
  dell’analisi	
  
Ê  Analisi	
  sul	
  singolo	
  ente	
  e	
  per	
  settore	
  
Ê  Distribuzione	
  degli	
  acquisti	
  per	
  classe	
  di	
  importo	
  
Ê  Analisi	
  di	
  concentrazione	
  e	
  rotazione	
  dei	
  fornitori	
  
Ê  Tipologie	
  di	
  procedura	
  di	
  acquisto	
  utilizzate	
  
Ê  Confronto	
  con	
  un	
  altro	
  settore:	
  capoluoghi	
  di	
  provincia	
  
Ê  Possibili	
  determinanti	
  dei	
  comportamenti:	
  
Ê  Dimensioni	
  
Ê  Posizione	
  geografica	
  
Ê  Individuazione	
  di	
  tipologie	
  tramite	
  clustering	
  
Ê  Paragone	
  tra	
  due	
  periodi:	
  2013	
  e	
  2014	
  	
  
Input	
  -­‐>	
  Output	
  
30.000	
  file	
  XML 	
   	
   	
  	
  	
  	
  	
  	
  à	
  2.000	
  righe	
  per	
  60	
  colonne	
  di	
  analisi	
  +	
  4.000	
  grafici	
  	
  	
  
Dati	
  analizzati	
  
Ê 2	
  anni:	
  2013	
  e	
  2014	
  
Ê 52	
  università	
  (38	
  per	
  il	
  2013,	
  51	
  per	
  il	
  2014)	
  
Ê 10	
  comuni	
  (7	
  per	
  il	
  2013,	
  10	
  per	
  il	
  2014)	
  
Ê 30.087	
  file	
  XML	
  	
  
Ê 528.308	
  acquisti	
  
Ê 3.385.155.669,13	
  €	
  di	
  importo	
  totale	
  
Ê 76.691	
  aziende	
  partecipanti	
  	
  
Metodologia	
  di	
  analisi	
  
Ê Lettura	
   dei	
   file	
   XML	
   e	
   scrittura	
   dei	
   dati	
   in	
   un	
  
database	
   PostgreSQL	
   tramite	
   procedura	
  
appositamente	
  scritta	
  in	
  python	
  
Ê Analisi	
   descrittiva	
   tramite	
   query	
   SQL,	
   librerie	
   di	
  
calcolo	
  scientifico	
  scipy	
  e	
  numpy	
  
Ê Analisi	
  di	
  regressione	
  e	
  clustering	
  con	
  linguaggio	
  
statistico	
  R	
  
Ê Produzione	
  di	
  un	
  file	
  excel	
  riepilogativo	
  con	
  tutte	
  
le	
  analisi	
  ed	
  i	
  grafici	
  per	
  settore	
  e	
  per	
  singolo	
  ente	
  
Analisi	
  descrittiva	
  degli	
  acquisti	
  nelle	
  
università	
  	
  
TOTALE Università 2013 TOTALE Università 2014
Numero università analizzate 38,00 51,00
Numero docenti 35.023,00 43.030,00
Numero acquisti totale 222.666,00 283.479,00
Importo acquisti totale 792.922.368,98 1.135.543.218,93
Numero acquisti/docente 5,10 6,50
Importo acquisti/docente 18.178,79 26.033,82
min 0,00 -585,10
max 20.061.000,00 46.825.234,00
media 3.561,04 4.005,74
mediana 445,16 475,60
deviazione standard 86.774,80 142.860,54
coefficiente di variazione 24,37 35,66
!
Distribuzione	
  numero	
  acquisti	
  /	
  importo	
  
acquisti	
  –	
  Università	
  2014	
  
2014 Università importo % numero %
acquisti 1-2.000 121.501.677,23 € 11% 234.942,00 83%
acquisti 2.000-40.000 305.445.769,22 € 27% 44.605,00 16%
acquisti 40.000-207.000 171.938.235,54 € 15% 2.003,00 1%
acquisti > 207.000 536.659.556,65 € 47% 440,00 0%
totale 1.135.545.238,63 € 281.990,00 €
Distribuzione	
  numero	
  acquisti	
  /	
  importo	
  
acquisti	
  –	
  Comuni	
  2014	
  
2014 Comune importo % numero %
acquisti 1-2.000 3.420.385,79 € 0% 4.706,00 45%
acquisti 2.000-40.000 46.106.848,50 € 7% 4.521,00 44%
acquisti 40.000-207.000 71.311.159,96 € 10% 772,00 7%
acquisti > 207.000 581.296.180,83 € 83% 377,00 4%
totale 702.134.575,08 € 10.376,00
Determinanti	
  1:	
  dimensioni	
  
Ê  Dimensioni:	
  numero	
  docenti	
  come	
  variabile	
  continua	
  o	
  classi	
  di	
  
importo	
  
Ê  Grandezze	
  analizzate:	
  importo	
  medio,	
  importo	
  mediano,	
  %	
  
numero	
  acquisti	
  <	
  2000	
  €,	
  %	
  importo	
  cumulato	
  acquisti	
  <	
  2000	
  €,	
  
importo	
  medio	
  per	
  docente,	
  numero	
  acquisti	
  per	
  docente…	
  
	
  
NON	
  EMERGONO	
  
RELAZIONI	
  LINEARI	
  
SIGNIFICATIVE	
  
Determinanti	
  2:	
  Nord	
  -­‐	
  Centro	
  -­‐	
  Sud	
  
Ê  Le	
  università	
  del	
  Sud	
  si	
  differenziano	
  dalle	
  altre	
  
Ê  L’importo	
  medio	
  degli	
  acquisti	
  è	
  più	
  elevato	
  
Ê  L’importo	
  speso	
  per	
  docente	
  è	
  più	
  basso	
  
Clustering	
  per	
  comportamento	
  di	
  
acquisto	
  
Clustering	
  per	
  comportamento	
  di	
  
acquisto	
  
Ê  INPUT	
  
Ê  Richiesti	
  3	
  cluster	
  di	
  università	
  
Ê  Variabili	
  fornite	
  per	
  identificare	
  i	
  gruppi:	
  importo	
  della	
  spesa	
  per	
  4	
  
classi	
  di	
  acquisto	
  (<	
  2.000,	
  2.000-­‐40.000,	
  40.000-­‐207.000,	
  >	
  
207.000)	
  
Ê  ALGORITMO	
  DI	
  CLUSTERING:	
  K-­‐means	
  
Ê  OUTPUT	
  
Ê  Gruppo	
  1:	
  	
  
università	
  piccole	
  
Ê  Gruppo	
  2:	
  
grandi	
  e	
  piccole,	
  
con	
  investimenti	
  
Ê  Gruppo	
  3:	
  
università	
  grandi	
  
Concentrazione	
  e	
  rotazione	
  dei	
  fornitori	
  
Ê  50%	
  dei	
  fornitori:	
  1	
  acquisto	
  <	
  1.800	
  €	
  
Ê  75%	
  dei	
  fornitori:	
  <	
  3	
  acquisti	
  <	
  7.500	
  €	
  
Ê  La	
  rotazione	
  dei	
  fornitori	
  diminuisce	
  al	
  crescere	
  della	
  
dimensione	
  degli	
  atenei	
  
Analisi	
  delle	
  procedure	
  utilizzate	
  
Ê  Dato	
  poco	
  affidabile	
  
Ê  Significativo	
  utilizzo	
  di	
  MEPA	
  anche	
  per	
  importi	
  <	
  40.000	
  
Ê  Diversa	
  propensione	
  a	
  confronto	
  competitivo	
  per	
  classe	
  
dimensionale	
  e	
  regione	
  geografica	
  

More Related Content

Viewers also liked

Ontology Aware Applications @ YAPC::EU 2012
Ontology Aware Applications @ YAPC::EU 2012Ontology Aware Applications @ YAPC::EU 2012
Ontology Aware Applications @ YAPC::EU 2012
Nuno Carvalho
 
Grand Central Dispatch - iOS Conf SG 2015
Grand Central Dispatch - iOS Conf SG 2015Grand Central Dispatch - iOS Conf SG 2015
Grand Central Dispatch - iOS Conf SG 2015
Ben Asher
 

Viewers also liked (13)

historia de la pedagogia
historia de la pedagogiahistoria de la pedagogia
historia de la pedagogia
 
Sem3 nivel1 irigoyen
Sem3 nivel1 irigoyenSem3 nivel1 irigoyen
Sem3 nivel1 irigoyen
 
2016 Audi A6 Brochure | Orange County Audi Dealer
2016 Audi A6 Brochure | Orange County Audi Dealer2016 Audi A6 Brochure | Orange County Audi Dealer
2016 Audi A6 Brochure | Orange County Audi Dealer
 
Inequality in Ecuador
Inequality in EcuadorInequality in Ecuador
Inequality in Ecuador
 
Qa in agile team bcn open space
Qa in agile team   bcn open spaceQa in agile team   bcn open space
Qa in agile team bcn open space
 
Seminario 4
Seminario 4Seminario 4
Seminario 4
 
Discovering the MPCC Family
Discovering the MPCC FamilyDiscovering the MPCC Family
Discovering the MPCC Family
 
Dispatch System Slideshow
Dispatch System SlideshowDispatch System Slideshow
Dispatch System Slideshow
 
Webinar: Design Patterns : Tailor-made solutions for Software Development
Webinar: Design Patterns : Tailor-made solutions for Software DevelopmentWebinar: Design Patterns : Tailor-made solutions for Software Development
Webinar: Design Patterns : Tailor-made solutions for Software Development
 
Ontology Aware Applications @ YAPC::EU 2012
Ontology Aware Applications @ YAPC::EU 2012Ontology Aware Applications @ YAPC::EU 2012
Ontology Aware Applications @ YAPC::EU 2012
 
Grand Central Dispatch - iOS Conf SG 2015
Grand Central Dispatch - iOS Conf SG 2015Grand Central Dispatch - iOS Conf SG 2015
Grand Central Dispatch - iOS Conf SG 2015
 
Pohnpei, Micronesia
Pohnpei, MicronesiaPohnpei, Micronesia
Pohnpei, Micronesia
 
The Basics of ISO Certification
The Basics of ISO CertificationThe Basics of ISO Certification
The Basics of ISO Certification
 

Similar to Open data e acquisti della pubblica amministrazione: analisi delle università italiane - Presentazione

I dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazioneI dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazione
Claudio Lattanzi
 

Similar to Open data e acquisti della pubblica amministrazione: analisi delle università italiane - Presentazione (20)

Applicazioni di Advanced Analytics
Applicazioni di Advanced AnalyticsApplicazioni di Advanced Analytics
Applicazioni di Advanced Analytics
 
Il Rischio commerciale
Il Rischio commercialeIl Rischio commerciale
Il Rischio commerciale
 
Report commerciale e di marketing
Report commerciale e di marketingReport commerciale e di marketing
Report commerciale e di marketing
 
Gruppo Sintesi Energia
Gruppo Sintesi EnergiaGruppo Sintesi Energia
Gruppo Sintesi Energia
 
Cost Reduction
Cost ReductionCost Reduction
Cost Reduction
 
Creactives - Spending Analysis
Creactives - Spending Analysis Creactives - Spending Analysis
Creactives - Spending Analysis
 
Metodologie statistiche applicate alla chimica analitica
Metodologie statistiche applicate alla chimica analiticaMetodologie statistiche applicate alla chimica analitica
Metodologie statistiche applicate alla chimica analitica
 
Energy Data Management System (EDMS)
Energy Data Management System (EDMS)Energy Data Management System (EDMS)
Energy Data Management System (EDMS)
 
Portafoglio clienti e proposta di valore AIMB2B
Portafoglio clienti e proposta di valore AIMB2BPortafoglio clienti e proposta di valore AIMB2B
Portafoglio clienti e proposta di valore AIMB2B
 
Slide qbr banche
Slide qbr bancheSlide qbr banche
Slide qbr banche
 
A. Brunetti, I risultati e l’impatto degli scanner data sulla stima dell’infl...
A. Brunetti, I risultati e l’impatto degli scanner data sulla stima dell’infl...A. Brunetti, I risultati e l’impatto degli scanner data sulla stima dell’infl...
A. Brunetti, I risultati e l’impatto degli scanner data sulla stima dell’infl...
 
Innovazioni tecnologiche e normative nel riscaldamento
Innovazioni tecnologiche e normative nel riscaldamentoInnovazioni tecnologiche e normative nel riscaldamento
Innovazioni tecnologiche e normative nel riscaldamento
 
O. Luzi - Le innovazioni metodologiche e nelle fonti per la costruzione del ...
O. Luzi - Le innovazioni metodologiche e nelle fonti  per la costruzione del ...O. Luzi - Le innovazioni metodologiche e nelle fonti  per la costruzione del ...
O. Luzi - Le innovazioni metodologiche e nelle fonti per la costruzione del ...
 
I dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazioneI dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazione
 
2020 supply chain aspetti pratici payaro
2020 supply chain aspetti pratici payaro2020 supply chain aspetti pratici payaro
2020 supply chain aspetti pratici payaro
 
Silver Lake Analytics, soluzione Business Intelligence di Esox Informatica
Silver Lake Analytics, soluzione Business Intelligence di Esox InformaticaSilver Lake Analytics, soluzione Business Intelligence di Esox Informatica
Silver Lake Analytics, soluzione Business Intelligence di Esox Informatica
 
Better Data. Archimede e l’integrazione delle fonti di dati - Giuseppe Garofalo
Better Data. Archimede e l’integrazione delle fonti di dati - Giuseppe GarofaloBetter Data. Archimede e l’integrazione delle fonti di dati - Giuseppe Garofalo
Better Data. Archimede e l’integrazione delle fonti di dati - Giuseppe Garofalo
 
Introduzione al datamining
Introduzione al dataminingIntroduzione al datamining
Introduzione al datamining
 
Aspetti economici - Modello concettuale e Costi Standard
Aspetti economici - Modello concettuale e Costi StandardAspetti economici - Modello concettuale e Costi Standard
Aspetti economici - Modello concettuale e Costi Standard
 
Progetto di Cost Reduction un Business Case di ProcOut
Progetto di Cost Reduction un Business Case di ProcOutProgetto di Cost Reduction un Business Case di ProcOut
Progetto di Cost Reduction un Business Case di ProcOut
 

Open data e acquisti della pubblica amministrazione: analisi delle università italiane - Presentazione

  • 1. Open  data  e  acquisti  della   pubblica  amministrazione:  analisi   delle  università  italiane   Francesco  Cavazzana  
  • 2. Tutti  i  dati  sugli  acquisti  pubblici  devono   essere  pubblici  –  Legge  190/2012   Ê  Entro  il  31  gennaio  di  ogni  anno,  tali  informazioni,   relativamente  all'anno  precedente,  sono  pubblicate  in   Ê   tabelle  riassuntive  rese  liberamente  scaricabili   Ê   in  un  formato  digitale  standard  aperto     Ê  che  consenta  di  analizzare  e  rielaborare,  anche  a  fini   statistici,  i  dati  informatici.     Ê  L’Autorità  competente  (AVCP  –  ANAC)  ha  stabilito  il  formato:   Ê  http://dati.avcp.it/schema/datasetAppaltiL190.xsd     Ê  http://dati.avcp.it/schema/datasetIndiceAppaltiL190.xsd   Ê  http://dati.avcp.it/schema/TypesL190.xsd    
  • 3. Principali  dati  disponibili   Ê  Ogni  acquisto  dal  1/12/12  indipendentemente  dall’importo   Ê  Descrizione  acquisto   Ê  Data  inizio  e  fine  fornitura   Ê  Importo  aggiudicato  e  importo  liquidato   Ê  Tipo  di  procedura  utilizzata   Ê  Aggiudicatario   Ê  Elenco  dei  partecipanti  alla  gara  
  • 4. Possibili  utilizzi  di  questi  dati   Ê  Trasparenza   Ê  Anticorruzione   ma  anche   Ê  Analisi  di  benchmark  per  le  amministrazioni  pubbliche   Ê  Analisi  di  mercato   Ê  Monitoraggio  della  concorrenza   Ê  Individuazione  di  potenziali  clienti  (pubblici)    
  • 5. Obiettivi  attesi  dell’analisi   Ê  Analisi  sul  singolo  ente  e  per  settore   Ê  Distribuzione  degli  acquisti  per  classe  di  importo   Ê  Analisi  di  concentrazione  e  rotazione  dei  fornitori   Ê  Tipologie  di  procedura  di  acquisto  utilizzate   Ê  Confronto  con  un  altro  settore:  capoluoghi  di  provincia   Ê  Possibili  determinanti  dei  comportamenti:   Ê  Dimensioni   Ê  Posizione  geografica   Ê  Individuazione  di  tipologie  tramite  clustering   Ê  Paragone  tra  due  periodi:  2013  e  2014    
  • 6. Input  -­‐>  Output   30.000  file  XML                à  2.000  righe  per  60  colonne  di  analisi  +  4.000  grafici      
  • 7. Dati  analizzati   Ê 2  anni:  2013  e  2014   Ê 52  università  (38  per  il  2013,  51  per  il  2014)   Ê 10  comuni  (7  per  il  2013,  10  per  il  2014)   Ê 30.087  file  XML     Ê 528.308  acquisti   Ê 3.385.155.669,13  €  di  importo  totale   Ê 76.691  aziende  partecipanti    
  • 8. Metodologia  di  analisi   Ê Lettura   dei   file   XML   e   scrittura   dei   dati   in   un   database   PostgreSQL   tramite   procedura   appositamente  scritta  in  python   Ê Analisi   descrittiva   tramite   query   SQL,   librerie   di   calcolo  scientifico  scipy  e  numpy   Ê Analisi  di  regressione  e  clustering  con  linguaggio   statistico  R   Ê Produzione  di  un  file  excel  riepilogativo  con  tutte   le  analisi  ed  i  grafici  per  settore  e  per  singolo  ente  
  • 9. Analisi  descrittiva  degli  acquisti  nelle   università     TOTALE Università 2013 TOTALE Università 2014 Numero università analizzate 38,00 51,00 Numero docenti 35.023,00 43.030,00 Numero acquisti totale 222.666,00 283.479,00 Importo acquisti totale 792.922.368,98 1.135.543.218,93 Numero acquisti/docente 5,10 6,50 Importo acquisti/docente 18.178,79 26.033,82 min 0,00 -585,10 max 20.061.000,00 46.825.234,00 media 3.561,04 4.005,74 mediana 445,16 475,60 deviazione standard 86.774,80 142.860,54 coefficiente di variazione 24,37 35,66 !
  • 10. Distribuzione  numero  acquisti  /  importo   acquisti  –  Università  2014   2014 Università importo % numero % acquisti 1-2.000 121.501.677,23 € 11% 234.942,00 83% acquisti 2.000-40.000 305.445.769,22 € 27% 44.605,00 16% acquisti 40.000-207.000 171.938.235,54 € 15% 2.003,00 1% acquisti > 207.000 536.659.556,65 € 47% 440,00 0% totale 1.135.545.238,63 € 281.990,00 €
  • 11. Distribuzione  numero  acquisti  /  importo   acquisti  –  Comuni  2014   2014 Comune importo % numero % acquisti 1-2.000 3.420.385,79 € 0% 4.706,00 45% acquisti 2.000-40.000 46.106.848,50 € 7% 4.521,00 44% acquisti 40.000-207.000 71.311.159,96 € 10% 772,00 7% acquisti > 207.000 581.296.180,83 € 83% 377,00 4% totale 702.134.575,08 € 10.376,00
  • 12. Determinanti  1:  dimensioni   Ê  Dimensioni:  numero  docenti  come  variabile  continua  o  classi  di   importo   Ê  Grandezze  analizzate:  importo  medio,  importo  mediano,  %   numero  acquisti  <  2000  €,  %  importo  cumulato  acquisti  <  2000  €,   importo  medio  per  docente,  numero  acquisti  per  docente…     NON  EMERGONO   RELAZIONI  LINEARI   SIGNIFICATIVE  
  • 13. Determinanti  2:  Nord  -­‐  Centro  -­‐  Sud   Ê  Le  università  del  Sud  si  differenziano  dalle  altre   Ê  L’importo  medio  degli  acquisti  è  più  elevato   Ê  L’importo  speso  per  docente  è  più  basso  
  • 14. Clustering  per  comportamento  di   acquisto  
  • 15. Clustering  per  comportamento  di   acquisto   Ê  INPUT   Ê  Richiesti  3  cluster  di  università   Ê  Variabili  fornite  per  identificare  i  gruppi:  importo  della  spesa  per  4   classi  di  acquisto  (<  2.000,  2.000-­‐40.000,  40.000-­‐207.000,  >   207.000)   Ê  ALGORITMO  DI  CLUSTERING:  K-­‐means   Ê  OUTPUT   Ê  Gruppo  1:     università  piccole   Ê  Gruppo  2:   grandi  e  piccole,   con  investimenti   Ê  Gruppo  3:   università  grandi  
  • 16. Concentrazione  e  rotazione  dei  fornitori   Ê  50%  dei  fornitori:  1  acquisto  <  1.800  €   Ê  75%  dei  fornitori:  <  3  acquisti  <  7.500  €   Ê  La  rotazione  dei  fornitori  diminuisce  al  crescere  della   dimensione  degli  atenei  
  • 17. Analisi  delle  procedure  utilizzate   Ê  Dato  poco  affidabile   Ê  Significativo  utilizzo  di  MEPA  anche  per  importi  <  40.000   Ê  Diversa  propensione  a  confronto  competitivo  per  classe   dimensionale  e  regione  geografica