Analisi degli acquisti effettuati dalle università italiane e dai capoluoghi di provincia lombardi utilizzando i dati XML pubblicati per la Legge 190/2012.
Progetto di Cost Reduction un Business Case di ProcOut
Open data e acquisti della pubblica amministrazione: analisi delle università italiane - Presentazione
1. Open
data
e
acquisti
della
pubblica
amministrazione:
analisi
delle
università
italiane
Francesco
Cavazzana
2. Tutti
i
dati
sugli
acquisti
pubblici
devono
essere
pubblici
–
Legge
190/2012
Ê Entro
il
31
gennaio
di
ogni
anno,
tali
informazioni,
relativamente
all'anno
precedente,
sono
pubblicate
in
Ê
tabelle
riassuntive
rese
liberamente
scaricabili
Ê
in
un
formato
digitale
standard
aperto
Ê che
consenta
di
analizzare
e
rielaborare,
anche
a
fini
statistici,
i
dati
informatici.
Ê L’Autorità
competente
(AVCP
–
ANAC)
ha
stabilito
il
formato:
Ê http://dati.avcp.it/schema/datasetAppaltiL190.xsd
Ê http://dati.avcp.it/schema/datasetIndiceAppaltiL190.xsd
Ê http://dati.avcp.it/schema/TypesL190.xsd
3. Principali
dati
disponibili
Ê Ogni
acquisto
dal
1/12/12
indipendentemente
dall’importo
Ê Descrizione
acquisto
Ê Data
inizio
e
fine
fornitura
Ê Importo
aggiudicato
e
importo
liquidato
Ê Tipo
di
procedura
utilizzata
Ê Aggiudicatario
Ê Elenco
dei
partecipanti
alla
gara
4. Possibili
utilizzi
di
questi
dati
Ê Trasparenza
Ê Anticorruzione
ma
anche
Ê Analisi
di
benchmark
per
le
amministrazioni
pubbliche
Ê Analisi
di
mercato
Ê Monitoraggio
della
concorrenza
Ê Individuazione
di
potenziali
clienti
(pubblici)
5. Obiettivi
attesi
dell’analisi
Ê Analisi
sul
singolo
ente
e
per
settore
Ê Distribuzione
degli
acquisti
per
classe
di
importo
Ê Analisi
di
concentrazione
e
rotazione
dei
fornitori
Ê Tipologie
di
procedura
di
acquisto
utilizzate
Ê Confronto
con
un
altro
settore:
capoluoghi
di
provincia
Ê Possibili
determinanti
dei
comportamenti:
Ê Dimensioni
Ê Posizione
geografica
Ê Individuazione
di
tipologie
tramite
clustering
Ê Paragone
tra
due
periodi:
2013
e
2014
6. Input
-‐>
Output
30.000
file
XML
à
2.000
righe
per
60
colonne
di
analisi
+
4.000
grafici
7. Dati
analizzati
Ê 2
anni:
2013
e
2014
Ê 52
università
(38
per
il
2013,
51
per
il
2014)
Ê 10
comuni
(7
per
il
2013,
10
per
il
2014)
Ê 30.087
file
XML
Ê 528.308
acquisti
Ê 3.385.155.669,13
€
di
importo
totale
Ê 76.691
aziende
partecipanti
8. Metodologia
di
analisi
Ê Lettura
dei
file
XML
e
scrittura
dei
dati
in
un
database
PostgreSQL
tramite
procedura
appositamente
scritta
in
python
Ê Analisi
descrittiva
tramite
query
SQL,
librerie
di
calcolo
scientifico
scipy
e
numpy
Ê Analisi
di
regressione
e
clustering
con
linguaggio
statistico
R
Ê Produzione
di
un
file
excel
riepilogativo
con
tutte
le
analisi
ed
i
grafici
per
settore
e
per
singolo
ente
9. Analisi
descrittiva
degli
acquisti
nelle
università
TOTALE Università 2013 TOTALE Università 2014
Numero università analizzate 38,00 51,00
Numero docenti 35.023,00 43.030,00
Numero acquisti totale 222.666,00 283.479,00
Importo acquisti totale 792.922.368,98 1.135.543.218,93
Numero acquisti/docente 5,10 6,50
Importo acquisti/docente 18.178,79 26.033,82
min 0,00 -585,10
max 20.061.000,00 46.825.234,00
media 3.561,04 4.005,74
mediana 445,16 475,60
deviazione standard 86.774,80 142.860,54
coefficiente di variazione 24,37 35,66
!
11. Distribuzione
numero
acquisti
/
importo
acquisti
–
Comuni
2014
2014 Comune importo % numero %
acquisti 1-2.000 3.420.385,79 € 0% 4.706,00 45%
acquisti 2.000-40.000 46.106.848,50 € 7% 4.521,00 44%
acquisti 40.000-207.000 71.311.159,96 € 10% 772,00 7%
acquisti > 207.000 581.296.180,83 € 83% 377,00 4%
totale 702.134.575,08 € 10.376,00
12. Determinanti
1:
dimensioni
Ê Dimensioni:
numero
docenti
come
variabile
continua
o
classi
di
importo
Ê Grandezze
analizzate:
importo
medio,
importo
mediano,
%
numero
acquisti
<
2000
€,
%
importo
cumulato
acquisti
<
2000
€,
importo
medio
per
docente,
numero
acquisti
per
docente…
NON
EMERGONO
RELAZIONI
LINEARI
SIGNIFICATIVE
13. Determinanti
2:
Nord
-‐
Centro
-‐
Sud
Ê Le
università
del
Sud
si
differenziano
dalle
altre
Ê L’importo
medio
degli
acquisti
è
più
elevato
Ê L’importo
speso
per
docente
è
più
basso
15. Clustering
per
comportamento
di
acquisto
Ê INPUT
Ê Richiesti
3
cluster
di
università
Ê Variabili
fornite
per
identificare
i
gruppi:
importo
della
spesa
per
4
classi
di
acquisto
(<
2.000,
2.000-‐40.000,
40.000-‐207.000,
>
207.000)
Ê ALGORITMO
DI
CLUSTERING:
K-‐means
Ê OUTPUT
Ê Gruppo
1:
università
piccole
Ê Gruppo
2:
grandi
e
piccole,
con
investimenti
Ê Gruppo
3:
università
grandi
16. Concentrazione
e
rotazione
dei
fornitori
Ê 50%
dei
fornitori:
1
acquisto
<
1.800
€
Ê 75%
dei
fornitori:
<
3
acquisti
<
7.500
€
Ê La
rotazione
dei
fornitori
diminuisce
al
crescere
della
dimensione
degli
atenei
17. Analisi
delle
procedure
utilizzate
Ê Dato
poco
affidabile
Ê Significativo
utilizzo
di
MEPA
anche
per
importi
<
40.000
Ê Diversa
propensione
a
confronto
competitivo
per
classe
dimensionale
e
regione
geografica