SlideShare a Scribd company logo
1 of 77
Download to read offline
UNIVERSITÀ DEGLI STUDI DI
TRIESTE
Dipartimento di Ingegneria e Architettura
Laurea Magistrale in Ingegneria
Elettronica ed Informatica
Analisi, ottimizzazione e applicazione della
teoria delle code al traffico camionistico tra
autoporti e porto di Trieste
15 dicembre 2021
Laureando Relatore
Davide Michielin Prof. Lorenzo Castelli
Correlatori
Dott. Lorenzo Cerini
Anno Accademico 2020/2021
“E allora noi andavamo lenti perché pensavamo che la vita funzionasse cosı̀,
che bastava strappare lungo i bordi, piano piano, seguire la linea
tratteggiata di ciò a cui eravamo destinati e tutto avrebbe preso la forma
che doveva avere.”
— Zerocalcare —
Alla mia famiglia
Indice
Introduzione
1 Il porto di Trieste e il traffico Ro-Ro
1.1 Il porto di Trieste . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Il traffico Ro-Ro . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Aree di sosta . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.1 Interporto di Fernetti . . . . . . . . . . . . . . . . . . . 4
1.3.2 ABA (Authorized Buffer Area) . . . . . . . . . . . . . 5
2 Preparazione all’analisi dei dati
2.1 Sinfomar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Prelievo dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Descrizione e preparazione dei dati . . . . . . . . . . . . . . . 9
2.4 Data Cleaning . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4.1 Individuazione dei tratti e calcolo tempi . . . . . . . . 11
2.5 Salvataggio e visualizzazione dei dati . . . . . . . . . . . . . . 15
3 Analisi temporale dei tratti
3.1 Registrazione - Entrata Autoporto . . . . . . . . . . . . . . . . 18
3.2 Entrata - Uscita Autoporto . . . . . . . . . . . . . . . . . . . 19
3.3 Concessione Autorizzazione - Uscita Autoporto . . . . . . . . 20
3.4 Superstrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.5 Entrata Terminal - Imbarco . . . . . . . . . . . . . . . . . . . 24
3.6 Uscite Autoporti ed Entrate Terminal . . . . . . . . . . . . . . 25
3.7 Conclusioni dell’analisi . . . . . . . . . . . . . . . . . . . . . . 27
4 Modellizzazione delle distribuzioni
4.1 Fitting dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.2 Distribution Fitter . . . . . . . . . . . . . . . . . . . . . . . . 32
4.3 Risultati ottenuti . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.3.1 Superstrada . . . . . . . . . . . . . . . . . . . . . . . . 33
4.3.2 Superstrada senza traffico . . . . . . . . . . . . . . . . 35
INDICE
4.3.3 Partenze dagli autoporti . . . . . . . . . . . . . . . . . 37
4.3.4 Arrivi ai terminal . . . . . . . . . . . . . . . . . . . . . 38
5 Sviluppo del modello
5.1 Teoria delle code . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.2 Simulink . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.3 Discussione e generazione del modello . . . . . . . . . . . . . . 44
5.3.1 Uscita dall’autoporto . . . . . . . . . . . . . . . . . . . 45
5.3.2 Percorrenza superstrada . . . . . . . . . . . . . . . . . 45
5.3.3 Varco portuale . . . . . . . . . . . . . . . . . . . . . . 46
5.4 Verifica del modello . . . . . . . . . . . . . . . . . . . . . . . . 47
5.5 Applicazione del modello ai dati totali . . . . . . . . . . . . . 48
6 Ottimizzazione e applicazione al modello
6.1 Sviluppo e applicazione della prima ipotesi . . . . . . . . . . . 51
6.2 Sviluppo e applicazione della seconda ipotesi . . . . . . . . . . 55
A Codice pulizia e preparazione dei dati
B Codice analisi dati
Introduzione
Il porto di Trieste rappresenta lo scalo principale del Friuli-Venezia-Giulia ed
è gestito dall’Autorità di Sistema Portuale del Mare Adriatico Orientale.
Data la sua posizione vantaggiosa, nel cuore del continente europeo, esso
rappresenta un centro di snodo per tutti i flussi che interessano il mercato
del Centro ed Est Europa ma anche quello dell’Oriente, con rotte marittime
che collegano i maggiori porti del Mediterraneo orientale.
Una grande porzione dei traffici del porto è rappresentata dai traffici Ro-Ro
(Roll On-Roll Off) [4], effettuati attraverso delle particolari navi che per-
mettono l’imbarco e lo sbarco di autotreni (interi o solo rimorchi) e veicoli
ferroviari.
I maggiori scambi avvengono con i porti principali della Turchia, con la quale
il porto di Trieste ha stipulato un legame strategico di movimentazione delle
merci, la cosiddetta Autostrada del mare.
Proprio per questo motivo, un imponente traffico di automezzi si sposta dalle
regioni del centro ed est Europa, per poi arrivare al porto di Trieste e imbar-
carsi su una nave diretta verso paesi del medio Oriente: questo comporta un’
enorme occupazione delle strade per arrivare ai terminal portuali, con conse-
guente nascita di code che possono portare non pochi problemi alla viabilità
e all’ambiente.
Prima di effettuare l’entrata in porto, un automezzo deve passare in un’area
di sosta predisposta per attendere il “semaforo verde”.
Il motivo principale per cui ha avuto luogo, in passato, il problema delle code
all’entrata del porto era legato al fatto che una parte dei traffici generati nel-
l’interporto1
di Fernetti2
era gestito tramite i sistemi privati della Samer&Co.
shipping che non utilizzava una vera e propria procedura per la partenza dei
camion in attesa di imbarcarsi sulle navi. Infatti, venivano selezionati i ca-
mion da far partire anche se la nave di imbarco non aveva ancora attraccato
presso il porto e questo portava a code elevate nei pressi delle entrate dei vari
1
Vasta area di sosta temporanea per autotreni, automezzi e mezzi ferroviari realizzata
in prossimità di luoghi di frontiera in cui vengono svolte operazioni doganali.
2
Frazione di Monrupino, situata a nord-est del capoluogo giuliano
i
INTRODUZIONE
terminal.
A partire dal 2008, sotto richiesta del prefetto, il pezzo di area di sosta di
proprietà di Samer è stato acquistato e integrato completamente con l’intero
autoporto 3
, quindi le partenze dei vari automezzi sono state gestite in ma-
niera molto più regolare, andando a concedere il “semaforo verde” agli autisti
solo nel caso in cui la nave fosse in procinto di arrivare (con garanzia di spazi
di sosta liberi per il posteggio all’interno dei terminal in attesa dell’arrivo
della nave) o fosse già attraccata ad uno degli ormeggi dell’area portuale.
Tutte queste fasi sono state sviluppate negli anni e quella più importante
è avvenuta nel 2016, con l’integrazione dei traffici dell’Interporto nel Port
Community System Sinfomar.
Successivamente, l’attuazione del progetto Fer-Net[5], che ha permesso di
creare un corridoio monitorato tra autoporto e porto, riconoscendo l’area di
sosta di Fernetti come vero e proprio terminal di accesso, ha portato ad una
diminuzione di queste code e ai relativi disagi che esse creavano.
Nonostante questo, il problema delle code nella superstrada che permette
di arrivare ai varchi di entrata del porto non è stato ancora completamente
debellato, soprattutto nelle giornate di venerdı̀ e sabato (dato il divieto di
circolazione per i mezzi pesanti nei giorni festivi 4
) in cui un numero ingente
di automezzi provocano disagi alla viabilità.
Questo progetto di tesi si pone l’obiettivo di trovare una soluzione a questo
problema, procedendo, in un primo momento, con un’analisi dei dati relativi
ai tempi di alcuni tratti individuati nel percorso tra l’entrata in autoporto e
l’imbarco in nave dei camion che sono giunti a Fernetti o in una delle aree di
sosta del territorio triestino nel periodo Marzo-Aprile 2021 presenti nel Port
Community System del porto di Trieste (Sinfomar). Questo intervallo di
tempo è stato scelto in quanto rappresenta dei dati rilevati nel 2021, quindi
abbastanza recenti. Inoltre, questi due mesi non presentano particolari fe-
stività troppo lunghe che potrebbero portare ad avere dei giorni in cui viene
segnalata una quantità di dati non significativa.
Successivamente, dai risultati di questa analisi, sono state studiate le effetti-
ve distribuzioni dei tratti su cui si è applicato il processo di ottimizzazione,
identificando i modelli probabilistici che meglio si adattavano ai dati in pos-
sesso.
Dopodiché, per effettuare la simulazione dei casi reali e valutare i risultati
ottenuti, si è ipotizzata la creazione di un modello ad eventi discreti che è
stato opportunamente verificato. In seguito, dopo aver discusso i risultati
3
Parte dell’interporto dedicato alle zone di sosta per veicoli su gomma
4
Decreto del ministero delle infrastrutture e dei trasporti del 29 Dicembre 2020,
Articolo 1: https://www.gazzettaufficiale.it/eli/id/2020/12/31/20A07414/sg
ii
INTRODUZIONE
della simulazione utilizzando la distribuzione dei tempi di percorrenza della
superstrada attuali, si è tentato di applicare una prima ipotesi di ottimizza-
zione, modificando la distribuzione dei tempi di tragitto con una distribuzione
ipotizzata a seguito della modificazione del tempo di permesso per ciascun
autista.
Dal momento che questa prima supposizione non ha portato ad un effettivo
miglioramento, è stata teorizzata una seconda ipotesi circa il cambiamento
della distribuzione delle uscite dagli autoporti, dilazionandole nel tempo al
fine di evitare picchi nelle partenze in alcuni periodi della giornata.
La seguente tesi è strutturata nel seguente modo:
• Nel primo capitolo si procede con una presentazione generale del Porto
di Trieste, del traffico Ro-Ro e delle aree di sosta presenti nel territorio
triestino.
• Nel secondo si parla della fase di pre-processing e visualizzazione dei
dati, con una breve presentazione del Port Community System “Sinfo-
mar”.
• Nel terzo si svolge un’analisi dei dati trovati, suddividendola nei vari
tratti d’interesse.
• Nel quarto viene descritto il processo di “distribution fitting” e i risul-
tati ottenuti attraverso l’uso di un tool del software Matlab.
• Nel quinto viene teorizzato il modello che verrà utilizzato nella succes-
siva simulazione e si discuterà dei risultati ottenuti utilizzando i dati
in nostro possesso.
• Nel sesto capitolo vengono presentate le effettive ipotesi di ottimizza-
zione e i risultati ottenuti saranno descritti in una sezione conclusiva.
iii
Capitolo 1
Il porto di Trieste e il traffico
Ro-Ro
In questo primo capitolo vengono descritti i principali aspetti e le principali
caratteristiche del porto di Trieste e del traffico Ro-Ro.
Vengono presentate, inoltre, le aree di sosta presenti nel territorio triestino,
le quali rappresentano delle strutture fondamentali per il traffico preceden-
temente citato e raffigurano il punto iniziale della analisi dati.
1.1 Il porto di Trieste
Il porto di Trieste è gestito dall’Autorità di Sistema Portuale del Mare Adria-
tico Orientale che recentemente ha inglobato sotto la sua gestione anche il
porto di Monfalcone.
Situato nel golfo dell’omonima città, il porto di Trieste è composto da cinque
aree fondamentali, tre delle quali sono predisposte per fini commerciali men-
tre due sono utilizzate per scopi industriali. Queste sono: il Punto Franco
Vecchio, il Punto Franco Nuovo, lo scalo legnami, il terminal industriale e il
terminal petroli.
I traffici marittimi che interessano il porto di Trieste riguardano sia lo scam-
bio di merci, sia il trasporto passeggeri e il turismo legato al mare.
Per quanto riguarda lo scambio di merci, oltre a prevedere traffici tramite
navi Ro-Ro, questi interessano anche la movimentazione di navi container o
di navi cisterna per il trasporto di materiale grezzo (minerali, petrolio, ecc.).
Nonostante il precedente anno segnato dalla pandemia, il porto di Trieste
non ha segnalato grosse perdite, andando anche ad incrementare il traffico
nel settore Ro-Ro. [3]
Nel 2018, ha fatto segnalare una movimentazione di 57 milioni di tonnellate
1
CAPITOLO 1. IL PORTO DI TRIESTE E IL TRAFFICO RO-RO
di merci, divenendo cosı̀ primo porto in Italia e nono porto in Europa per
quantità di beni partiti.
Oltre a prevedere servizi di trasporto su nave, il porto di Trieste si distingue
per il forte sviluppo dei servizi ferroviari, grazie anche alla collaborazione con
alcune società come Alpe Adria S.r.l. e Adriafer S.r.l., che permettono un
continuo scambio di merci con la maggior parte degli stati del Centro ed Est
Europa.
La caratteristica principale di questa realtà è rappresentata dal regime di
Porto Franco, fondato nel 1719 dall’imperatore Carlo VI e conservato dopo
la seconda guerra mondiale con il trattato di Parigi del 1947 [1]. Le zone
che compongono il Porto Franco sono quelle citate in precedenza e visibili in
figura 1.1. Legalmente non appartengono al territorio dell’Unione Europea.
Figura 1.1: Disposizione dei punti franchi del porto
I vantaggi di queste zone sono relativi ai pagamenti di iva e dazi (che pre-
vedono un tasso di interesse molto limitato), il magazzinaggio (con possibilità
di sosta delle merci per un tempo indeterminato) e il carico dei prodotti (le
merci sono considerate al di fuori dell’Unione Europea e quindi non servono
autorizzazioni specifiche per imbarcarle).
Per il futuro, è previsto che alcune zone del porto (soprattutto nei moli e
in alcuni terminal) vengano ampliate, a causa del notevole flusso di merci
incrementatosi in questi anni, frutto delle innovazioni e all’aumento di nuove
infrastrutture relative al traffico su rotaia.
1.2 Il traffico Ro-Ro
Questo tipo di traffico è effettuato per mezzo di navi dedicate che permettono
l’imbarco e lo sbarco, attraverso l’uso di una rampa spesso localizzata sulla
poppa della nave, di mezzi di trasporto su gomma o su rotaia. Nel caso in
2
CAPITOLO 1. IL PORTO DI TRIESTE E IL TRAFFICO RO-RO
analisi, i principali veicoli trasportati sono i mezzi pesanti adibiti al trasporto
di merci.
Si distinguono dalle navi Lo-Lo (Lift On-Lift Off), in cui una gru viene uti-
lizzata per il caricamento e lo scaricamento del carico.
Rispetto alle navi merci, in cui il carico è normalmente calcolato in tonnel-
late, in quelle di tipo Ro-Ro si usa un’altra unità di misura che rappresenta
il numero di corsie in metri lineari (LIMs 1
).
Le navi Ro-Ro possono operare anche su percorsi fluviali se opportunamente
ridimensionate e utilizzando delle rampe preinstallate all’interno della nave.
Gli automezzi possono essere imbarcati in due modi:
• caricando il rimorchio e la motrice
• caricando solamente il rimorchio
Nel secondo caso, in virtù del regime di Punto Franco del porto di Trieste,
la motrice che ha effettuato il trasporto del semirimorchio per l’imbarco e
di proprietà dell’azienda dello stesso, può essere utilizzato anche per la fase
di sbarco e trasferimento dal porto verso la destinazione finale. Nei porti
“normali” questa procedura non avviene e i proprietari dei semirimorchi so-
no costretti a stipulare dei contratti con delle aziende locali per il trasporto
delle merci verso la destinazione.
1.3 Aree di sosta
Prima di giungere al terminal portuale per poter essere imbarcato, un camion
giunge in una delle cinque aree di sosta presenti nel territorio triestino. Oltre
a rappresentare degli enormi spazi dove poter parcheggiare l’automezzo e do-
ve l’autista può decidere di riposarsi (in alcuni di essi sono presenti anche dei
comfort quali ristoranti e docce), in esse si svolgono anche tutte le operazioni
doganali necessarie per far entrare successivamente il mezzo pesante in porto.
Tra queste aree troviamo l’interporto di Fernetti, situato nel comune di Mon-
rupino, e le varie Authorized Buffer Area (più brevemente chiamate ABA)
che appartengono a ditte di spedizionieri2
o autotrasportatori3
.
1
Unità di misura per il calcolo della superficie del ponte nelle navi Roll On-Roll Off.
Corrispondono ad un metro di corsia del ponte e ad una larghezza di 2 metri (quindi una
superficie di 2 metri quadrati)
2
Azienda che si occupa di organizzare la spedizione andando a stipulare dei contratti
con le imprese di trasporto e di svolgere tutte le operazioni accessorie quali, ad esempio,
l’imballaggio della merce o la prenotazione dello spazio all’interno della nave
3
Azienda che si occupa del solo trasporto della merce, mettendo a disposizione le
motrici.
3
CAPITOLO 1. IL PORTO DI TRIESTE E IL TRAFFICO RO-RO
1.3.1 Interporto di Fernetti
Costruito nel 1972, l’interporto è situato nei pressi del confine Italo-Sloveno
in località Fernetti.
Nel 1978 è entrata in funzione la prima area di sosta per veicoli su gomma,
che venne ultimata nel 1982, quando venne costituita la Società per Azioni
“Gestione Autoporto di Fernetti”.
Dal 2015, la società, dopo aver cambiato il proprio nome anche nel 1997
in “Terminal Intermodale di Trieste-Fernetti”, assume la denominazione di
“Interporto di Trieste SpA” ed è gestita da un insieme di soggetti. Tra que-
sti sono presenti: la Regione Autonoma Friuli-Venezia Giulia, il comune di
Trieste o l’Autorità Portuale del Mar Adriatico Orientale.
È diventato il centro strategico per le connessioni con l’Europa Centro-
Orientale in quanto tutti i camion provenienti da paesi quali Germania o
Austria, entrano al suo interno in attesa di poter essere imbarcati principal-
mente per la Turchia o per altri porti.
Questa struttura può contare su una superficie di 350 mila metri quadrati ed
è composta da tre aree principali (come mostrato in Fig. 1.2):
• Parking 1
• Parking 2
• Serpentone
Figura 1.2: Disposizione delle zone di Fernetti: in blu, il parking 2; in rosso, il
serpentone; il parking 1 è la zona circondata dal serpentone
Nella zona del parking 1, oltre ai parcheggi per i vari automezzi, si possono
trovare gli uffici dell’Agenzia delle Dogane e degli spedizionieri, altre aree di
4
CAPITOLO 1. IL PORTO DI TRIESTE E IL TRAFFICO RO-RO
supporto agli operatori e delle zone di ristoro per gli autisti presenti nell’au-
toporto.
Nella zona del parking 2 troviamo, oltre alla zona di parcheggio, una super-
ficie di 30 mila metri quadrati occupati da magazzini coperti, adibiti spe-
cialmente per lo stoccaggio di merci alimentari (HACCP) e merci pericolose
(con una propria categoria ADR). Inoltre, sono presenti anche un’officina
per la riparazione delle motrici che si fermano nell’area di sosta e una zona
composta da 6 binari, suddivisi in due fasci operativi (Nord e Sud), che per-
mettono il collegamento ferroviario con il porto e con stazioni ferroviarie per
il trasporto di merci verso la Slovenia, le aree balcaniche e l’est Europa.
1.3.2 ABA (Authorized Buffer Area)
Le authorized buffer area sono delle aree allestite per la sosta dei camion.
Sono state create in seguito alla richiesta di alcuni trasportatori e spedizio-
nieri locali di poter avere una propria area in cui svolgere tutte le operazioni
burocratiche senza dover mandare i propri autisti a Fernetti per poter richie-
dere la stampa del permesso di accesso prima di poter scendere in porto.
L’uscita dei vari camion non viene gestita in modo preciso come a Fernetti:
di solito, un addetto o un operatore dell’area controlla gli automezzi rimasti
nella zona e verifica quali sono partiti mettendoli a confronto con l’ultimo
controllo. La data e l’ora di uscita vengono quindi riportate nel momento in
cui viene effettuato l’accertamento periodico.
Un operatore può richiedere all’autorità portuale di utilizzare una certa
area di sua proprietà come Authorized Buffer Area e l’autorizzazione viene
data solamente nel caso in cui vengano rispettati alcuni requisiti come, ad
esempio, la minima superficie utilizzabile come zona di sosta degli automezzi
o che il terreno sia effettivamente in grado di ospitare i mezzi pesanti (ad
esempio deve essere ben livellato, il che comporta un’enorme spesa per l’o-
peratore o l’armatore4
che vuole creare la propria area di sosta).
4
Persona fisica o giuridica che gestisce la propria nave o una nave a noleggio. È colui
che si occupa dell’assunzione del comandante della nave e dell’equipaggio che ne farà parte.
È inoltre responsabile civile per gli obblighi derivanti dall’esercizio della nave.
5
CAPITOLO 1. IL PORTO DI TRIESTE E IL TRAFFICO RO-RO
Figura 1.3: Distribuzione delle varie ABA e dei terminal Ro-Ro nel territorio di
Trieste
6
Capitolo 2
Preparazione all’analisi dei dati
2.1 Sinfomar
Sinfomar è il Port Community System dell’Autorità Portuale del Mare Adria-
tico Orientale e permette di gestire tutto ciò che riguarda le attività del porto
di Trieste e dei suoi Punti Franchi.
Figura 2.1: Homepage di Sinfomar
L’obiettivo è quello di ottimizzare tutti i processi logistici relativi al porto
7
CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI
attraverso un sistema ”single window”1
a cui possono accedere tutti gli attori
facenti parte di questa realtà (terminalisti, Autorità Portuale, Agenzia delle
Dogane, Guardia di Finanza, ecc).
Essendo il porto di Trieste un punto multimodale, nella piattaforma, oltre
a trovare tutti i dati relativi alle attività marittime, si possono recuperare
tutte le informazioni riguardanti i trasporti da e verso il porto effettuati
su rotaia o su gomma: questi ultimi sono stati utili per il lavoro di analisi
effettuato per questo elaborato.
2.2 Prelievo dei dati
Prima di discutere di come sono stati prelevati i dati, è utile capire quali
sono i tre elementi importanti per procedere con questa analisi:
• Preavvisi: documenti necessari per l’arrivo in porto della merce per
l’esportazione o il transito. Vengono generati dall’operatore economi-
co, ovvero la ditta che si occupa del trasporto della merce, e vengono
associati ad una registrazione nel momento in cui l’autista si registra
presso l’autoporto di Fernetti. Sono stati introdotti dall’Agenzia delle
Dogane e dall’Autorità Portuale per ottimizzare i tempi di scarico e
carico delle merci e per monitorare i flussi di quest’ultime, in modo da
rilevare eventuali anomalie in una modalità completamente automatiz-
zata. Sono costituiti dalle informazioni relative alla merce trasportata
e l’unità logistica di scorta2
.
É importante notare che ad una registrazione può essere associato più
di un preavviso, poiché può accadere che più utenti della stessa ditta
inseriscano un documento per la stessa registrazione (non essendoci an-
cora la registrazione, non è possibile verificare che un preavviso sia già
stato creato) e il sistema, non avendo un meccanismo di controllo in
questa situazione, inserisce più preavvisi associandoli alla targa dello
stesso rimorchio.
• Registrazioni: generate a partire da un preavviso, le registrazioni rap-
presentano il vero e proprio mezzo fisico che viene inserito in Sinfomar.
Ad esse vengono associati un id univoco e un numero Sinfomar per,
eventualmente, ricercare il preavviso associato alla registrazione nella
1
Struttura che permette a tutte le parti coinvolte nel processo di poter integrare
documenti standardizzati attraverso un unico punto di ingresso
2
Motrice utilizzata per il trasporto del rimorchio contenente la merce destinata ad
essere imbarcata.
8
CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI
sezione “Gestione Preavvisi” della piattaforma. Inoltre vengono speci-
ficate altre informazioni riguardanti la spedizione quali le targhe della
motrice e del rimorchio che trasportano la merce, la destinazione finale
o il tipo di carico che verrà imbarcato (solo rimorchio o anche motrice).
• Stati: rappresentano il ciclo di vita di una registrazione, dall’inseri-
mento in Sinfomar fino alla fase di imbarco dell’autotreno o del solo
rimorchio. Per ogni stato è riportata, oltre alla ditta che ha provveduto
all’inserimento di quest’ultimo, la data di inserimento, un’etichetta che
identifica lo stato(status) e una nota per specificare il significato dello
status. [Fig. 2.2]
Tutti i dati utilizzati per questo progetto sono presenti in un database gesti-
to da Info.Era S.R.L, l’azienda presso cui questo lavoro è stato svolto, che
lavora a stretto contatto con l’Autorità Portuale di Trieste e per la quale ha
realizzato il sistema Sinfomar.
Dopo aver ottenuto le credenziali di accesso alla base dati, è stato necessa-
rio definire per quale periodo di tempo sarebbe stato utile implementare la
nostra analisi.
Analizzando i risultati raggiunti dal porto di Trieste nel 2020 per quanto
riguarda il traffico Ro-Ro, che ha fatto registrare un numero pari a 243500
unità transitate [3], è stato deciso che un campione di circa 21000 unità (pari
a 2 mesi di raccolta dati) fosse adeguato per poter effettuare l’analisi.
Di conseguenza, è stato necessario capire quali fossero i due mesi più adatti
per la raccolta di questi dati: tenendo conto dell’idea di analizzare dati piut-
tosto recenti (quindi dell’anno corrente) e per evitare dei mesi in cui fossero
presenti delle festività che potessero portare ad una diminuzione dei dati la
scelta è ricaduta nel periodo tra il 1° Marzo 2021 e il 1° Maggio 2021.
Per prelevare i dati dal database (di tipo relazionale), è stato necessario
eseguire un’interrogazione sulle tre tabelle contenenti gli elementi di nostro
interesse (preavvisi, registrazioni e stati) specificando le date definite prece-
dentemente. I record restituiti dal database sono stati esportati in un file
csv, per procedere successivamente con il preprocessing di questi dati.
2.3 Descrizione e preparazione dei dati
Il file esportato dal database presenta tutti i preavvisi con data di inseri-
mento del preavviso compresa nelle date definite. Inoltre, per memorizzare
anche le informazioni relative alle registrazioni e agli stati, è stato necessa-
9
CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI
rio effettuare delle operazioni di left join3
sull’id della registrazione per ogni
preavviso.
Il numero di record totali presenti nel file è pari a 310614: il numero risulta
cosı̀ elevato in quanto sono presenti tutti gli stati di tutte le registrazioni di
quei due mesi. Il numero di registrazioni totali presenti è pari a 20889 e,
tenendo conto che in alcuni casi ci possono essere delle registrazioni ripetute
poiché associate a più preavvisi, il numero totale scende a 19063.
2.4 Data Cleaning
La parte iniziale del progetto consiste in una prima pulizia dei dati.
Per prima cosa, i dati relativi ad ogni tabella (preavvisi, registrazioni, stati)
sono stati divisi in tre file diversi permettendo quindi di lavorare con essi in
modo totalmente indipendente l’uno dall’altro. I dati grezzi, contenuti nel
csv, presentavano un numero elevato di duplicazioni soprattutto per quanto
riguarda le informazioni relative agli stati e quindi è stato necessario, tramite
uno script in Python, rimuoverle.
Le date specificate nei vari elementi presentano una precisione al secondo.
Dato che, per questo studio, la precisione prevista a livello di tempi era del-
l’ordine dei minuti, prima di rimuovere eventuali duplicati i dati relativi alle
varie date sono stati alterati.
Un altro fattore da tenere in considerazione è che un autista può decidere se
continuare il suo percorso, una volta uscito dall’autoporto, verso il porto per
poi imbarcarsi o scegliere di proseguire per la strada. Questo può succedere
perché non sono presenti navi disponibili per l’imbarco il giorno in cui entra
in autoporto e decide, quindi, che continuare per la strada sia più conveniente
in termini di tempo.
Di conseguenza, i dati di questi ultimi non possono essere tenuti in consi-
derazione in quanto non si avrebbero abbastanza informazioni sui tempi di
percorrenza della superstrada. Inoltre, possono esserci delle registrazioni che
presentano uno stato ”INDETERMINATO”, dovuto probabilmente ad una
lettura errata della targa che ha portato alla creazione di un nuovo record con
la targa esatta. Si è quindi deciso di tenere conto delle sole registrazioni che
presentassero l’entrata in uno dei terminal dell’area portuale, ovvero dove la
3
Operazione che mette in relazione due tabelle di un database: vengono presi tutti i
dati della prima tabella e vengono messi in corrispondenza della seconda basandosi su una
chiave o su un gruppo di chiavi. Se non sono presenti dati corrispondenti nella seconda
tabella, le colonne relative vengono impostate a null.
10
CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI
colonna “Terminal” del record riportasse un codice di quelli elencati nella
Tabella 2.1.
Codice terminal Descrizione
6 Trieste Marine Terminal (Molo VII)
8 Samer Seaports Terminal (Riva Traiana)
130 T.I.M.T (Orm.47)
143 E.M.T. S.P.A (Molo VI)
209 Imbarcato su nave
1448625646667 Terminal Aree Comuni
Tabella 2.1: Codici terminal che indicano l’arrivo del camion in un terminal
Alla fine di questa fase di pulizia dei dati, il numero di registrazioni rima-
ste per la successiva fase di analisi è pari a 13556 (9918 inserite a Fernetti, le
restanti nelle ABA), ovvero il 71,1% dei dati totali. Da questi record rimasti,
sono state tolte alcune colonne irrilevanti per la fase successiva poiché con
valori uguali per tutti i dati o con la maggior parte dei valori nulli.
2.4.1 Individuazione dei tratti e calcolo tempi
Per effettuare l’analisi, l’idea è stata quella di individuare un percorso “vir-
tuale” per ogni camion che rappresenti il vero e proprio tragitto di quest’ul-
timo andando a identificare l’intervallo di tempo che intercorre nei vari tratti
che sono individuabili a partire dagli stati di una registrazione.
Per individuare questi tratti, è stata effettuata un’analisi approfondita di
una parte delle registrazioni direttamente su Sinfomar, andando a visualiz-
zare l’elenco degli stati di ciascuna (Fig. 2.2). Il pattern, pressochè costante
in tutte le registrazioni analizzate, fa trasparire questi stati rilevanti:
• INSERITO: segnala la data e l’ora di inserimento nel sistema Sinfomar
• TRANSITO ENTRATA: l’automezzo è transitato presso un varco di entrata
(autoporto o porto)
• TRANSITO USCITA: l’automezzo è transitato presso un varco di uscita
(autoporto)4
4
In Sinfomar si tiene traccia anche dei camion che dal porto escono per raggiungere
i vari autoporti quindi è possibile trovare uno stato di transito uscita associato ad un
varco dell’area portuale. Per questo lavoro non è stato necessario considerarlo, in quanto
il percorso considerato è stato quello che dai vari autoporti porta alle aree dei terminal.
11
CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI
Figura 2.2: Esempio di elenco degli stati di una registrazione
• FER AUT * OK: il terminal di destinazione ha concesso l’autorizzazione
all’automezzo per entrare in porto
• CREAZIONE STAMPA: stampa del biglietto di entrata nell’autoporto o del
permesso di accesso al porto da parte dell’autista. Quest’ultimo, dal
momento della stampa del permesso di accesso ad uno dei terminal, ha
24 ore a disposizione prima che il permesso di accesso scada e ne debba
creare un altro.
• DICHIARATO IMBARCATO: l’automezzo è imbarcato sulla nave
Considerato ciò, si sono potuti individuare quattro tratti principali:
• Registrazione Sinfomar - entrata autoporto: intervallo di tempo
da quando viene creata la nuova registrazione su Sinfomar alla prima
rilevazione di entrata in autoporto. Sapendo che la registrazione viene
effettuata all’ingresso del mezzo in autoporto, ci si aspetta che i tempi
in questo tratto siano per lo più brevi.
12
CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI
• Entrata - uscita autoporto: tratto che comprende l’intervallo di
tempo tra l’entrata del mezzo a Fernetti o nelle varie ABA e la rispettiva
uscita.
• Superstrada: tempo di percorrenza, da parte del mezzo, della super-
strada che collega l’autoporto al porto
• Entrata terminal - Imbarco: tempo di permanenza all’interno del
terminal di destinazione, attendendo di essere imbarcato
Inoltre, è stato identificato anche un quinto tratto che sarebbe potuto torna-
re utile nella successiva fase di analisi ovvero quello che comprende il tempo
tra il rilascio dell’autorizzazione da parte del terminal di destinazione del
camion e l’uscita effettiva dall’autoporto: si è deciso di calcolare questo
intervallo a partire dalla somma dei tempi di due tratti più precisi ovvero
quello tra la concessione dell’autorizzazione e la stampa del permesso e quel-
lo tra la stampa e la reale uscita dall’area di sosta.
I tratti identificati sono visibili in Fig. 2.3: in alcuni casi il tratto che indi-
vidua la sosta all’interno dell’autoporto (Entrata-Uscita) può risultare della
stessa lunghezza del tratto tra la concessione dell’autorizzazione e l’effettiva
uscita.
Figura 2.3: Tratti che individuano il percorso che compie un camion dall’entrata in
autoporto all’imbarco in nave
Il passo successivo, prima di calcolare i minuti dei vari tratti identificati, è
stato di unire le tre tabelle in un’unica tabella complessiva in modo da avere
tutti i dati a disposizione in un unico file.
I varchi presso cui passa un camion per entrare o uscire dall’autoporto o dal
porto sono classificati in base alla direzione di transito (entrata o uscita).
Nelle note degli stati presenti nei dati presi in considerazione non si fa mai
riferimento al varco attraversato dall’automezzo ed è per questo che è stato
necessario scaricare, sempre dallo stesso database, le informazioni dei vari
varchi e dei transiti che sono stati generati nelle date in esame.
Dopo aver unito i dati dei vari attraversamenti agli stati in cui si presentava
uno status di tipo “TRANSITO ENTRATA” o “TRANSITO USCITA” (in
base all’id dello registrazione e alla data inserimento di quel transito), si è
13
CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI
potuti procedere con il vero e proprio calcolo dei tempi nei vari tratti.
E’ possibile che in alcune situazioni, la data di entrata o di uscita in un
certo tratto non sia stata memorizzata nel database: in questo caso, si è scel-
to di far assumere valore -1 all’intervallo di tempo del tratto, poiché questa
quantità non appartiene al dominio di interesse (i tempi sono sempre positivi,
es. un automezzo partito per il porto, non può fare ritorno all’autoporto).
Tenuto conto di questo aspetto, i minuti di percorrenza sono stati calcolati
nei seguenti modi:
• Registrazione Sinfomar - entrata autoporto: la data di inizio di
questo tratto viene prelevata dalle informazioni sulla data dello stato
con status INSERITO mentre la data di fine è rappresentata dal primo
TRANSITO ENTRATA che risulta in un varco dell’autoporto.
Analizzando un numero elevato di registrazioni, ci si può accorgere che
in alcune di esse non è presente questo tipo di stato: è stato necessario,
quindi, tener conto di un’altra informazione per fronteggiare questa
mancanza. Per tale ragione, si è deciso di utilizzare anche lo stato
con status CREAZIONE STAMPA e con nota Sosta a pagamento o Sosta
forzata.
• Entrata-uscita Autoporto: la data di inizio di questo tratto risulta
essere la data di fine del tratto precedente: se non presente quella di
entrata in autoporto, si usa quella di creazione del ticket. La data
di fine, invece, è rappresentata dal primo stato TRANSITO USCITA che
riporti uno dei varchi di uscita dell’autoporto.
• Concessione autorizzazione-stampa permesso: l’inizio di questo
tratto è segnalato dalla concessione dell’autorizzazione, il quale è rap-
presentato dallo status FER AUT * OK. Un’ipotesi aggiuntiva è stata fat-
ta per questo tratto in quanto il numero di registrazioni che presentano
questo status sono poco più della metà: se la data di concessione non è
presente, si utilizza la data di stampa del permesso di accesso al porto.
• Stampa permesso-Uscita autoporto: data di inizio pari alla data
della stampa del permesso da parte dell’autista e data fine segnalata
dal TRANSITO USCITA di uno dei varchi degli autoporti.
• Superstrada: il tempo di permanenza in superstrada è calcolato a
partire dalla data di uscita dall’autoporto alla data di entrata di uno
dei terminal di imbarco (T.I.M.T, Riva Traiana, E.M.T.-Molo VI).
14
CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI
• Entrata terminal - Imbarco: quest’ultimo tratto rappresenta il tem-
po, in minuti, tra la data di entrata del mezzo in terminal e il primo
stato DICHIARATO IMBARCATO segnalato nei dati.
I dati validi (con le rispettive percentuali sul numero di record ottenuti
dopo la pulizia) sono rappresentati in questa tabella:
Tratto Numero dati validi Percentuale
Registrazione - entrata 11421 84,2
Entrata - uscita autoporto 11152 82,3
Autorizzazione - stampa 13225 97,5
Stampa permesso - Uscita 13242 97,7
Superstrada 11640 85,6
Entrata terminal - imbarco 11121 82
È importante notare che, con questo procedimento di calcolo dei tempi
nei vari tratti, sono risultati degli intervalli di tempo negativi (tranne nel
tragitto registrazione-entrata autoporto), dovuti a dei dati non accurati che
presentavano, ad esempio, la data di entrata in terminal successiva a quella
di imbarco. Questi, che rappresentano al massimo uno 0,3% dei dati totali
per ogni tratto, non sono stati considerati nella fase di analisi.
2.5 Salvataggio e visualizzazione dei dati
Un punto importante da valutare è relativo alla memorizzazione e alla visua-
lizzazione dei dati presenti.
Per quanto riguarda la memorizzazione, la prima cosa da affrontare è stata
la scelta tra un database di tipo relazionale o non relazionale.
Nel primo tutti i dati vengono memorizzati in tabelle differenti e tra di esse
esistono delle relazioni mantenute tramite l’uso di chiavi primarie e secon-
darie. Esso risulta essere un tipo di database molto potente ma, nonostante
questo, non molto efficiente nel caso di grandi carichi di dati o di analisi di
dati prelevati da sensori.
Il secondo, noto per la sua alta scalabilità e flessibilità, permette di eseguire
delle operazioni molto più veloci rispetto a quelle che si implementano in un
database relazionale [2] ed è molto indicato nel caso di grandi moli di dati.
Proprio per questa ragione, si è deciso di proseguire con questo tipo di data-
base.
Vi sono quattro tipi principali di database non relazionali:
15
CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI
• Key-Value store: i dati, in questo caso, vengono memorizzati come
coppie di chiave-valore. Si può memorizzare qualsiasi tipo di dato,
dalla stringa all’oggetto più complesso che viene rappresentato da più
coppie chiave-valore. Risulta essere il più semplice tra i database non
relazionali.
• Document-Based store: in questo tipo di database i dati sono rappre-
sentati da veri e propri documenti, i quali assumono una certa struttura
predeterminata. La struttura del documento viene, di solito, definita
in un file JSON ed è composta da un identificatore univoco e da un
numero di attributi di qualsiasi tipo.
• Column-Based store: in un column-based database, ogni colonna del
database iniziale viene memorizzata in modo separato dalle altre co-
lonne. È un tipo di database non relazionale utile nel caso in cui si
voglia restituire l’insieme dei dati di una determinata colonna in modo
rapido e veloce.
• Graph store: gli elementi principali di questo tipo di database sono i
nodi e i grafici. Sono molto utili nel caso di dati fortemente intercon-
nessi tra di loro e permette di effettuare interrogazioni mediante un
attraversamento efficiente della struttura.
Considerato che si è voluto salvare, oltre ai dati dei vari intervalli di tem-
po, anche le informazioni sulla registrazione quali il numero Sinfomar o la
targa della motrice e del rimorchio, la scelta è ricaduta sul Document-Based
database andando a memorizzare un documento per ogni registrazione (Fig.
2.4). Anche il Column-Based database sarebbe potuto essere un utile stru-
mento ma avrebbe implicato una eccessiva ricerca tra le varie suddivisioni
delle colonne per ritrovare tutti i dati relativi ad una registrazione.
Per il tipo di database scelto sono presenti sul mercato diverse implementa-
zioni, molte delle quali open source. Tra queste è stata scelta l’opzione di
MongoDB, soprattutto dal momento in cui vi era già una implementazione
di questo database nell’azienda di riferimento di questo elaborato, risultando
più semplice la creazione di una nuova istanza del database.
La visualizzazione dei dati è stata implementata in due parti principali:
• Spring data: framework Java che permette di implementare il data
access layer per accedere e prelevare i dati da un qualsiasi tipo di data-
base, relazionale e non. In questo caso, è stata utilizzata l’integrazione
per interagire con MongoDB: dopo aver riportato i parametri per ac-
16
CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI
Figura 2.4: Struttura di un documento di mongoDB
cedere al database nel file di configurazione, sono state definite delle
aggregation pipeline 5
per il prelievo dei dati importanti per ogni tratto
• Vue.js: framework javascript open-source per la creazione di interfacce
utente per pagine web e applicazioni single-page. Per la visualizzazione
dei grafici sono stati usati dei componenti facenti parte di Primevue,
una libreria di Vue utile per la gestione dell’interfaccia grafica e delle
componenti grafiche.
Per generare i grafici, viene effettuata una richiesta di tipo GET, utiliz-
zando una libreria che implementa un HTTP client (axios), al server che si
occupa di andare ad eseguire l’aggregation pipeline necessaria e restituisce il
risultato al client. A questo punto, il componente grafico, che risulta essere
reattivo, è in grado di modificarsi da solo nel caso in cui i dati cambino e il
nuovo grafico viene generato.
5
Elenco ordinato di operazioni chiamate “aggregazioni” che permette, in MongoDB,
di eseguire delle query sui documenti presenti nel database per estrarre delle statistiche e
restituirli sotto forma di collection
17
Capitolo 3
Analisi temporale dei tratti
Nei grafici successivi è rappresentata la distribuzione dei tempi nei vari tratti
analizzati. Si noti che sull’asse delle ascisse troviamo il valore di tempo con
una precisione di 10 minuti (es.valore dell’ascissa pari a 2 = 20-30 minuti)
e nell’asse delle ordinate troviamo il numero di registrazioni che hanno fatto
registrare quel tempo. Le registrazioni di cui si è tenuto conto sono quelle
con destinazioni: Mersin, Pendik, Yalova e Cesme.
3.1 Registrazione - Entrata Autoporto
In Figura 3.1 si può notare come i dati relativi a questo tratto rispettino le
nostre aspettative: il 99,3% degli automezzi ha fatto segnalare l’entrata in
autoporto entro 30 minuti dalla registrazione.
Il grafico dai 70 ai 7600 minuti presenta dei dati non visibili in quanto
rappresentano al massimo 1-2 unità logistiche per quegli intervalli di tempo.
Figura 3.1: Distribuzione dei tempi tratto Registrazione-Entrata Autoporto
18
CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI
3.2 Entrata - Uscita Autoporto
Il grafico in Figura 3.2 riporta la distribuzione temporale per le varie registra-
zioni nel tratto di permanenza nell’autoporto. Nonostante il picco di camion
concentrato attorno ai 70/80 minuti, sono presenti anche dei lobi e dei picchi
inaspettati nei tempi successivi.
L’innalzamento dei dati attorno ai 550 minuti e attorno ai 670 minuti si può
giustificare sapendo che è in vigore una legge del regolamento CE 561/2006
in cui si stabilisce che “il limite del periodo di riposo giornaliero è fissato a
11 ore, che può essere ridotto a 9 ore, non più di tre volte a settimana, tra
due periodi di riposo settimanali”[6].
È inaspettato invece il lobo creatosi successivamente ai 670 minuti e i pic-
chi che troviamo sui 1450 e sui 2750 minuti. Tenendo conto che i tempi di
navigazione tra Trieste e Turchia sono compresi fra le 54 e le 60 ore, questi
risultati ci confermano che i camion hanno dei tempi di sosta molto elevati e
che rappresentano tra il 25% e il 40% del tempo totale.
Figura 3.2: Distribuzione dei tempi tratto Entrata-Uscita Autoporto
Nonostante i due picchi elevati, la porzione di grafico tra i 550 e i 670
minuti rappresenta solamente il 4,5% dei dati totali mentre il lobo successivo
occupa il 34,1%.
Quest’ultimo, suddiviso per le varie destinazioni, presenta una distribuzione
come quella visibile nella tabella 3.1. È importante porre l’attenzione sul
fatto che la maggioranza dei dati presenti per questo tratto sono di registra-
zioni di automezzi diretti a Pendik (Fig. 3.3).
19
CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI
Figura 3.3: Distribuzione delle
registrazioni per destinazione per questo
tratto
Destinazione Percentuale
Pendik 53%
Cesme 30%
Yalova 4%
Mersin 13%
Tabella 3.1: Distribuzione dei
dati per destinazione nel lobo tra i
670 e i 1430 minuti
Andando ad analizzare più approfonditamente i dati a nostra disposizione
e dividendoli per destinazione e per giorno della settimana, si nota come la
maggior parte dei componenti del lobo in esame riporti una data di entrata,
nei vari autoporti, nella giornata di venerdı̀ (Tab. 3.2). Tenendo conto che
le ore definite in quell’intervallo vanno dalle 12 alle 24, si presume che una
buona parte di automezzi si sposti nella giornata di sabato andando, quindi,
ad aumentare la probabilità di coda in superstrada.
Lunedi Martedi Mercoledi Giovedi Venerdi Sabato Domenica
Mersin 15,6 10,5 14,4 14,9 22 21,9 0,7
Pendik 12,4 11,8 17,1 25,6 26,3 6,5 0,3
Yalova 1,3 17,1 12,7 19,6 49,3 0 0
Cesme 15,1 6,9 16,9 20,1 35,8 5 0,2
Tabella 3.2: Distribuzione delle entrate in autoporto (in
percentuale) per destinazione e giorno della settimana.
3.3 Concessione Autorizzazione - Uscita Au-
toporto
In Figura 3.4 si può notare, invece, la distribuzione delle registrazioni nel
tratto tra la concessione dell’autorizzazione da parte del terminal e l’uscita
dell’automezzo dall’autoporto. In questo caso, il comportamento di questo
grafico rispetta le aspettative dato che abbiamo un picco di registrazioni che
fanno segnalare meno di 10 minuti tra la concessione dell’autorizzazione e
l’uscita dall’autoporto.
Da un’analisi più approfondita troviamo che il 57,1% degli automezzi ha fatto
20
CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI
registrare un’uscita entro i 60 minuti.
Andando ad analizzare i tempi tra l’entrata in autoporto e la successiva
autorizzazione, si rileva che la media di questi è pari a 670 minuti (equivalente
a 11 ore).
Il valore è facilmente spiegabile considerando il tipo di traffico che viene
generato attualmente. Infatti, dato che la partenza di una nave è prevista
circa ogni 24 ore, si tende a concedere l’autorizzazione in maniera distribuita,
rilasciando il permesso a una parte dei camion che devono imbarcarsi nelle
prime 12 ore e i restanti nelle successive 12.
Tenendo conto dei 60 minuti considerati nel tratto attualmente analizzato,
possiamo avere un riscontro con il grafico del tratto precedente (Fig. 3.2) in
cui vi è il 58,5% delle registrazioni che segnala un’uscita prima dei 730 minuti
e che rappresenta la maggior parte dei dati che compongono quel grafico.
Figura 3.4: Distribuzione dei tempi tratto Concessione Autorizzazione-Uscita
Autoporto
Nei due grafici sottostanti, invece, si può notare la distribuzione delle
registrazioni per i tratti che compongono il tratto totale: il segmento che
va dalla concessione dell’autorizzazione alla stampa di quest’ultima e quello
che rappresenta il tempo tra la stampa dell’autorizzazione e l’uscita effettiva
dall’autoporto.
Il primo grafico risulta sufficientemente regolare, con il maggior numero di
elementi che fa registrare un tempo minore di 10 minuti (una parte di questi
dati sono il risultato dell’ipotesi fatta precedentemente sulle registrazioni per
cui mancava la data di concessione dell’autorizzazione). Il decadimento è
perlopiù esponenziale, con un numero di dati che risulta essere abbastanza
consistente fino a 90 minuti. Nonostante quanto detto, si calcola che,in me-
dia, un autista impieghi 3 ore per stampare il proprio permesso dopo aver
ricevuto l’autorizzazione dal terminal.
21
CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI
Anche il secondo grafico si presenta secondo le aspettative, con un picco nei
primi 10 minuti. Si riscontra, inoltre, un numero notevole di registrazioni
che riportano tempi tra i 20 e i 30 minuti.
In questo caso, si evidenzia una media di due ore tra la stampa del permesso
e la successiva uscita dall’autoporto.
Figura 3.5: Distribuzione delle registrazioni Concessione-Stampa permesso
Figura 3.6: Distribuzione per i dati Stampa permesso-Uscita autoporto
22
CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI
3.4 Superstrada
Da una prima analisi del grafico generato si può notare che, dopo una rapida
crescita e il raggiungimento del picco sui 90/100 minuti, c’è un decadimento
piuttosto regolare, nonostante una crescita (limitata) attorno ai 600 minuti.
È importante considerare che, per l’autorità portuale, il tempo massimo con-
siderato valido per percorrere questo tratto è pari a 90 minuti. Si è introdotta
questa tolleranza perché il porto non ha la possibilità di tenere traccia di un
automezzo nel momento in cui percorre la superstrada e quindi, nonostante
i tempi di percorrenza si attestino attorno ai 30 minuti, non è possibile pre-
vedere se il camion abbia trovato traffico per arrivare o vi siano stati altri
intoppi durante il viaggio.
Questo margine è applicato sia agli automezzi che partono dall’autoporto di
Fernetti, sia a quelli che partono dai piazzali delle diverse ABA.
Gli automezzi che hanno fatto registrare un tempo minore dei 90 minuti per il
transito in superstrada sono comunque il 17% del totale, un valore molto bas-
so e per il quale bisognerà applicare qualche iniziativa affinchè questo cresca.
L’idea, infatti, è quella di avere un grafico con valori molto elevati nei tempi
< 90 minuti e con una rapida discesa nei tempi > 90 minuti. Andando ad
Figura 3.7: Distribuzione dei tempi tratto Superstrada
analizzare più approfonditamente questi dati e dividendoli per destinazione,
si può notare come solo il 9% delle registrazioni dirette a Cesme riporti un
massimo tempo di percorrenza di 90 minuti. Anche per le altre destinazioni i
dati non sono incoraggianti: il massimo raggiunto è del 24% negli automezzi
con destinazione Yalova, nonostante sia importante considerare il fatto che
questo punto di arrivo conti il numero minimo di dati [Fig. 3.8] (quindi,
nel caso in cui si dovessero prendere molti più dati, la percentuale potrebbe
abbassarsi ulteriormente).
23
CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI
Approfondendo l’analisi come fatto nel tratto di sosta in autoporto, si nota
Figura 3.8: Distribuzione dei dati per destinazione nel tratto superstrada
che la maggior parte di registrazioni che hanno fatto rilevare un tempo mag-
giore di 90 minuti sono più elevati tra il martedı̀ e il venerdı̀. Solo Yalova
registra un 23,5% nella giornata di sabato. Ovviamente, le percentuali sono
molto basse e tendenti allo zero la domenica, in quanto possono muoversi
solamente alcuni tipi di autotreni.
3.5 Entrata Terminal - Imbarco
Questo grafico risulta essere quello più enigmatico in quanto troviamo una
serie di lobi irregolari che vanno a decadere pian piano.
Il perché di quanto avviene può essere spiegato dal fatto che, nonostante il
camion possa essere imbarcato ad una determinata ora, la sua data di imbar-
co viene registrata nel momento in cui tutta la nave presso cui è imbarcato
viene riempita ed è pronta a partire.
Questo tendenza si riscontra anche nei dati a disposizione, con molte regi-
strazioni per le quali la data di imbarco è equivalente (nella realtà sarebbe
impensabile questa condizione, in quanto tra l’imbarco di un automezzo e un
altro passa un certo periodo di tempo).
24
CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI
Figura 3.9: Distribuzione dei tempi tratto Entrata Terminal-Imbarco
3.6 Uscite Autoporti ed Entrate Terminal
Un’altra serie di dati di cui non si è parlato nel precedente capitolo ma che
saranno utili al fine della realizzazione della seconda parte di questo lavoro
di tesi sono quelli relativi al numero di uscite dei camion dall’autoporto e al
numero di entrate in terminal in un’unità di tempo (10 minuti).
Per prima cosa, dal foglio di calcolo in cui erano presenti tutti i dati, sono
state selezionate le date di uscita dall’autoporto e entrata nei terminal che
avessero un valore valido (quindi non pari a zero, come impostato nella pre-
cedente fase di calcolo dei tratti) di ogni camion e, per entrambi i gruppi, si
è provveduto a ordinare le date in ordine cronologico.
Il numero di registrazioni, che hanno soddisfatto il vincolo descritto in prece-
denza, sono riportate nella Tabella 3.3 con le rispettive percentuali sul totale
dei dati analizzati.
Evento Numero reg.valide % sul totale
Uscita Autoporti 13304 98,1
Entrata Terminal 11802 87
Tabella 3.3: Numero di registrazioni valide per le date in esame
Per ogni giornata, si è provveduto a calcolare, in ogni unità di tempo, il
numero di automezzi che uscivano dall’autoporto e che entravano in terminal
in quei 10 minuti. Successivamente, è stata calcolata la media per ogni deci-
na di minuti cosı̀ da avere un risultato comune tra tutti i giorni analizzati.
Nelle figure 3.10 e 3.11 troviamo i risultati ottenuti: sulle ordinate troviamo il
numero medio di camion che sono usciti da un autoporto (o che sono entrati
25
CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI
in un terminal) mentre sulle ascisse troviamo le varie ore della giornata, sud-
divise per unità di tempo (nei grafici sono riportati gli orari con un intervallo
di 50 minuti per migliorare la leggibilità).
Figura 3.10: Numero di uscite medio
dagli autoporti per ogni unità di tempo
(10 minuti)
Figura 3.11: Numero di entrate medio
nei terminal per ogni unità di tempo (10
minuti)
Analizzando il grafico a sinistra, si può notare come la maggior parte
delle partenze sia distribuito tra le 9 di mattina e le 19 della sera, con un
piccolo calo attorno all’orario di pranzo e due ore dopo. Questo è giustificato
dal momento che la maggior parte dei semafori verdi viene dato nell’orario
in cui sono presenti operatori ai terminal portuali e viene poco sfruttata la
funzionalità introdotta in Sinfomar che permette di dichiarare quanti camion
effettivamente possono uscire in un dato periodo di tempo e il tutto potrebbe
essere gestito automaticamente dal software.
Dal grafico si può notare inoltre come le partenze dai vari autoporti siano
pressoché nulle nelle ore notturne e questo può essere motivato dal fatto che
di solito le navi partono verso le 2 della mattina e quelle successive arrivano,
in media, verso le 8 di mattina. Il motivo della crescita iniziale alle 6 di
mattina risulta essere lo stesso descritto precedentemente, con i camion che
partono e scendono in porto andando ad occupare i parcheggi dei terminal,
in attesa dell’attracco della nave.
Nel secondo grafico si può notare invece come gli arrivi in terminal siano nulli
solo in un intervallo di tempo, ovvero quello tra 00:40 e le 05:30. Il motivo
principale per cui si verifica questo fenomeno è quello descritto in precedenza
ovvero che non vi sono navi dove imbarcare i camion arrivati in quel periodo di
tempo e quindi si andrebbero ad occupare parcheggi all’interno del terminal
inutilmente.
La maggior parte degli automezzi risulta entrare nei vari terminal solo nel
pomeriggio (tra le 15 e le 19) mentre, negli altri orari, si può notare come la
tendenza sia di 1-2 camion ogni 10 minuti. Importante è notare anche quel
piccolo intervallo di tempo di 1 ora e 40 minuti dopo la mezzanotte: esso
26
CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI
può essere giustificato dagli eventuali “ultimi arrivi” in porto prima della
partenza delle navi.
3.7 Conclusioni dell’analisi
I grafici precedentemente riportati rappresentano i dati aggregati tra le re-
gistrazioni inserite presso l’autoporto di Fernetti e quelle inserite presso le
varie ABA. Da un’analisi più approfondita dei due insiemi separati risulta
che la distribuzione dei dati per ogni raggruppamento dà luogo allo stesso
comportamento che si ritrova nei grafici dei dati totali.
Questo conferma che il problema delle successive code all’ingresso dei termi-
nal non è favorito solo dai camion in partenza dalla zona di Fernetti, ma vi
è un contributo anche da tutti gli automezzi partenti dalle ABA.
L’analisi effettuata ha confermato le ipotesi relative al primo tratto, con la
maggior parte delle registrazioni che entrano in autoporto non appena viene
creata la registrazione nel sistema.
Un comportamento inaspettato si riscontra, invece, nel periodo di perma-
nenza in autoporto e nei tempi di percorrenza della superstrada per poter
arrivare ad un terminal portuale.
Per quanto riguarda il tratto entrata-uscita autoporto il problema principale
è rappresentato sia dalla discesa non rapida dei dati prima del picco delle 9
ore sia dal lobo creatosi dopo il picco delle 11 ore. Il motivo di questi tempi
cosı̀ elevati può essere dovuto anche alla particolare distribuzione dei dati
nel tratto concessione autorizzazione-uscita autoporto dove si scopre che un
gran numero di autisti, nonostante gli venga concessa l’autorizzazione per
scendere, aspettano per molto tempo prima di uscire e imboccare la super-
strada. Questo può essere condizionato dal fatto che il permesso che viene
stampato da parte degli autisti ha una validità di 24 ore e quindi, i con-
ducenti, sapendo di avere tutto questo tempo a disposizione, rimandano la
loro partenza favorendo, in secondo luogo, un’eventuale nascita di coda in
superstrada. Questo lo si può notare anche nel grafico (Fig. 3.6) riportante i
tempi tra la stampa e l’effettiva uscita dall’autoporto, con un numero elevato
di autisti che attraversa il varco solo dopo 20/30 minuti.
Dai dati risultanti dall’analisi del tratto “Superstrada” scaturisce che essi
non sono in linea con le direttive dell’autorità portuale, che si aspetta una
distribuzione dei dati maggiore nei primi 90 minuti e una discesa esponenzia-
le rapida per i tempi maggiori di 90 minuti. Anche in questo caso il problema
può sorgere dal fatto che il tempo di permesso è troppo elevato e quindi i ca-
mionisti tendono a fermarsi nelle aree di servizio presenti nel tratto di strada
tra gli autoporti e il porto per riposarsi o per altri motivi.
27
CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI
Sarà quindi necessario provare a limitare il tempo di permesso (e quello di
possibilità di stampa di quest’ultimo) per l’entrata in terminal e capire come
questo possa influenzare i tempi di percorrenza della superstrada da parte
dei camion.
28
Capitolo 4
Modellizzazione delle
distribuzioni
La seconda fase del lavoro di questa tesi si concentra principalmente su un’a-
nalisi più approfondita dei dati risultanti del tratto definito come “Super-
strada” e sulla realizzazione di un modello che possa rappresentare, in tutto
e per tutto, il percorso che un automezzo compie prima di arrivare all’interno
dell’area portuale.
In questo capitolo si discuterà della tecnica del distribution fitting e di come è
stata applicata alle distribuzioni dei nostri dati. Il processo non verrà applica-
to a tutti i grafici trovati nei capitoli precedenti ma solamente a quelli relativi
alla superstrada, all’uscita dai vari autoporti e all’entrata nei terminal.
4.1 Fitting dei dati
Il ”distribution fitting” è la procedura che permette di selezionare la di-
stribuzione statistica che più si adatta al dataset in esame proveniente da
un processo casuale. A seconda delle caratteristiche del fenomeno, possono
presentarsi distribuzioni più adeguate di altre: ad esempio, come riportano
Büchel e Corman in [7], per i dati relativi al tempo di percorrenza di un certo
tratto stradale vengono molto spesso utilizzate le distribuzioni normali, log-
logistiche, lognormali ma anche la combinazione di più distribuzioni come,
ad esempio, le Gaussian Mixture Model.
Il punto principale delle procedure di fitting è quello di stimare i parametri
delle distribuzioni con vari metodi, anche se il più utilizzato è quello della sti-
ma di massima verosimiglianza (o Maximum Likelihood Estimation)[10](eq.
4.2).
Questo metodo si basa sulla massimizzazione della funzione di verosimiglian-
29
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
za (eq. 4.1), la quale rappresenta la funzione di probabilità di un campione
costituito da n variabili casuali e che sia funzione di un vettore di parametri
θ: per esempio, in una distribuzione normale, la funzione di verosimiglianza è
dipendente dai parametri µ e σ2
che rappresentano rispettivamente la media
e la varianza della distribuzione.
L(x1, x2, . . . , xn; θ) =
n
Y
i=1
f(xi, θ) (4.1)
maxL(x; θ) = L(x, θ̂) θ̂ = argmaxL(x, θ) (4.2)
La variabile indicata con θ̂ è lo stimatore di massima verosimiglianza e viene
calcolato ricorrendo alla funzione di log-verosimiglianza, la quale è ottenuta
dall’applicazione del logaritmo naturale alla funzione L(x, θ) e che preserva
tutte le sue caratteristiche. Inoltre, la log-verosimiglianza risulta essere an-
che più conveniente in termini di potenza computazionale [10].
Solitamente, dopo aver stimato i parametri delle distribuzioni, vengono ese-
guiti dei test chiamati “Test di ipotesi” che permettono di verificare se ef-
fettivamente l’insieme di dati osservati è conforme al modello calcolato, ac-
cettando o meno l’ipotesi nulla che dichiara che i nostri campioni seguono la
distribuzione trovata.
Tra questi troviamo:
• Test Chi-Quadro;
• Test Kolmogorov-Smirnov;
• Test Anderson-Darling;
Come descritto in Büchel e Corman [7] e in Vose [8] i test sopracitati presen-
tano delle limitazioni che li rendono non validi per misurare la Goodness-Of-
Fit 1
di una curva ipotizzata: i test Kolmogorov-Smirnov e Anderson-Darling
non risultano validi se i parametri vengono stimati a partire dall’insieme dei
dati di test (procedura che viene eseguita in questo esperimento) mentre il
test Chi-Quadro è fortemente dipendente dal numero di classi in cui viene
suddiviso l’istogramma formato dai dati (in questo caso una classe rappre-
senta un intervallo di tempo di 10 minuti) [8] e in ognuna di esse deve esserci
un numero di occorrenze maggiore o uguale a 5 (situazione che non si verifica
1
La Goodness-Of-Fit rappresenta la bontà di adattamento tra un set di valori noti e
un secondo insieme di valori che deriva dal ”fitting” di un modello ai dati disponibili
30
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
in tutti i grafici visti) [9] .
Un altro metodo proposto in Büchel e Corman [7] è quello di confrontare i
valori di massima verosimiglianza e scegliere la distribuzione che riporta il
valore massimo. Questo può portare a dei problemi di overfitting in quanto
distribuzioni con più parametri possono riportare una migliore approssima-
zione dei nostri dati.
Per far fronte a questa problematica, sia in Büchel e Corman [7] sia in Vose
[8], si propone di utilizzare dei criteri che utilizzino la massima verosimiglian-
za ma che vadano anche a penalizzare le distribuzioni che utilizzano un alto
numero di parametri. Queste misurano la qualità relativa del fitting propo-
sto.
I criteri citati sono tre:
• Akaike Information Criterion (AIC): questo criterio restituisce un sin-
golo valore che definisce quanto il modello calcolato è coerente con la
distribuzione dei dati in nostro possesso. In questo caso, un valore più
basso di questo indice indica una migliore approssimazione da parte di
una certa distribuzione. La misura di quanto una certa distribuzione
si adatta ai nostri campioni è data dalla log-verosimiglianza. A questa
viene poi aggiunto un termine di penalità che dipende dal numero di
parametri della distribuzione che viene utilizzata. L’AIC è molto utile
quando si confrontano i vari modelli sulla stessa distribuzione dei dati.
L’equazione per calcolare il valore dell’indice AIC è quella riportata in
4.3.
AIC = −2 ln(L) + 2k (4.3)
ln(L) rappresenta il logaritmo della massima verosimiglianza e k è il
numero di parametri del modello utilizzato.
• Bayesian Information Criterion (BIC) o Schwarz Information Criterion
(SIC): anche questo criterio viene utilizzato per la scelta del miglior
modello che approssima la distribuzione dei dati. In questo caso, il
termine di penalizzazione per il numero di parametri è molto più grande
rispetto a quello che troviamo nell’AIC. Per il calcolo dell’indice di
questo criterio, oltre ad utilizzare la log-verosimiglianza come nel caso
di AIC, si fa uso anche del numero di campioni presente nel dataset in
esame. Come nell’AIC, il modello migliore è rappresentato da quello
con il valore di indice più basso.
L’equazione per il calcolo del valore di BIC è riportata in 4.4. (un
termine aggiuntivo che si può ritrovare è n, che rappresenta il numero
di campioni del dataset in esame)
BIC = −k ln(n) − 2ln(L) (4.4)
31
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
• Hannan-Quinn Information Criterion (HQIC): questo metodo è simile
a quelli visti nei punti precedenti. Anch’esso rappresenta la bontà di
adattamento di un modello tra un numero finito di modelli. Dipende
dalla funzione di massima verosimiglianza (dal suo logaritmo) e pe-
nalizza le distribuzioni che presentano un numero di parametri troppo
elevato per evitare che vi sia overfitting. Come nel BIC, anche in questo
caso si tiene conto del numero di campioni, n, del dataset analizzato.
L’equazione di HQIC è quello mostrata in 4.5.
HQIC = −2ln(L) + 2k ln(ln(n)) (4.5)
Per selezionare il miglior modello, in questa tesi è stato scelto di calcolare
i valori degli indici secondo questi criteri e di tenere la distribuzione che
riportava il maggior numero di coefficienti più bassi.
4.2 Distribution Fitter
Allo stato attuale, sono molti i tool che permettono di eseguire il distribution
fitting. Tra questi troviamo molti software commerciali come, ad esempio,
Minitab e anche molti linguaggi che implementano dei package specifici come
R, Python o Matlab.
Per questa parte del progetto è stata utilizzata l’applicazione Distribution
Fitter [11] di Matlab facente parte dello Statistics and Machine Learning
Toolbox.
Dopo aver lanciato l’applicazione, digitando “distributionFitter” sulla conso-
le di Matlab, appare una schermata come quella riportata in Fig.4.1: da qui
è possibile selezionare che cosa si vuole mostrare nella finestra contenente il
grafico (funzione di densità, funzione di ripartizione, ecc.).
Inoltre, è possibile selezionare (attraverso degli appositi sottomenù):
• il vettore di dati che si vuole adattare e le rispettive frequenze per ogni
elemento;
• i dati che eventualmente si vogliono escludere nel processo di fitting;
• quali e quanti modelli mostrare per eseguire un confronto grafico;
Il numero di distribuzioni possibili da utilizzare è abbastanza limitato (22)
e l’applicazione rileva in automatico se vi sono dei modelli che sicuramente
non riescono a seguire l’andamento dei dati (il valore di log-verosimiglianza
tende a meno infinito) e li rimuove dalla lista delle distribuzioni disponibili.
32
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
Una volta scelto il dataset su cui si vuole applicare la procedura di distri-
bution fitting e dopo aver eventualmente scelto una regola di esclusione per
alcuni dati, è possibile selezionare un modello tra quelli presenti e lasciare che
l’applicazione trovi la miglior stima dei parametri per quella distribuzione.
Una volta trovata, vengono mostrati a video i valori dei parametri dell’even-
tuale distribuzione e il logaritmo della funzione di verosimiglianza, oltre alla
rappresentazione grafica del modello calcolato sovrapposta all’istogramma
dei dati.
Figura 4.1: Schermata iniziale del Distribution Fitter di Matlab
4.3 Risultati ottenuti
Nei grafici successivi, l’asse delle ascisse riporta il valore dei tempi con una
precisione dei 10 minuti (Fig. 4.2, 4.4, 4.5, 4.6).
4.3.1 Superstrada
Per questo tratto non sono stati considerati tutti i valori dei tempi trovati e
sono stati esclusi tutti quelli con un periodo di percorrenza superiore ai 5000
minuti. Questo perchè il loro contributo era quasi nullo, con una probabilità
di vedere verificati quei dati approssimativamente attorno a valori di 10−5
-
10−6
.
33
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
È stato riscontrato che, per il tratto superstrada con tutti i dati aggregati, la
miglior distribuzione che si adattava al grafico a disposizione è quello di una
distribuzione generalizzata dei valori estremi (o Generalized Extreme Value).
Figura 4.2: Fitting della distribuzione dei dati della superstrada
Questo ha riportato il valore di log-likelihood2
più basso tra tutte le di-
stribuzioni che l’applicazione forniva.
Questo tipo di distribuzione risulta avere una funzione di densità di proba-
bilità come quella riportata nell’eq.4.6.
1
σ
t(x)ξ+1
et(x)
dove t(x) =
(
(1 + ξ(x−µ
σ
))−1
ξ ξ 6= 0
e−
(x−µ)
σ ξ = 0
(4.6)
In essa troviamo tre parametri fondamentali:
• k (più comunemente indicato con ξ): parametro di forma. Definisce il
comportamento della coda della distribuzione (Fig.4.3):
– ξ > 0: distribuzione con una coda che scende meno rapidamente
a zero e quindi tende ad essere molto lunga.
– ξ < 0: distribuzione con una coda “sinistra” e corta, ovvero che
tende a zero molto velocemente.
– ξ = 0: distribuzione con una coda che tende molto più velocemen-
te a zero rispetto a quella con ξ > 0.
• µ: parametro di posizione. È un parametro che definisce la posizio-
ne della distribuzione. Se questo aumenta, la distribuzione tende a
spostarsi verso destra, se diminuisce, la distribuzione si sposta verso
sinistra.
2
Termine inglese per indicare la log-verosimiglianza
34
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
• σ: parametro di scala. Se questo aumenta, la distribuzione tende ad
allargarsi, se invece diminuisce quest’ultima si restringe.
Figura 4.3: Grafici della distribuzione GEV al variare di ξ, fissati i valori di µ e σ
[12]
Il modello generato sembra essere adatto all’andamento dei dati del tratto
Superstrada. Il valore di µ pari a 15.53 denota una distribuzione che si
concentra nei valori più vicini all’origine (dalla precedente analisi risulta che
il picco massimo di questo tratto è presente attorno a 8, ovvero 80 minuti)
e il valore di σ pari a 14.62 rivela un andamento dei nostri dati che tende
a scendere molto tardi, soprattutto nella parte destra della distribuzione
(abbiamo infatti valori elevati riscontrati anche a 150, ovvero a 25 ore). ξ
(pari a 0.856) manifesta un andamento, a sinistra del picco, molto veloce
(poche registrazioni fanno registrare valori al di sotto di 90 minuti, come
visto precedentemente) e che raggiunge il massimo della distribuzione dopo
poco tempo. Il valore di ξ segnala, inoltre, una coda della distribuzione
molto lunga che tende a zero solo dopo aver superato una gran quantità
di dati presenti (valori quasi nulli si possono riscontrare a partire dai 400,
attorno alle 67 ore).
4.3.2 Superstrada senza traffico
Per la validazione del modello che verrà creato successivamente, è necessario
verificare quale distribuzione approssimi meglio i dati dei tempi in superstra-
da, ipotizzando di prendere solo quelli relativi a dei momenti senza traffico.
Per selezionare quali dati prelevare, dobbiamo andare a vedere quali di questi
35
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
hanno fatto segnalare un maggior numero di valori minore di 90 minuti. Dai
risultati ritrovati nella sezione 3.4, appare chiaro come i giorni che si possono
tenere in esame sono quelli di lunedı̀, sabato e domenica.
Per una questione di numero di campioni limitato, si esclude la domenica.
Andando ad analizzare i due giorni rimasti e i dati ad essi collegati relativi
ai tempi di percorrenza, si nota come il lunedı̀ faccia registrare tempi medi
più veloci rispetto a quelli del sabato (440 minuti contro i 660 del sabato).
Questo potrebbe essere anche una conseguenza del gran numero di camion
che si spostano nel primo giorno del fine settimana, per evitare di rimanere
bloccati in autoporto la domenica e dover aspettare un’altra giornata prima
di partire.
Dopo aver deciso da quale giorno prelevare i dati per applicare il processo di
“distribution fitting”, è stata effettuata un’altra eliminazione di dati: dopo
aver diviso i dati per l’effettivo lunedı̀ di uscita, si è tenuto conto del numero
di registrazioni che avevano fatto segnalare un tempo di percorrenza maggio-
re di 24 ore. Tutti quei lunedı̀ che facevano segnalare più di 15 registrazioni
con tempo maggiore sono stati scartati (4 lunedı̀ su 9, il 46% dei dati di quel
giorno).
Al termine di questo processo di selezione i giorni considerati sono quindi
stati 5: 1 Marzo, 22 Marzo, 29 Marzo, 5 Aprile, 12 Aprile.
La distribuzione dei dati cosı̀ ottenuti è rappresentato dalle barre di colore
viola in Fig. 4.4.
Il miglior modello che si adatta alla nostra disposizione dei dati è quello rap-
presentato dalla distribuzione di Burr.
Questo tipo di distribuzione (anche detta distribuzione di Burr XII) ha una
funzione di densità di probabilità come quella mostrata in 4.7.
fBXII
(x; α, c, k) =
ck
α
x
α
c−1 
1 +
x
α
c−(k+1)
(4.7)
Questa presenta tre parametri [13] [14]:
• α: parametro di scala. Indica quanto la curva identificata è schiacciata
verso l’asse orizzontale.
• c e k: parametri di forma. Entrambi sono valori positivi e permettono
di gestire, per l’appunto, la forma della curva da generare (ad esempio,
può essere generata una curva che parte dall’origine, cresce e successiva-
mente scende o un’altra che parte da un valore fissato dell’asse verticale
e seguire un decadimento simile ad un’esponenziale).
I valori calcolati dal distribution fitter per questa distribuzione si possono
ritrovare nell’andamento dei dati: un valore di c pari a 4.22 denota l’anda-
mento iniziale della curva, la quale deve crescere molto velocemente in quanto
36
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
il picco si presenta attorno al valore 8 dei dati dei tempi; anche il valore di k,
pari a 0.17, fa notare la discesa più lenta verso i valori più elevati dei tempi.
Figura 4.4: Fitting della distribuzione dei dati della superstrada senza traffico
4.3.3 Partenze dagli autoporti
In questo caso, il grafico in questione non presenta un comportamento uni-
modale in quanto vi sono diversi picchi per alcune fasi della giornata.
Se si effettua un’analisi più approfondita della distribuzione riportata in Fig.
4.5, si può vedere che i picchi effettivi sono tre: uno dovuto al traffico mat-
tiniero, uno a quello nell’orario dopo pranzo (anche se molto più stretto) e
uno al traffico che si genera nel pomeriggio.
Se prendiamo ogni sottoinsieme di questa distribuzione possiamo notare co-
me effettivamente vi sia il contributo di tre gaussiane diverse centrate attorno
ai picchi del grafico. Per questo motivo, è stato deciso di utilizzare una di-
stribuzione di tipo “Gaussian Mixture Model”: proprio come riportato nel
nome, questo tipo di distribuzione è un insieme di gaussiane, le quali possie-
dono una propria media e una propria varianza ed è assegnato loro un certo
peso per formare la composizione. La funzione di densità di questo tipo di
distribuzione è riportata nell’eq.4.8 (n rappresenta il numero di componenti
della composizione e pi(x) indica la funzione di densità di probabilità dell’i-
esima componente)
f(x) =
n
X
i=1
wipi(x) (4.8)
Un punto fondamentale per la realizzazione di questo tipo di modello è la
scelta dell’eventuale numero di gaussiane che lo compongono. A questo pro-
37
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
posito, è stato utilizzato il comando Matlab apposito per il calcolo della mi-
glior approssimazione con un Gaussian Mixture Model (fitgmdist): questo
permette, passando i dati su cui adattare il modello e il numero di gaussiane
che dovrebbero comporre il modello, di trovare la media e il peso delle va-
rie componenti. Il risultato che riportava il valore più basso di AIC e BIC
(l’output di questo comando non prevede il calcolo dell’indice HQIC) è stato
valutato come miglior adattamento.
Figura 4.5: Fitting della distribuzione dei dati relativi alle uscite dagli autoporti
Come si può vedere in Fig. 4.5, il miglior adattamento è stato riscontrato
in un Gaussian Mixture Model con tre componenti aventi media, varianza e
peso rispettivamente:
• µ1 = 60, 34 ω1 = 0.45
• µ2 = 81, 16 ω2 = 0.3
• µ3 = 102, 58 ω3 = 0.25
Questo conferma l’effettivo andamento del nostro grafico con una salita e
successiva discesa tra le 9 di mattina e le 11, un innalzamento con conseguente
discesa rapida attorno alle 14 (dovuto alle partenze subito dopo l’ora di
pranzo) e un’ultima crescita dei dati nel pomeriggio, tra le 16 e le 18.
4.3.4 Arrivi ai terminal
La distribuzione dei dati di questo evento risulta essere particolare in quanto
abbiamo una gran parte dei dati (il 95%) concentrata nella parte destra del
grafico e il 5% rimanente all’inizio.
38
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
Per questo motivo è stato scelto di andare ad effettuare il distribution fit-
ting con l’ausilio del distribution fitter solo nella parte dove si concentravano
di più i dati, trattando la parte del grafico iniziale come una distribuzione
uniforme e pesando le due componenti a seconda dei dati che esse compren-
devano.
Dopo aver applicato il processo di adattamento ai dati descritti preceden-
temente, è risultato che il miglior modello che segue l’andamento dei dati è
quello rappresentante una distribuzione di Weibull (Fig. 4.6).
Figura 4.6: Fitting della distribuzione dei tempi successivi di entrata nei terminal
(si noti la prima parte adattata)
Questo tipo di distribuzione presenta due parametri, indicati come A e
B nel distribution fitter: questi rappresentano, rispettivamente, la scala e la
forma della distribuzione.
Il valore di B pari a 4,6 indica che il tasso di entrata nei terminal effetti-
vamente cresce con il tempo (essendo maggiore di 1) e decresce abbastanza
rapidamente dopo l’arrivo del picco della distribuzione. Questo fatto risulta
in totale accordo con l’andamento dei dati che fanno segnalare un aumento
delle entrate in terminal prima delle 15 e una diminuzione effettiva dopo le
19. Il valore di A pari a 110 segnala che effettivamente la distribuzione risulta
essere spostata molto più a destra rispetto all’origine.
Le distribuzioni che si adattano meglio ai nostri dati nei vari tratti ana-
lizzati sono quindi riportate nella Tabella 4.1 con i rispettivi parametri cal-
colati. Nella Tabella 4.2 sono indicati i valori della log-verosimiglianza delle
distribuzioni, il numero di campioni del dataset del tratto, il numero di para-
metri della distribuzione trovata e i valori degli indici precedentemente citati
e utilizzati per la valutazione della miglior distribuzione.
39
CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI
Tratto Distribuzione Parametri
Superstrada Generalized Extreme Value
k = 0.856
σ = 14.62
µ= 15.53
Superstrada No Traffico Burr
α = 5.83
c = 4.22
k = 0.17
Uscita Autoporto Gaussian Mixture Model (3 componenti)
µ1 = 60, 34
ω1 = 0.45
µ2 = 81, 16
ω2 = 0.3
µ3 = 102, 58
ω3 = 0.25
Entrata Terminal 0.95×Weibull +0.05×Uniform
A = 110
B = 4, 6
Tabella 4.1: Distribuzioni con miglior adattamento e relativi parametri
Tratto LogLikelihood Gradi di libertà N.Campioni AIC BIC HQIC
Superstrada -54791 3 398 109588 109564 109592
Superstrada No Traffico -3248 3 159 6502 6480 6505
Uscita Autoporto -193 6 145 398 356 405
Entrata Terminal (solo Weibull) -149 2 134 302 288 304
Tabella 4.2: Proprietà di ogni distribuzione e dei dati e valori degli indici
40
Capitolo 5
Sviluppo del modello
In questo capitolo verranno descritte brevemente le caratteristiche principali
della teoria delle code e verranno illustrate le particolarità del tool di Matlab
utilizzato per costruire il modello ed eseguire le simulazioni (Simulink[15]).
Successivamente, verrà fatta una discussione sulle particolarità che il modello
dovrà riportare con relativa proposta, che verrà validata utilizzando la distri-
buzione “senza traffico”.
Una volta verificata, questa verrà applicata ai dati dei tempi totali di percor-
renza del tratto stradale, evidenziando come questi portino ad un’effettiva
coda al varco di entrata dell’area portuale.
5.1 Teoria delle code
La teoria delle code è un settore della matematica che studia e modella l’atto
di attesa in coda.
Nasce da un articolo scritto e pubblicato nel 1909 da A.K.Erlang, “The theory
of probabilities and telephone conversations”, in cui cercava di capire quanti
circuiti telefonici era necessario fornire ad una compagnia telefonica di Cope-
naghen per prevenire un tempo di attesa troppo lungo per i clienti. Cercando
di trovare una soluzione, capı̀ che il problema fosse applicabile in molti cam-
pi e da qui sviluppò la teoria di cui si sta parlando. Infatti, la teoria delle
code può essere applicata a svariati scenari come la coda che si accumula allo
sportello di una banca o la catena di produzione di un certo prodotto.
I soggetti che si presentano in questa teoria sono due:
• Clienti: soggetti che richiedono un certo servizio. Essi arrivano ad un
tempo ti e la differenza tra il tempo di arrivo dell’i-esimo cliente e
l’i+1-esimo cliente è detta “tempo di interarrivo”.
41
CAPITOLO 5. SVILUPPO DEL MODELLO
• Servitori: soggetti che forniscono un servizio ai clienti. Sono caratte-
rizzati da un “tempo di servizio” che definisce il tempo medio con cui
il servizio viene erogato al cliente.
Figura 5.1: Tipico modello di una coda con clienti e servitori
Un altro aspetto importante della teoria delle code è la disciplina della coda,
che definisce in che ordine vengono serviti i clienti che arrivano in fila. Tra
le varie modalità troviamo:
• First come, first serve (FCFS): in questo tipo di coda, i clienti che
arrivano per primi vengono serviti per primi.
• Last come, first serve (LCFS): i clienti che arrivano per ultimi nella
coda, vengono serviti per primi.
• Service in random order (SIRO): i clienti vengono serviti in un ordine
random, è indifferente il loro tempo di arrivo.
La notazione fondamentale utilizzata nella teoria delle code è chiamata “no-
tazione di Kendall” che definisce le principali informazioni della coda ed è
rappresentata da una n-upla di sei valori. Questi rappresentano rispettiva-
mente:
• Statistica degli arrivi: identifica di che tipo è la distribuzione dei pro-
cessi di arrivo (markoviana, deterministica, Erlang o generale)
• Statistica del servizio: identifica di che tipo è la distribuzione del
processo di servizio (identiche a quelle elencate per la statistica degli
arrivi)
• Numero di servitori presenti nel sistema
42
CAPITOLO 5. SVILUPPO DEL MODELLO
• Numero di posti disponibili nella coda
• Dimensione della popolazione
• Disciplina della coda
I primi tre elementi sono rappresentativi e sempre necessari mentre gli ul-
timi tre hanno dei valori di default: se la capacità della coda è infinita, la
dimensione della popolazione risulta essere infinita e la disciplina della coda
è del tipo “First Come, First Serve”, gli ultimi tre parametri possono essere
omessi.
Per la maggior parte delle code esistenti, alcuni valori possono essere calcolati
analiticamente come il tasso di servizio, di interarrivo o il tempo di attesa
medio che un cliente deve attendere prima di essere servito.
5.2 Simulink
Per questa parte di progetto è stato utilizzato il tool di Matlab Simulink, uno
strumento utile per effettuare delle simulazioni del sistema in esame.
Simulink propone una libreria con un grande quantitativo di blocchi, i quali
rappresentano delle entità fondamentali: partendo da essi si può costruire il
sistema effettivo su cui verrà eseguita la simulazione.
In particolare, in questo caso, sono stati utilizzati i blocchi della categoria
SimEvents che permettono la modellazione e la simulazione dei sistemi ad
eventi discreti.
I blocchi fondamentali utilizzati per questa simulazione sono:
• Entity Generator: permette la generazione delle entità basandosi su un
evento che può aver luogo all’interno del sistema o su tempi che possono
essere generati da una distribuzione qualsiasi.
• Entity Server: rappresentano il vero e proprio servitore, il quale viene
occupato da un’entità per un tempo pari a quello che viene chiamato
“tempo di servizio”.
• Queue Block: blocco che identifica la coda e a cui si può associare una
capacità, una disciplina e da quanti input può ricevere le entità.
• Entity Terminator: blocco finale dove vengono distrutte le entità. Vie-
ne utilizzato per simulare l’uscita delle entità dal modello della simu-
lazione.
43
CAPITOLO 5. SVILUPPO DEL MODELLO
5.3 Discussione e generazione del modello
Il modello da realizzare deve rappresentare l’intero percorso che compie un
automezzo, dall’uscita da uno degli autoporti fino all’entrata in un terminal
in attesa di essere imbarcato.
In particolare, tre momenti specifici devono essere evidenziati:
• Uscita dall’autoporto;
• Percorrenza della superstrada;
• Passaggio al varco portuale e entrata in terminal;
I tempi delle uscite tra un veicolo e il successivo devono essere più elevati
nelle ore serali e notturne, dal momento che il maggior numero di partenze
viene fatto segnalare durante il giorno. I tempi di percorrenza variano a
seconda del tipo di realtà che si simula, considerando dei periodi più brevi
nel caso in cui si analizzi la versione “senza traffico”.
Per la realizzazione, è stato necessario tenere conto anche di due ulteriori
aspetti importanti:
• i varchi di accesso all’area portuale sono due: Varco 1 e Varco 4. Questi
due sono distanti 6 minuti l’uno dall’altro e per questo si possono con-
siderare come ingresso unico con la possibilità di gestire due automezzi
contemporaneamente. Idealmente, si dovrebbe pensare come un’unica
coda che converge verso questi due varchi.
• il tempo medio che un camion impiega per entrare all’interno dell’area
portuale si attesta attorno agli 8 minuti. Al varco portuale, un autista
si sottopone ad una serie abbastanza lunga di procedure nelle quali
deve mostrare alcuni permessi e documenti a vari soggetti quali PTS1
,
guardie giurate e Guardia di Finanza.
Nonostante la distribuzione che identifica le entrate in terminal tenga conto
anche del tempo che un certo camion impiega per la percorrenza del tratto
varco portuale-varco del terminal, questo verrà estromesso dalla simulazione
in quanto si tratta di un intervallo di tempo medio di circa 7 minuti. Questo
non porterebbe sostanziali modifiche alla distribuzione dei dati delle entrate
in terminal e quindi non verrà considerato.
Il modello è stato simulato su 24 ore con un’unità di tempo pari a 1 minu-
to. Per questo motivo, alcuni valori delle distribuzioni trovate precedente-
mente sono state riadattate per essere coerenti con la risoluzione temporale
utilizzata.
1
Porto di Trieste Servizi S.r.l.
44
CAPITOLO 5. SVILUPPO DEL MODELLO
5.3.1 Uscita dall’autoporto
Il percorso del camion nella simulazione inizia dall’uscita da uno degli auto-
porti e la successiva immissione in autostrada.
I tempi di interarrivo tra un camion e quello successivo sono stati calcolati
utilizzando le uscite medie ritrovate precedentemente. È stato supposto che,
all’interno di un’unità di tempo, i camion arrivassero in maniera uniforme:
ad esempio, se ad una certa ora erano stati fatti segnalare 2 camion in 10
minuti si è ipotizzato che il primo partisse al quinto minuto mentre il secondo
partisse al decimo.
Le uscite dei camion dagli autoporti sono state realizzate facendo uso un En-
tity Generator nel quale è stato utilizzato un metodo di generazione basato
sul tempo. I tempi calcolati con il metodo descritto in precedenza sono stati
riportati nella casella di testo che compare dopo aver selezionato MATLAB
Action come un pattern ripetuto nel quale, alla fine della sequenza, il tempo
di interarrivo viene impostato ad infinito, cosicché le entità non vengano più
generate.
Per valutare il numero di entità effettivamente generate durante la simulazio-
ne, dal pannello delle statistiche è stato attivato il contatore del numero di
entità generate, per verificare che queste fossero corrispondenti con la realtà.
5.3.2 Percorrenza superstrada
Il passo successivo è stato quello di modellare il percorso in superstrada.
Per fare ciò, si è pensato di definire il tratto percorso dai camion come un
servitore, il quale presenta una capacità infinita in quanto una volta che un
automezzo si immette nella strada, quest’ultima non viene bloccata in attesa
che il veicolo “fuoriesca” dal tratto stradale ed entri nell’area portuale.
Il tratto di superstrada è stato quindi rappresentato da un Entity Server
al quale è stato assegnato il valore Inf per indicare la capacità totale e, a
seconda della situazione che si voleva simulare (senza traffico, con tutti i dati
a disposizione e ottimizzato), è stato definito anche il modo con cui il tempo
di servizio veniva calcolato.
Per quanto riguarda la simulazione in condizioni “ideali” (senza traffico),
i tempi di servizio sono stati calcolati a partire dai tempi di percorrenza
fatti segnalare dalle varie registrazioni considerate e, ad ogni valore, è stato
assegnato un valore di probabilità pari al numero di occorrenze che questo
aveva fatto emergere.
I tempi di percorrenza nel caso si tenesse conto della distribuzione dei dati
totali, sono stati modellati con un comando Matlab che permette di generare
dei valori random a partire da una Generalized Extreme Value (gevrnd)
45
CAPITOLO 5. SVILUPPO DEL MODELLO
passando i parametri ritrovati nella fase precedente di Distribution Fitting.
I tempi di servizio cosı̀ calcolati rappresentano dei valori che identificano la
decina di minuti (es. dt=2 indica un tempo di 20 minuti): per questo motivo
è stato necessario moltiplicare per 10 i valori ottenuti con il comando Matlab
precedentemente citato.
5.3.3 Varco portuale
Una volta percorso il tratto stradale, i vari automezzi si introducono in una
coda (più o meno lunga) in attesa di essere accettati al varco e successiva-
mente entrare nell’area portuale.
La coda che può generarsi è stata rappresentata, nel nostro modello, con un
Queue Block al quale è stato attribuito una capacità infinita: questa asse-
gnazione è totalmente ideale in quanto, nella realtà, se la coda raggiunge un
valore di circa una ventina di camion il traffico viene bloccato e non vengono
fatti scendere ulteriori automezzi dai vari autoporti. La modalità con cui le
entità escono da questo tipo di coda è di tipo FCFS dal momento i primi au-
tomezzi che arrivano al varco portuale verranno fatti entrare prima nell’area
del porto.
Per verificare il volume di traffico presente all’interno della coda in un dato
istante della simulazione, è stata attivata la rispettiva statistica del blocco
ed è stata collegata ad un visualizzatore di simulink (Scope).
Per simulare i varchi portuali è stato utilizzato un altro Entity Server colle-
gato direttamente alla coda descritta in precedenza. Come descritto all’inizio
della sezione, il varco 1 e il varco 4 sono stati inglobati in un unico ingresso
avente un tempo di servizio uniforme di circa 8 minuti. Per riportare que-
ste ipotesi all’interno della simulazione è stato necessario riportare un valore
pari a 2 nella casella di testo dove specificare la capacità del servitore (ovve-
ro quante entità può servire simultaneamente) e, per impostare il tempo di
servizio, è stato selezionato Dialog nella sezione Service Time Source impo-
nendo un valore pari a 8 nella sezione Service Time Value.
Superato il varco portuale, il camion entra nell’area del porto e successiva-
mente entra in un terminal presente nei moli che prevedono l’attracco di navi
Ro-Ro. Nella simulazione questa fase viene semplificata, ponendo un Entity
Terminator subito dopo il servitore che rappresenta il varco e ipotizzando
che l’entità stessa uscisse dal modello simulato.
Il modello teorizzato è rappresentato in figura 5.2
46
CAPITOLO 5. SVILUPPO DEL MODELLO
Figura 5.2: Modello teorizzato per rappresentare lo scenario da ottimizzare
5.4 Verifica del modello
Utilizzando la notazione di Kendall, si può descrivere la prima parte del mo-
dello teorizzato come una G/G/∞ in quanto entrambe le distribuzioni (tempi
di interarrivo e di servizio) sono “generiche” e il servitore (qui rappresentato
dalla superstrada) risulta avere una capacità infinita, corrispondente ad un
insieme infinito di server che lavorano in parallelo con la stessa distribuzione.
La seconda parte, invece, può essere definita come una coda G/D/2 in quanto
i tempi di interarrivo sono dettati dalla distribuzione caratterizzante i tempi
di percorrenza del tratto stradale mentre i tempi di servizio sono costante-
mente pari a 8 unità di tempo (8 minuti).
Dal momento che il modello totale è una composizione delle due, risulta es-
sere troppo complesso per validarlo analiticamente. Per questo motivo, si
è deciso di valutare quanto il modello teorizzato fosse accurato facendo uso
della distribuzione identificata come “senza traffico”, giudicando se i risultati
ottenuti nella simulazione corrispondessero con quanto trovato nei dati circa
le entrate in terminal durante le 24 ore e se il comportamento delle entrate
simulate concordassero con la distribuzione trovata nel precedente capitolo
nella sez. 4.3.4.
Dopo aver applicato le opportune modifiche al modello (ovvero dopo aver
cambiato la modalità con cui il tempo di percorrenza della superstrada veni-
va calcolato), la simulazione è stata eseguita e i risultati ottenuti a proposito
delle entrate in porto da parte degli automezzi sono state visualizzate (Fig.
5.3, sull’asse orizzontale si trova il tempo, su quello verticale il numero di
camion entrati). Dal grafico si può notare che il totale di camion entrati è
pari a 177 (nonostante vengano generati 231 camion), risultato che concorda
con quello derivante dai dati a disposizione. Infatti, prendendo i valori medi
degli ingressi tra le 7:30 e mezzanotte (ovvero quando la simulazione fa regi-
strare dei camion entranti) il totale di essi è pari a 176.
Inoltre, si può vedere come il grafico segua l’andamento trovato nella distri-
47
CAPITOLO 5. SVILUPPO DEL MODELLO
Figura 5.3: Grafico delle entrate in terminal nella simulazione
buzione degli ingressi medi, facendo segnalare tempi più elevati all’inizio (con
una media di circa 1 camion entrante ogni 10 minuti fino ai 700 minuti) e dei
tempi sempre più ridotti nella parte centrale (con una media di 2-3 camion
ogni 10 minuti). Nella parte finale (dai 1350 minuti) si può osservare come
questi tempi tendano ad allungarsi, portando ad una diminuzione del numero
di automezzi che entrano in terminal in un periodo di 10 minuti.
5.5 Applicazione del modello ai dati totali
Validato il modello, si è provveduto a cambiare la distribuzione del tempo di
servizio andando ad utilizzare quella ricavata dall’insieme dei dati aggregati.
Come accennato nella sez. 5.3 per generare i tempi di servizio si è utilizzato
un comando presente in Matlab, gevrnd, il quale, passati i parametri k, σ, µ
restituisce dei valori casuali. Questi ultimi sono scelti con una probabilità il
cui valore è dettato dalla distribuzione utilizzata.
Dopo aver applicato le modifiche necessarie, è stata eseguita la simulazione.
Dai risultati di quest’ultima (Fig. 5.4, nelle ascisse si possono trovare i minu-
ti; nelle ordinate è riportato il numero di camion in coda in quel momento)
si può notare che i camion tendono ad arrivare attorno alle 8 di mattina (480
48
CAPITOLO 5. SVILUPPO DEL MODELLO
Figura 5.4: Comportamento della coda ai varchi portuali
minuti) e che, inizialmente, i varchi riescono a gestirli in maniera adeguata,
per circa 4 ore.
I due varchi sembrano non essere in grado, invece, di gestire il numero di
automezzi che arrivano dalle 15 alle 19, portando ad avere una coda con un
picco massimo di 21 camion verso le 7 di sera. Nonostante la successiva di-
scesa, sembra che gli automezzi che si presentano in seguito portino ad un
aumento della coda attorno ai 19 veicoli.
Verso la conclusione del grafico vi è una diminuzione continua dei camion in
coda, dovuta al fatto che l’entity generator ha fissato il tempo di interarrivo
a infinito con conseguente blocco della generazione di entità e il server che
rappresenta il varco portuale continua a processare i vari elementi ogni 8
unità di tempo.
Esaminando i tempi di percorrenza che risultano dalla simulazione, con il
tempo di permesso concesso attualmente, gli autisti tendono ad allungare
eccessivamente la durata dei loro viaggi, percorrendo il tratto di superstrada
49
CAPITOLO 5. SVILUPPO DEL MODELLO
verso il porto in un tempo molto più elevato dei 90 minuti suddetti.
In tal modo si presentano al varco portuale stabilendo in autonomia l’orario
di arrivo (purché compreso nelle 24 ore prestabilite), quando è già presen-
te un elevato quantitativo di veicoli, provocando un innalzamento dei valori
della coda, come dimostrano i risultati della simulazione.
Nel capitolo seguente, si pone l’obiettivo di determinare gli esiti a seguito
del cambio effettivo nel tempo di permesso per l’accesso all’area portuale
dalle 24 ore attuali ai 90 minuti, che condurrà ad una modifica della distri-
buzione caratterizzante il tempo di percorrenza. Inoltre, si valuterà se vi
sono dei vantaggi concreti rispetto alla situazione attuale.
50
Capitolo 6
Ottimizzazione e applicazione
al modello
In questo capitolo verrà descritta una prima variante della distribuzione dei
dati relativi ai tempi di percorrenza in superstrada (basato sull’ipotesi di
una successiva modifica al tempo di permesso concesso agli autisti) e verrà
valutato se vi è un effettivo miglioramento rispetto alla situazione illustrata
nella sezione conclusiva del precedente capitolo.
Dal momento che dalla simulazione non si noteranno dei cambiamenti favo-
revoli, un’ulteriore ipotesi di ottimizzazione sulle partenze dei camion dagli
autoporti verrà discussa.
Effettuate le opportune modifiche al modello, verrà analizzato il risultato
ottenuto, il quale presenterà notevoli miglioramenti per il caso in esame.
6.1 Sviluppo e applicazione della prima ipo-
tesi
La riduzione del tempo di permesso di accesso al porto da 24 ore a 90 minuti
causa delle modifiche alla distribuzione dei tempi di percorrenza del tratto
stradale in quanto non si dovrebbero più riscontrare degli automezzi che fan-
no segnalare valori troppo elevati (ad esempio, maggiori di 5 ore).
Inoltre, la maggior parte delle registrazioni dovrebbe indicare un periodo di
tragitto attorno ai 35-45 minuti, tenendo conto che qualche camion potrebbe
fare registrare un tempo non superiore ai 20 minuti. Il numero di veicoli che
potrebbero indicare questo valore di tempo non sono molti dal momento che
questi sono quelli che provengono dai piazzali di Autamarocchi e di Logeast
(che nei dati a disposizione rappresentano l’8% delle registrazioni).
51
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste
Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste

More Related Content

What's hot

What's hot (9)

Sales for Startups
Sales for StartupsSales for Startups
Sales for Startups
 
Lecture 3 customer segments
Lecture 3 customer segmentsLecture 3 customer segments
Lecture 3 customer segments
 
Uber Pitch Deck 2008
Uber Pitch Deck 2008Uber Pitch Deck 2008
Uber Pitch Deck 2008
 
Startup Metrics for Pirates (Nov 2012)
Startup Metrics for Pirates (Nov 2012)Startup Metrics for Pirates (Nov 2012)
Startup Metrics for Pirates (Nov 2012)
 
PPT ROAMING 2015
PPT ROAMING 2015PPT ROAMING 2015
PPT ROAMING 2015
 
Hot Spot Columbia
Hot Spot ColumbiaHot Spot Columbia
Hot Spot Columbia
 
Liftit Series B deck
Liftit Series B deckLiftit Series B deck
Liftit Series B deck
 
WeGreek Pitch Deck
WeGreek Pitch DeckWeGreek Pitch Deck
WeGreek Pitch Deck
 
Startup Metrics for Pirates
Startup Metrics for PiratesStartup Metrics for Pirates
Startup Metrics for Pirates
 

Similar to Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste

Analisi e sviluppo di un algoritmo di pianificazione ordini di una ditta di t...
Analisi e sviluppo di un algoritmo di pianificazione ordini di una ditta di t...Analisi e sviluppo di un algoritmo di pianificazione ordini di una ditta di t...
Analisi e sviluppo di un algoritmo di pianificazione ordini di una ditta di t...Marco Furlanetto
 
Sviluppo di un hub di comunicazione in un applicazione per porti con Biztalk ...
Sviluppo di un hub di comunicazione in un applicazione per porti con Biztalk ...Sviluppo di un hub di comunicazione in un applicazione per porti con Biztalk ...
Sviluppo di un hub di comunicazione in un applicazione per porti con Biztalk ...gwalter85
 
Presentazione progetto catasto sicurezza ponti Provincia Mantova
Presentazione progetto catasto sicurezza ponti Provincia MantovaPresentazione progetto catasto sicurezza ponti Provincia Mantova
Presentazione progetto catasto sicurezza ponti Provincia Mantovaprovinciadimantova
 
Progetto, realizzazione e caratterizzazione dell'elettronica di acquisizione ...
Progetto, realizzazione e caratterizzazione dell'elettronica di acquisizione ...Progetto, realizzazione e caratterizzazione dell'elettronica di acquisizione ...
Progetto, realizzazione e caratterizzazione dell'elettronica di acquisizione ...MarcoCautero1
 
Elaborazione della risposta idrologica del torrente Astico | Modello geomorfo...
Elaborazione della risposta idrologica del torrente Astico | Modello geomorfo...Elaborazione della risposta idrologica del torrente Astico | Modello geomorfo...
Elaborazione della risposta idrologica del torrente Astico | Modello geomorfo...MatteoMeneghetti3
 
Studio_sul_trasporto_combinato_ferroviario_aereo
Studio_sul_trasporto_combinato_ferroviario_aereoStudio_sul_trasporto_combinato_ferroviario_aereo
Studio_sul_trasporto_combinato_ferroviario_aereoLuigi Tecno
 
Documentazione Progetto ARTU
Documentazione Progetto ARTUDocumentazione Progetto ARTU
Documentazione Progetto ARTUdepter
 
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...michael_mozzon
 
VERIFICA DEL MODELLO DI ESERCIZIO PER LA TRATTA NAZIONALE LATO ITALIA FASE 1 ...
VERIFICA DEL MODELLO DI ESERCIZIO PER LA TRATTA NAZIONALE LATO ITALIA FASE 1 ...VERIFICA DEL MODELLO DI ESERCIZIO PER LA TRATTA NAZIONALE LATO ITALIA FASE 1 ...
VERIFICA DEL MODELLO DI ESERCIZIO PER LA TRATTA NAZIONALE LATO ITALIA FASE 1 ...Quotidiano Piemontese
 
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...Analisi e prototipazione di un sistema di streaming per la localizzazione in ...
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...TiborRacman
 
Capitolato tecnico rotatoria
Capitolato tecnico rotatoriaCapitolato tecnico rotatoria
Capitolato tecnico rotatoriaValleditria News
 
PGS - lezione C - controllo e manutenzione.pdf
PGS - lezione C - controllo e manutenzione.pdfPGS - lezione C - controllo e manutenzione.pdf
PGS - lezione C - controllo e manutenzione.pdfFranco Bontempi
 
Autorità per le Garanzie nelle Comunicazioni Relazione 2009
Autorità per le Garanzie nelle Comunicazioni Relazione 2009Autorità per le Garanzie nelle Comunicazioni Relazione 2009
Autorità per le Garanzie nelle Comunicazioni Relazione 2009STUDIO BARONI
 
Studio di opendata acquisiti tramite tecnologie MODE S e ADS-B per l'analisi...
 Studio di opendata acquisiti tramite tecnologie MODE S e ADS-B per l'analisi... Studio di opendata acquisiti tramite tecnologie MODE S e ADS-B per l'analisi...
Studio di opendata acquisiti tramite tecnologie MODE S e ADS-B per l'analisi...paolabassi2
 
Linee guida attraversamenti_pedonali_2011
Linee guida attraversamenti_pedonali_2011Linee guida attraversamenti_pedonali_2011
Linee guida attraversamenti_pedonali_2011Giorgio Marcon
 
Taxi cabs & crime in San Francisco
Taxi cabs & crime in San FranciscoTaxi cabs & crime in San Francisco
Taxi cabs & crime in San FranciscoTommaso Furlan
 
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...shadykal
 
Applicazione dell'algoritmo di clustering DBSCAN allo studio di traiettorie a...
Applicazione dell'algoritmo di clustering DBSCAN allo studio di traiettorie a...Applicazione dell'algoritmo di clustering DBSCAN allo studio di traiettorie a...
Applicazione dell'algoritmo di clustering DBSCAN allo studio di traiettorie a...GiorgiaNadizar
 

Similar to Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste (20)

Analisi e sviluppo di un algoritmo di pianificazione ordini di una ditta di t...
Analisi e sviluppo di un algoritmo di pianificazione ordini di una ditta di t...Analisi e sviluppo di un algoritmo di pianificazione ordini di una ditta di t...
Analisi e sviluppo di un algoritmo di pianificazione ordini di una ditta di t...
 
Sviluppo di un hub di comunicazione in un applicazione per porti con Biztalk ...
Sviluppo di un hub di comunicazione in un applicazione per porti con Biztalk ...Sviluppo di un hub di comunicazione in un applicazione per porti con Biztalk ...
Sviluppo di un hub di comunicazione in un applicazione per porti con Biztalk ...
 
Presentazione progetto catasto sicurezza ponti Provincia Mantova
Presentazione progetto catasto sicurezza ponti Provincia MantovaPresentazione progetto catasto sicurezza ponti Provincia Mantova
Presentazione progetto catasto sicurezza ponti Provincia Mantova
 
Progetto, realizzazione e caratterizzazione dell'elettronica di acquisizione ...
Progetto, realizzazione e caratterizzazione dell'elettronica di acquisizione ...Progetto, realizzazione e caratterizzazione dell'elettronica di acquisizione ...
Progetto, realizzazione e caratterizzazione dell'elettronica di acquisizione ...
 
Elaborazione della risposta idrologica del torrente Astico | Modello geomorfo...
Elaborazione della risposta idrologica del torrente Astico | Modello geomorfo...Elaborazione della risposta idrologica del torrente Astico | Modello geomorfo...
Elaborazione della risposta idrologica del torrente Astico | Modello geomorfo...
 
Studio_sul_trasporto_combinato_ferroviario_aereo
Studio_sul_trasporto_combinato_ferroviario_aereoStudio_sul_trasporto_combinato_ferroviario_aereo
Studio_sul_trasporto_combinato_ferroviario_aereo
 
Documentazione Progetto ARTU
Documentazione Progetto ARTUDocumentazione Progetto ARTU
Documentazione Progetto ARTU
 
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
 
VERIFICA DEL MODELLO DI ESERCIZIO PER LA TRATTA NAZIONALE LATO ITALIA FASE 1 ...
VERIFICA DEL MODELLO DI ESERCIZIO PER LA TRATTA NAZIONALE LATO ITALIA FASE 1 ...VERIFICA DEL MODELLO DI ESERCIZIO PER LA TRATTA NAZIONALE LATO ITALIA FASE 1 ...
VERIFICA DEL MODELLO DI ESERCIZIO PER LA TRATTA NAZIONALE LATO ITALIA FASE 1 ...
 
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...Analisi e prototipazione di un sistema di streaming per la localizzazione in ...
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...
 
Capitolato tecnico rotatoria
Capitolato tecnico rotatoriaCapitolato tecnico rotatoria
Capitolato tecnico rotatoria
 
PGS - lezione C - controllo e manutenzione.pdf
PGS - lezione C - controllo e manutenzione.pdfPGS - lezione C - controllo e manutenzione.pdf
PGS - lezione C - controllo e manutenzione.pdf
 
Autorità per le Garanzie nelle Comunicazioni Relazione 2009
Autorità per le Garanzie nelle Comunicazioni Relazione 2009Autorità per le Garanzie nelle Comunicazioni Relazione 2009
Autorità per le Garanzie nelle Comunicazioni Relazione 2009
 
Studio di opendata acquisiti tramite tecnologie MODE S e ADS-B per l'analisi...
 Studio di opendata acquisiti tramite tecnologie MODE S e ADS-B per l'analisi... Studio di opendata acquisiti tramite tecnologie MODE S e ADS-B per l'analisi...
Studio di opendata acquisiti tramite tecnologie MODE S e ADS-B per l'analisi...
 
Lamrecor
LamrecorLamrecor
Lamrecor
 
Linee guida attraversamenti_pedonali_2011
Linee guida attraversamenti_pedonali_2011Linee guida attraversamenti_pedonali_2011
Linee guida attraversamenti_pedonali_2011
 
Taxi cabs & crime in San Francisco
Taxi cabs & crime in San FranciscoTaxi cabs & crime in San Francisco
Taxi cabs & crime in San Francisco
 
Rapporto finale
Rapporto finaleRapporto finale
Rapporto finale
 
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...
 
Applicazione dell'algoritmo di clustering DBSCAN allo studio di traiettorie a...
Applicazione dell'algoritmo di clustering DBSCAN allo studio di traiettorie a...Applicazione dell'algoritmo di clustering DBSCAN allo studio di traiettorie a...
Applicazione dell'algoritmo di clustering DBSCAN allo studio di traiettorie a...
 

Recently uploaded

GIORNATA TECNICA 18/04 | DE ROSA Roberto
GIORNATA TECNICA 18/04 | DE ROSA RobertoGIORNATA TECNICA 18/04 | DE ROSA Roberto
GIORNATA TECNICA 18/04 | DE ROSA RobertoServizi a rete
 
Descrizione della struttura architettonica Eretteo.pptx
Descrizione della struttura architettonica Eretteo.pptxDescrizione della struttura architettonica Eretteo.pptx
Descrizione della struttura architettonica Eretteo.pptxtecongo2007
 
GIORNATA TECNICA 18/04 | BENANTI Alessandro
GIORNATA TECNICA 18/04 | BENANTI AlessandroGIORNATA TECNICA 18/04 | BENANTI Alessandro
GIORNATA TECNICA 18/04 | BENANTI AlessandroServizi a rete
 
GIORNATA TECNICA 18/04 | LITTERIO Raffaele
GIORNATA TECNICA 18/04 | LITTERIO RaffaeleGIORNATA TECNICA 18/04 | LITTERIO Raffaele
GIORNATA TECNICA 18/04 | LITTERIO RaffaeleServizi a rete
 
GIORNATA TECNICA 18/04 | SPIZZIRRI Massimo
GIORNATA TECNICA 18/04 | SPIZZIRRI MassimoGIORNATA TECNICA 18/04 | SPIZZIRRI Massimo
GIORNATA TECNICA 18/04 | SPIZZIRRI MassimoServizi a rete
 
GIORNATA TECNICA DA AQP 18/04 | ZONNO Serena
GIORNATA TECNICA DA AQP 18/04 | ZONNO SerenaGIORNATA TECNICA DA AQP 18/04 | ZONNO Serena
GIORNATA TECNICA DA AQP 18/04 | ZONNO SerenaServizi a rete
 
GIORNATA TECNICA DA AQP 18/04 | MOTTA Simone
GIORNATA TECNICA DA AQP 18/04 | MOTTA SimoneGIORNATA TECNICA DA AQP 18/04 | MOTTA Simone
GIORNATA TECNICA DA AQP 18/04 | MOTTA SimoneServizi a rete
 
GIORNATA TECNICA 18/04 | DE LEO Antonio
GIORNATA TECNICA 18/04  | DE LEO AntonioGIORNATA TECNICA 18/04  | DE LEO Antonio
GIORNATA TECNICA 18/04 | DE LEO AntonioServizi a rete
 

Recently uploaded (8)

GIORNATA TECNICA 18/04 | DE ROSA Roberto
GIORNATA TECNICA 18/04 | DE ROSA RobertoGIORNATA TECNICA 18/04 | DE ROSA Roberto
GIORNATA TECNICA 18/04 | DE ROSA Roberto
 
Descrizione della struttura architettonica Eretteo.pptx
Descrizione della struttura architettonica Eretteo.pptxDescrizione della struttura architettonica Eretteo.pptx
Descrizione della struttura architettonica Eretteo.pptx
 
GIORNATA TECNICA 18/04 | BENANTI Alessandro
GIORNATA TECNICA 18/04 | BENANTI AlessandroGIORNATA TECNICA 18/04 | BENANTI Alessandro
GIORNATA TECNICA 18/04 | BENANTI Alessandro
 
GIORNATA TECNICA 18/04 | LITTERIO Raffaele
GIORNATA TECNICA 18/04 | LITTERIO RaffaeleGIORNATA TECNICA 18/04 | LITTERIO Raffaele
GIORNATA TECNICA 18/04 | LITTERIO Raffaele
 
GIORNATA TECNICA 18/04 | SPIZZIRRI Massimo
GIORNATA TECNICA 18/04 | SPIZZIRRI MassimoGIORNATA TECNICA 18/04 | SPIZZIRRI Massimo
GIORNATA TECNICA 18/04 | SPIZZIRRI Massimo
 
GIORNATA TECNICA DA AQP 18/04 | ZONNO Serena
GIORNATA TECNICA DA AQP 18/04 | ZONNO SerenaGIORNATA TECNICA DA AQP 18/04 | ZONNO Serena
GIORNATA TECNICA DA AQP 18/04 | ZONNO Serena
 
GIORNATA TECNICA DA AQP 18/04 | MOTTA Simone
GIORNATA TECNICA DA AQP 18/04 | MOTTA SimoneGIORNATA TECNICA DA AQP 18/04 | MOTTA Simone
GIORNATA TECNICA DA AQP 18/04 | MOTTA Simone
 
GIORNATA TECNICA 18/04 | DE LEO Antonio
GIORNATA TECNICA 18/04  | DE LEO AntonioGIORNATA TECNICA 18/04  | DE LEO Antonio
GIORNATA TECNICA 18/04 | DE LEO Antonio
 

Analisi,ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di trieste

  • 1. UNIVERSITÀ DEGLI STUDI DI TRIESTE Dipartimento di Ingegneria e Architettura Laurea Magistrale in Ingegneria Elettronica ed Informatica Analisi, ottimizzazione e applicazione della teoria delle code al traffico camionistico tra autoporti e porto di Trieste 15 dicembre 2021 Laureando Relatore Davide Michielin Prof. Lorenzo Castelli Correlatori Dott. Lorenzo Cerini Anno Accademico 2020/2021
  • 2.
  • 3. “E allora noi andavamo lenti perché pensavamo che la vita funzionasse cosı̀, che bastava strappare lungo i bordi, piano piano, seguire la linea tratteggiata di ciò a cui eravamo destinati e tutto avrebbe preso la forma che doveva avere.” — Zerocalcare — Alla mia famiglia
  • 4.
  • 5. Indice Introduzione 1 Il porto di Trieste e il traffico Ro-Ro 1.1 Il porto di Trieste . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Il traffico Ro-Ro . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 Aree di sosta . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3.1 Interporto di Fernetti . . . . . . . . . . . . . . . . . . . 4 1.3.2 ABA (Authorized Buffer Area) . . . . . . . . . . . . . 5 2 Preparazione all’analisi dei dati 2.1 Sinfomar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 Prelievo dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.3 Descrizione e preparazione dei dati . . . . . . . . . . . . . . . 9 2.4 Data Cleaning . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.4.1 Individuazione dei tratti e calcolo tempi . . . . . . . . 11 2.5 Salvataggio e visualizzazione dei dati . . . . . . . . . . . . . . 15 3 Analisi temporale dei tratti 3.1 Registrazione - Entrata Autoporto . . . . . . . . . . . . . . . . 18 3.2 Entrata - Uscita Autoporto . . . . . . . . . . . . . . . . . . . 19 3.3 Concessione Autorizzazione - Uscita Autoporto . . . . . . . . 20 3.4 Superstrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.5 Entrata Terminal - Imbarco . . . . . . . . . . . . . . . . . . . 24 3.6 Uscite Autoporti ed Entrate Terminal . . . . . . . . . . . . . . 25 3.7 Conclusioni dell’analisi . . . . . . . . . . . . . . . . . . . . . . 27 4 Modellizzazione delle distribuzioni 4.1 Fitting dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.2 Distribution Fitter . . . . . . . . . . . . . . . . . . . . . . . . 32 4.3 Risultati ottenuti . . . . . . . . . . . . . . . . . . . . . . . . . 33 4.3.1 Superstrada . . . . . . . . . . . . . . . . . . . . . . . . 33 4.3.2 Superstrada senza traffico . . . . . . . . . . . . . . . . 35
  • 6. INDICE 4.3.3 Partenze dagli autoporti . . . . . . . . . . . . . . . . . 37 4.3.4 Arrivi ai terminal . . . . . . . . . . . . . . . . . . . . . 38 5 Sviluppo del modello 5.1 Teoria delle code . . . . . . . . . . . . . . . . . . . . . . . . . 41 5.2 Simulink . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 5.3 Discussione e generazione del modello . . . . . . . . . . . . . . 44 5.3.1 Uscita dall’autoporto . . . . . . . . . . . . . . . . . . . 45 5.3.2 Percorrenza superstrada . . . . . . . . . . . . . . . . . 45 5.3.3 Varco portuale . . . . . . . . . . . . . . . . . . . . . . 46 5.4 Verifica del modello . . . . . . . . . . . . . . . . . . . . . . . . 47 5.5 Applicazione del modello ai dati totali . . . . . . . . . . . . . 48 6 Ottimizzazione e applicazione al modello 6.1 Sviluppo e applicazione della prima ipotesi . . . . . . . . . . . 51 6.2 Sviluppo e applicazione della seconda ipotesi . . . . . . . . . . 55 A Codice pulizia e preparazione dei dati B Codice analisi dati
  • 7. Introduzione Il porto di Trieste rappresenta lo scalo principale del Friuli-Venezia-Giulia ed è gestito dall’Autorità di Sistema Portuale del Mare Adriatico Orientale. Data la sua posizione vantaggiosa, nel cuore del continente europeo, esso rappresenta un centro di snodo per tutti i flussi che interessano il mercato del Centro ed Est Europa ma anche quello dell’Oriente, con rotte marittime che collegano i maggiori porti del Mediterraneo orientale. Una grande porzione dei traffici del porto è rappresentata dai traffici Ro-Ro (Roll On-Roll Off) [4], effettuati attraverso delle particolari navi che per- mettono l’imbarco e lo sbarco di autotreni (interi o solo rimorchi) e veicoli ferroviari. I maggiori scambi avvengono con i porti principali della Turchia, con la quale il porto di Trieste ha stipulato un legame strategico di movimentazione delle merci, la cosiddetta Autostrada del mare. Proprio per questo motivo, un imponente traffico di automezzi si sposta dalle regioni del centro ed est Europa, per poi arrivare al porto di Trieste e imbar- carsi su una nave diretta verso paesi del medio Oriente: questo comporta un’ enorme occupazione delle strade per arrivare ai terminal portuali, con conse- guente nascita di code che possono portare non pochi problemi alla viabilità e all’ambiente. Prima di effettuare l’entrata in porto, un automezzo deve passare in un’area di sosta predisposta per attendere il “semaforo verde”. Il motivo principale per cui ha avuto luogo, in passato, il problema delle code all’entrata del porto era legato al fatto che una parte dei traffici generati nel- l’interporto1 di Fernetti2 era gestito tramite i sistemi privati della Samer&Co. shipping che non utilizzava una vera e propria procedura per la partenza dei camion in attesa di imbarcarsi sulle navi. Infatti, venivano selezionati i ca- mion da far partire anche se la nave di imbarco non aveva ancora attraccato presso il porto e questo portava a code elevate nei pressi delle entrate dei vari 1 Vasta area di sosta temporanea per autotreni, automezzi e mezzi ferroviari realizzata in prossimità di luoghi di frontiera in cui vengono svolte operazioni doganali. 2 Frazione di Monrupino, situata a nord-est del capoluogo giuliano i
  • 8. INTRODUZIONE terminal. A partire dal 2008, sotto richiesta del prefetto, il pezzo di area di sosta di proprietà di Samer è stato acquistato e integrato completamente con l’intero autoporto 3 , quindi le partenze dei vari automezzi sono state gestite in ma- niera molto più regolare, andando a concedere il “semaforo verde” agli autisti solo nel caso in cui la nave fosse in procinto di arrivare (con garanzia di spazi di sosta liberi per il posteggio all’interno dei terminal in attesa dell’arrivo della nave) o fosse già attraccata ad uno degli ormeggi dell’area portuale. Tutte queste fasi sono state sviluppate negli anni e quella più importante è avvenuta nel 2016, con l’integrazione dei traffici dell’Interporto nel Port Community System Sinfomar. Successivamente, l’attuazione del progetto Fer-Net[5], che ha permesso di creare un corridoio monitorato tra autoporto e porto, riconoscendo l’area di sosta di Fernetti come vero e proprio terminal di accesso, ha portato ad una diminuzione di queste code e ai relativi disagi che esse creavano. Nonostante questo, il problema delle code nella superstrada che permette di arrivare ai varchi di entrata del porto non è stato ancora completamente debellato, soprattutto nelle giornate di venerdı̀ e sabato (dato il divieto di circolazione per i mezzi pesanti nei giorni festivi 4 ) in cui un numero ingente di automezzi provocano disagi alla viabilità. Questo progetto di tesi si pone l’obiettivo di trovare una soluzione a questo problema, procedendo, in un primo momento, con un’analisi dei dati relativi ai tempi di alcuni tratti individuati nel percorso tra l’entrata in autoporto e l’imbarco in nave dei camion che sono giunti a Fernetti o in una delle aree di sosta del territorio triestino nel periodo Marzo-Aprile 2021 presenti nel Port Community System del porto di Trieste (Sinfomar). Questo intervallo di tempo è stato scelto in quanto rappresenta dei dati rilevati nel 2021, quindi abbastanza recenti. Inoltre, questi due mesi non presentano particolari fe- stività troppo lunghe che potrebbero portare ad avere dei giorni in cui viene segnalata una quantità di dati non significativa. Successivamente, dai risultati di questa analisi, sono state studiate le effetti- ve distribuzioni dei tratti su cui si è applicato il processo di ottimizzazione, identificando i modelli probabilistici che meglio si adattavano ai dati in pos- sesso. Dopodiché, per effettuare la simulazione dei casi reali e valutare i risultati ottenuti, si è ipotizzata la creazione di un modello ad eventi discreti che è stato opportunamente verificato. In seguito, dopo aver discusso i risultati 3 Parte dell’interporto dedicato alle zone di sosta per veicoli su gomma 4 Decreto del ministero delle infrastrutture e dei trasporti del 29 Dicembre 2020, Articolo 1: https://www.gazzettaufficiale.it/eli/id/2020/12/31/20A07414/sg ii
  • 9. INTRODUZIONE della simulazione utilizzando la distribuzione dei tempi di percorrenza della superstrada attuali, si è tentato di applicare una prima ipotesi di ottimizza- zione, modificando la distribuzione dei tempi di tragitto con una distribuzione ipotizzata a seguito della modificazione del tempo di permesso per ciascun autista. Dal momento che questa prima supposizione non ha portato ad un effettivo miglioramento, è stata teorizzata una seconda ipotesi circa il cambiamento della distribuzione delle uscite dagli autoporti, dilazionandole nel tempo al fine di evitare picchi nelle partenze in alcuni periodi della giornata. La seguente tesi è strutturata nel seguente modo: • Nel primo capitolo si procede con una presentazione generale del Porto di Trieste, del traffico Ro-Ro e delle aree di sosta presenti nel territorio triestino. • Nel secondo si parla della fase di pre-processing e visualizzazione dei dati, con una breve presentazione del Port Community System “Sinfo- mar”. • Nel terzo si svolge un’analisi dei dati trovati, suddividendola nei vari tratti d’interesse. • Nel quarto viene descritto il processo di “distribution fitting” e i risul- tati ottenuti attraverso l’uso di un tool del software Matlab. • Nel quinto viene teorizzato il modello che verrà utilizzato nella succes- siva simulazione e si discuterà dei risultati ottenuti utilizzando i dati in nostro possesso. • Nel sesto capitolo vengono presentate le effettive ipotesi di ottimizza- zione e i risultati ottenuti saranno descritti in una sezione conclusiva. iii
  • 10. Capitolo 1 Il porto di Trieste e il traffico Ro-Ro In questo primo capitolo vengono descritti i principali aspetti e le principali caratteristiche del porto di Trieste e del traffico Ro-Ro. Vengono presentate, inoltre, le aree di sosta presenti nel territorio triestino, le quali rappresentano delle strutture fondamentali per il traffico preceden- temente citato e raffigurano il punto iniziale della analisi dati. 1.1 Il porto di Trieste Il porto di Trieste è gestito dall’Autorità di Sistema Portuale del Mare Adria- tico Orientale che recentemente ha inglobato sotto la sua gestione anche il porto di Monfalcone. Situato nel golfo dell’omonima città, il porto di Trieste è composto da cinque aree fondamentali, tre delle quali sono predisposte per fini commerciali men- tre due sono utilizzate per scopi industriali. Queste sono: il Punto Franco Vecchio, il Punto Franco Nuovo, lo scalo legnami, il terminal industriale e il terminal petroli. I traffici marittimi che interessano il porto di Trieste riguardano sia lo scam- bio di merci, sia il trasporto passeggeri e il turismo legato al mare. Per quanto riguarda lo scambio di merci, oltre a prevedere traffici tramite navi Ro-Ro, questi interessano anche la movimentazione di navi container o di navi cisterna per il trasporto di materiale grezzo (minerali, petrolio, ecc.). Nonostante il precedente anno segnato dalla pandemia, il porto di Trieste non ha segnalato grosse perdite, andando anche ad incrementare il traffico nel settore Ro-Ro. [3] Nel 2018, ha fatto segnalare una movimentazione di 57 milioni di tonnellate 1
  • 11. CAPITOLO 1. IL PORTO DI TRIESTE E IL TRAFFICO RO-RO di merci, divenendo cosı̀ primo porto in Italia e nono porto in Europa per quantità di beni partiti. Oltre a prevedere servizi di trasporto su nave, il porto di Trieste si distingue per il forte sviluppo dei servizi ferroviari, grazie anche alla collaborazione con alcune società come Alpe Adria S.r.l. e Adriafer S.r.l., che permettono un continuo scambio di merci con la maggior parte degli stati del Centro ed Est Europa. La caratteristica principale di questa realtà è rappresentata dal regime di Porto Franco, fondato nel 1719 dall’imperatore Carlo VI e conservato dopo la seconda guerra mondiale con il trattato di Parigi del 1947 [1]. Le zone che compongono il Porto Franco sono quelle citate in precedenza e visibili in figura 1.1. Legalmente non appartengono al territorio dell’Unione Europea. Figura 1.1: Disposizione dei punti franchi del porto I vantaggi di queste zone sono relativi ai pagamenti di iva e dazi (che pre- vedono un tasso di interesse molto limitato), il magazzinaggio (con possibilità di sosta delle merci per un tempo indeterminato) e il carico dei prodotti (le merci sono considerate al di fuori dell’Unione Europea e quindi non servono autorizzazioni specifiche per imbarcarle). Per il futuro, è previsto che alcune zone del porto (soprattutto nei moli e in alcuni terminal) vengano ampliate, a causa del notevole flusso di merci incrementatosi in questi anni, frutto delle innovazioni e all’aumento di nuove infrastrutture relative al traffico su rotaia. 1.2 Il traffico Ro-Ro Questo tipo di traffico è effettuato per mezzo di navi dedicate che permettono l’imbarco e lo sbarco, attraverso l’uso di una rampa spesso localizzata sulla poppa della nave, di mezzi di trasporto su gomma o su rotaia. Nel caso in 2
  • 12. CAPITOLO 1. IL PORTO DI TRIESTE E IL TRAFFICO RO-RO analisi, i principali veicoli trasportati sono i mezzi pesanti adibiti al trasporto di merci. Si distinguono dalle navi Lo-Lo (Lift On-Lift Off), in cui una gru viene uti- lizzata per il caricamento e lo scaricamento del carico. Rispetto alle navi merci, in cui il carico è normalmente calcolato in tonnel- late, in quelle di tipo Ro-Ro si usa un’altra unità di misura che rappresenta il numero di corsie in metri lineari (LIMs 1 ). Le navi Ro-Ro possono operare anche su percorsi fluviali se opportunamente ridimensionate e utilizzando delle rampe preinstallate all’interno della nave. Gli automezzi possono essere imbarcati in due modi: • caricando il rimorchio e la motrice • caricando solamente il rimorchio Nel secondo caso, in virtù del regime di Punto Franco del porto di Trieste, la motrice che ha effettuato il trasporto del semirimorchio per l’imbarco e di proprietà dell’azienda dello stesso, può essere utilizzato anche per la fase di sbarco e trasferimento dal porto verso la destinazione finale. Nei porti “normali” questa procedura non avviene e i proprietari dei semirimorchi so- no costretti a stipulare dei contratti con delle aziende locali per il trasporto delle merci verso la destinazione. 1.3 Aree di sosta Prima di giungere al terminal portuale per poter essere imbarcato, un camion giunge in una delle cinque aree di sosta presenti nel territorio triestino. Oltre a rappresentare degli enormi spazi dove poter parcheggiare l’automezzo e do- ve l’autista può decidere di riposarsi (in alcuni di essi sono presenti anche dei comfort quali ristoranti e docce), in esse si svolgono anche tutte le operazioni doganali necessarie per far entrare successivamente il mezzo pesante in porto. Tra queste aree troviamo l’interporto di Fernetti, situato nel comune di Mon- rupino, e le varie Authorized Buffer Area (più brevemente chiamate ABA) che appartengono a ditte di spedizionieri2 o autotrasportatori3 . 1 Unità di misura per il calcolo della superficie del ponte nelle navi Roll On-Roll Off. Corrispondono ad un metro di corsia del ponte e ad una larghezza di 2 metri (quindi una superficie di 2 metri quadrati) 2 Azienda che si occupa di organizzare la spedizione andando a stipulare dei contratti con le imprese di trasporto e di svolgere tutte le operazioni accessorie quali, ad esempio, l’imballaggio della merce o la prenotazione dello spazio all’interno della nave 3 Azienda che si occupa del solo trasporto della merce, mettendo a disposizione le motrici. 3
  • 13. CAPITOLO 1. IL PORTO DI TRIESTE E IL TRAFFICO RO-RO 1.3.1 Interporto di Fernetti Costruito nel 1972, l’interporto è situato nei pressi del confine Italo-Sloveno in località Fernetti. Nel 1978 è entrata in funzione la prima area di sosta per veicoli su gomma, che venne ultimata nel 1982, quando venne costituita la Società per Azioni “Gestione Autoporto di Fernetti”. Dal 2015, la società, dopo aver cambiato il proprio nome anche nel 1997 in “Terminal Intermodale di Trieste-Fernetti”, assume la denominazione di “Interporto di Trieste SpA” ed è gestita da un insieme di soggetti. Tra que- sti sono presenti: la Regione Autonoma Friuli-Venezia Giulia, il comune di Trieste o l’Autorità Portuale del Mar Adriatico Orientale. È diventato il centro strategico per le connessioni con l’Europa Centro- Orientale in quanto tutti i camion provenienti da paesi quali Germania o Austria, entrano al suo interno in attesa di poter essere imbarcati principal- mente per la Turchia o per altri porti. Questa struttura può contare su una superficie di 350 mila metri quadrati ed è composta da tre aree principali (come mostrato in Fig. 1.2): • Parking 1 • Parking 2 • Serpentone Figura 1.2: Disposizione delle zone di Fernetti: in blu, il parking 2; in rosso, il serpentone; il parking 1 è la zona circondata dal serpentone Nella zona del parking 1, oltre ai parcheggi per i vari automezzi, si possono trovare gli uffici dell’Agenzia delle Dogane e degli spedizionieri, altre aree di 4
  • 14. CAPITOLO 1. IL PORTO DI TRIESTE E IL TRAFFICO RO-RO supporto agli operatori e delle zone di ristoro per gli autisti presenti nell’au- toporto. Nella zona del parking 2 troviamo, oltre alla zona di parcheggio, una super- ficie di 30 mila metri quadrati occupati da magazzini coperti, adibiti spe- cialmente per lo stoccaggio di merci alimentari (HACCP) e merci pericolose (con una propria categoria ADR). Inoltre, sono presenti anche un’officina per la riparazione delle motrici che si fermano nell’area di sosta e una zona composta da 6 binari, suddivisi in due fasci operativi (Nord e Sud), che per- mettono il collegamento ferroviario con il porto e con stazioni ferroviarie per il trasporto di merci verso la Slovenia, le aree balcaniche e l’est Europa. 1.3.2 ABA (Authorized Buffer Area) Le authorized buffer area sono delle aree allestite per la sosta dei camion. Sono state create in seguito alla richiesta di alcuni trasportatori e spedizio- nieri locali di poter avere una propria area in cui svolgere tutte le operazioni burocratiche senza dover mandare i propri autisti a Fernetti per poter richie- dere la stampa del permesso di accesso prima di poter scendere in porto. L’uscita dei vari camion non viene gestita in modo preciso come a Fernetti: di solito, un addetto o un operatore dell’area controlla gli automezzi rimasti nella zona e verifica quali sono partiti mettendoli a confronto con l’ultimo controllo. La data e l’ora di uscita vengono quindi riportate nel momento in cui viene effettuato l’accertamento periodico. Un operatore può richiedere all’autorità portuale di utilizzare una certa area di sua proprietà come Authorized Buffer Area e l’autorizzazione viene data solamente nel caso in cui vengano rispettati alcuni requisiti come, ad esempio, la minima superficie utilizzabile come zona di sosta degli automezzi o che il terreno sia effettivamente in grado di ospitare i mezzi pesanti (ad esempio deve essere ben livellato, il che comporta un’enorme spesa per l’o- peratore o l’armatore4 che vuole creare la propria area di sosta). 4 Persona fisica o giuridica che gestisce la propria nave o una nave a noleggio. È colui che si occupa dell’assunzione del comandante della nave e dell’equipaggio che ne farà parte. È inoltre responsabile civile per gli obblighi derivanti dall’esercizio della nave. 5
  • 15. CAPITOLO 1. IL PORTO DI TRIESTE E IL TRAFFICO RO-RO Figura 1.3: Distribuzione delle varie ABA e dei terminal Ro-Ro nel territorio di Trieste 6
  • 16. Capitolo 2 Preparazione all’analisi dei dati 2.1 Sinfomar Sinfomar è il Port Community System dell’Autorità Portuale del Mare Adria- tico Orientale e permette di gestire tutto ciò che riguarda le attività del porto di Trieste e dei suoi Punti Franchi. Figura 2.1: Homepage di Sinfomar L’obiettivo è quello di ottimizzare tutti i processi logistici relativi al porto 7
  • 17. CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI attraverso un sistema ”single window”1 a cui possono accedere tutti gli attori facenti parte di questa realtà (terminalisti, Autorità Portuale, Agenzia delle Dogane, Guardia di Finanza, ecc). Essendo il porto di Trieste un punto multimodale, nella piattaforma, oltre a trovare tutti i dati relativi alle attività marittime, si possono recuperare tutte le informazioni riguardanti i trasporti da e verso il porto effettuati su rotaia o su gomma: questi ultimi sono stati utili per il lavoro di analisi effettuato per questo elaborato. 2.2 Prelievo dei dati Prima di discutere di come sono stati prelevati i dati, è utile capire quali sono i tre elementi importanti per procedere con questa analisi: • Preavvisi: documenti necessari per l’arrivo in porto della merce per l’esportazione o il transito. Vengono generati dall’operatore economi- co, ovvero la ditta che si occupa del trasporto della merce, e vengono associati ad una registrazione nel momento in cui l’autista si registra presso l’autoporto di Fernetti. Sono stati introdotti dall’Agenzia delle Dogane e dall’Autorità Portuale per ottimizzare i tempi di scarico e carico delle merci e per monitorare i flussi di quest’ultime, in modo da rilevare eventuali anomalie in una modalità completamente automatiz- zata. Sono costituiti dalle informazioni relative alla merce trasportata e l’unità logistica di scorta2 . É importante notare che ad una registrazione può essere associato più di un preavviso, poiché può accadere che più utenti della stessa ditta inseriscano un documento per la stessa registrazione (non essendoci an- cora la registrazione, non è possibile verificare che un preavviso sia già stato creato) e il sistema, non avendo un meccanismo di controllo in questa situazione, inserisce più preavvisi associandoli alla targa dello stesso rimorchio. • Registrazioni: generate a partire da un preavviso, le registrazioni rap- presentano il vero e proprio mezzo fisico che viene inserito in Sinfomar. Ad esse vengono associati un id univoco e un numero Sinfomar per, eventualmente, ricercare il preavviso associato alla registrazione nella 1 Struttura che permette a tutte le parti coinvolte nel processo di poter integrare documenti standardizzati attraverso un unico punto di ingresso 2 Motrice utilizzata per il trasporto del rimorchio contenente la merce destinata ad essere imbarcata. 8
  • 18. CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI sezione “Gestione Preavvisi” della piattaforma. Inoltre vengono speci- ficate altre informazioni riguardanti la spedizione quali le targhe della motrice e del rimorchio che trasportano la merce, la destinazione finale o il tipo di carico che verrà imbarcato (solo rimorchio o anche motrice). • Stati: rappresentano il ciclo di vita di una registrazione, dall’inseri- mento in Sinfomar fino alla fase di imbarco dell’autotreno o del solo rimorchio. Per ogni stato è riportata, oltre alla ditta che ha provveduto all’inserimento di quest’ultimo, la data di inserimento, un’etichetta che identifica lo stato(status) e una nota per specificare il significato dello status. [Fig. 2.2] Tutti i dati utilizzati per questo progetto sono presenti in un database gesti- to da Info.Era S.R.L, l’azienda presso cui questo lavoro è stato svolto, che lavora a stretto contatto con l’Autorità Portuale di Trieste e per la quale ha realizzato il sistema Sinfomar. Dopo aver ottenuto le credenziali di accesso alla base dati, è stato necessa- rio definire per quale periodo di tempo sarebbe stato utile implementare la nostra analisi. Analizzando i risultati raggiunti dal porto di Trieste nel 2020 per quanto riguarda il traffico Ro-Ro, che ha fatto registrare un numero pari a 243500 unità transitate [3], è stato deciso che un campione di circa 21000 unità (pari a 2 mesi di raccolta dati) fosse adeguato per poter effettuare l’analisi. Di conseguenza, è stato necessario capire quali fossero i due mesi più adatti per la raccolta di questi dati: tenendo conto dell’idea di analizzare dati piut- tosto recenti (quindi dell’anno corrente) e per evitare dei mesi in cui fossero presenti delle festività che potessero portare ad una diminuzione dei dati la scelta è ricaduta nel periodo tra il 1° Marzo 2021 e il 1° Maggio 2021. Per prelevare i dati dal database (di tipo relazionale), è stato necessario eseguire un’interrogazione sulle tre tabelle contenenti gli elementi di nostro interesse (preavvisi, registrazioni e stati) specificando le date definite prece- dentemente. I record restituiti dal database sono stati esportati in un file csv, per procedere successivamente con il preprocessing di questi dati. 2.3 Descrizione e preparazione dei dati Il file esportato dal database presenta tutti i preavvisi con data di inseri- mento del preavviso compresa nelle date definite. Inoltre, per memorizzare anche le informazioni relative alle registrazioni e agli stati, è stato necessa- 9
  • 19. CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI rio effettuare delle operazioni di left join3 sull’id della registrazione per ogni preavviso. Il numero di record totali presenti nel file è pari a 310614: il numero risulta cosı̀ elevato in quanto sono presenti tutti gli stati di tutte le registrazioni di quei due mesi. Il numero di registrazioni totali presenti è pari a 20889 e, tenendo conto che in alcuni casi ci possono essere delle registrazioni ripetute poiché associate a più preavvisi, il numero totale scende a 19063. 2.4 Data Cleaning La parte iniziale del progetto consiste in una prima pulizia dei dati. Per prima cosa, i dati relativi ad ogni tabella (preavvisi, registrazioni, stati) sono stati divisi in tre file diversi permettendo quindi di lavorare con essi in modo totalmente indipendente l’uno dall’altro. I dati grezzi, contenuti nel csv, presentavano un numero elevato di duplicazioni soprattutto per quanto riguarda le informazioni relative agli stati e quindi è stato necessario, tramite uno script in Python, rimuoverle. Le date specificate nei vari elementi presentano una precisione al secondo. Dato che, per questo studio, la precisione prevista a livello di tempi era del- l’ordine dei minuti, prima di rimuovere eventuali duplicati i dati relativi alle varie date sono stati alterati. Un altro fattore da tenere in considerazione è che un autista può decidere se continuare il suo percorso, una volta uscito dall’autoporto, verso il porto per poi imbarcarsi o scegliere di proseguire per la strada. Questo può succedere perché non sono presenti navi disponibili per l’imbarco il giorno in cui entra in autoporto e decide, quindi, che continuare per la strada sia più conveniente in termini di tempo. Di conseguenza, i dati di questi ultimi non possono essere tenuti in consi- derazione in quanto non si avrebbero abbastanza informazioni sui tempi di percorrenza della superstrada. Inoltre, possono esserci delle registrazioni che presentano uno stato ”INDETERMINATO”, dovuto probabilmente ad una lettura errata della targa che ha portato alla creazione di un nuovo record con la targa esatta. Si è quindi deciso di tenere conto delle sole registrazioni che presentassero l’entrata in uno dei terminal dell’area portuale, ovvero dove la 3 Operazione che mette in relazione due tabelle di un database: vengono presi tutti i dati della prima tabella e vengono messi in corrispondenza della seconda basandosi su una chiave o su un gruppo di chiavi. Se non sono presenti dati corrispondenti nella seconda tabella, le colonne relative vengono impostate a null. 10
  • 20. CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI colonna “Terminal” del record riportasse un codice di quelli elencati nella Tabella 2.1. Codice terminal Descrizione 6 Trieste Marine Terminal (Molo VII) 8 Samer Seaports Terminal (Riva Traiana) 130 T.I.M.T (Orm.47) 143 E.M.T. S.P.A (Molo VI) 209 Imbarcato su nave 1448625646667 Terminal Aree Comuni Tabella 2.1: Codici terminal che indicano l’arrivo del camion in un terminal Alla fine di questa fase di pulizia dei dati, il numero di registrazioni rima- ste per la successiva fase di analisi è pari a 13556 (9918 inserite a Fernetti, le restanti nelle ABA), ovvero il 71,1% dei dati totali. Da questi record rimasti, sono state tolte alcune colonne irrilevanti per la fase successiva poiché con valori uguali per tutti i dati o con la maggior parte dei valori nulli. 2.4.1 Individuazione dei tratti e calcolo tempi Per effettuare l’analisi, l’idea è stata quella di individuare un percorso “vir- tuale” per ogni camion che rappresenti il vero e proprio tragitto di quest’ul- timo andando a identificare l’intervallo di tempo che intercorre nei vari tratti che sono individuabili a partire dagli stati di una registrazione. Per individuare questi tratti, è stata effettuata un’analisi approfondita di una parte delle registrazioni direttamente su Sinfomar, andando a visualiz- zare l’elenco degli stati di ciascuna (Fig. 2.2). Il pattern, pressochè costante in tutte le registrazioni analizzate, fa trasparire questi stati rilevanti: • INSERITO: segnala la data e l’ora di inserimento nel sistema Sinfomar • TRANSITO ENTRATA: l’automezzo è transitato presso un varco di entrata (autoporto o porto) • TRANSITO USCITA: l’automezzo è transitato presso un varco di uscita (autoporto)4 4 In Sinfomar si tiene traccia anche dei camion che dal porto escono per raggiungere i vari autoporti quindi è possibile trovare uno stato di transito uscita associato ad un varco dell’area portuale. Per questo lavoro non è stato necessario considerarlo, in quanto il percorso considerato è stato quello che dai vari autoporti porta alle aree dei terminal. 11
  • 21. CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI Figura 2.2: Esempio di elenco degli stati di una registrazione • FER AUT * OK: il terminal di destinazione ha concesso l’autorizzazione all’automezzo per entrare in porto • CREAZIONE STAMPA: stampa del biglietto di entrata nell’autoporto o del permesso di accesso al porto da parte dell’autista. Quest’ultimo, dal momento della stampa del permesso di accesso ad uno dei terminal, ha 24 ore a disposizione prima che il permesso di accesso scada e ne debba creare un altro. • DICHIARATO IMBARCATO: l’automezzo è imbarcato sulla nave Considerato ciò, si sono potuti individuare quattro tratti principali: • Registrazione Sinfomar - entrata autoporto: intervallo di tempo da quando viene creata la nuova registrazione su Sinfomar alla prima rilevazione di entrata in autoporto. Sapendo che la registrazione viene effettuata all’ingresso del mezzo in autoporto, ci si aspetta che i tempi in questo tratto siano per lo più brevi. 12
  • 22. CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI • Entrata - uscita autoporto: tratto che comprende l’intervallo di tempo tra l’entrata del mezzo a Fernetti o nelle varie ABA e la rispettiva uscita. • Superstrada: tempo di percorrenza, da parte del mezzo, della super- strada che collega l’autoporto al porto • Entrata terminal - Imbarco: tempo di permanenza all’interno del terminal di destinazione, attendendo di essere imbarcato Inoltre, è stato identificato anche un quinto tratto che sarebbe potuto torna- re utile nella successiva fase di analisi ovvero quello che comprende il tempo tra il rilascio dell’autorizzazione da parte del terminal di destinazione del camion e l’uscita effettiva dall’autoporto: si è deciso di calcolare questo intervallo a partire dalla somma dei tempi di due tratti più precisi ovvero quello tra la concessione dell’autorizzazione e la stampa del permesso e quel- lo tra la stampa e la reale uscita dall’area di sosta. I tratti identificati sono visibili in Fig. 2.3: in alcuni casi il tratto che indi- vidua la sosta all’interno dell’autoporto (Entrata-Uscita) può risultare della stessa lunghezza del tratto tra la concessione dell’autorizzazione e l’effettiva uscita. Figura 2.3: Tratti che individuano il percorso che compie un camion dall’entrata in autoporto all’imbarco in nave Il passo successivo, prima di calcolare i minuti dei vari tratti identificati, è stato di unire le tre tabelle in un’unica tabella complessiva in modo da avere tutti i dati a disposizione in un unico file. I varchi presso cui passa un camion per entrare o uscire dall’autoporto o dal porto sono classificati in base alla direzione di transito (entrata o uscita). Nelle note degli stati presenti nei dati presi in considerazione non si fa mai riferimento al varco attraversato dall’automezzo ed è per questo che è stato necessario scaricare, sempre dallo stesso database, le informazioni dei vari varchi e dei transiti che sono stati generati nelle date in esame. Dopo aver unito i dati dei vari attraversamenti agli stati in cui si presentava uno status di tipo “TRANSITO ENTRATA” o “TRANSITO USCITA” (in base all’id dello registrazione e alla data inserimento di quel transito), si è 13
  • 23. CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI potuti procedere con il vero e proprio calcolo dei tempi nei vari tratti. E’ possibile che in alcune situazioni, la data di entrata o di uscita in un certo tratto non sia stata memorizzata nel database: in questo caso, si è scel- to di far assumere valore -1 all’intervallo di tempo del tratto, poiché questa quantità non appartiene al dominio di interesse (i tempi sono sempre positivi, es. un automezzo partito per il porto, non può fare ritorno all’autoporto). Tenuto conto di questo aspetto, i minuti di percorrenza sono stati calcolati nei seguenti modi: • Registrazione Sinfomar - entrata autoporto: la data di inizio di questo tratto viene prelevata dalle informazioni sulla data dello stato con status INSERITO mentre la data di fine è rappresentata dal primo TRANSITO ENTRATA che risulta in un varco dell’autoporto. Analizzando un numero elevato di registrazioni, ci si può accorgere che in alcune di esse non è presente questo tipo di stato: è stato necessario, quindi, tener conto di un’altra informazione per fronteggiare questa mancanza. Per tale ragione, si è deciso di utilizzare anche lo stato con status CREAZIONE STAMPA e con nota Sosta a pagamento o Sosta forzata. • Entrata-uscita Autoporto: la data di inizio di questo tratto risulta essere la data di fine del tratto precedente: se non presente quella di entrata in autoporto, si usa quella di creazione del ticket. La data di fine, invece, è rappresentata dal primo stato TRANSITO USCITA che riporti uno dei varchi di uscita dell’autoporto. • Concessione autorizzazione-stampa permesso: l’inizio di questo tratto è segnalato dalla concessione dell’autorizzazione, il quale è rap- presentato dallo status FER AUT * OK. Un’ipotesi aggiuntiva è stata fat- ta per questo tratto in quanto il numero di registrazioni che presentano questo status sono poco più della metà: se la data di concessione non è presente, si utilizza la data di stampa del permesso di accesso al porto. • Stampa permesso-Uscita autoporto: data di inizio pari alla data della stampa del permesso da parte dell’autista e data fine segnalata dal TRANSITO USCITA di uno dei varchi degli autoporti. • Superstrada: il tempo di permanenza in superstrada è calcolato a partire dalla data di uscita dall’autoporto alla data di entrata di uno dei terminal di imbarco (T.I.M.T, Riva Traiana, E.M.T.-Molo VI). 14
  • 24. CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI • Entrata terminal - Imbarco: quest’ultimo tratto rappresenta il tem- po, in minuti, tra la data di entrata del mezzo in terminal e il primo stato DICHIARATO IMBARCATO segnalato nei dati. I dati validi (con le rispettive percentuali sul numero di record ottenuti dopo la pulizia) sono rappresentati in questa tabella: Tratto Numero dati validi Percentuale Registrazione - entrata 11421 84,2 Entrata - uscita autoporto 11152 82,3 Autorizzazione - stampa 13225 97,5 Stampa permesso - Uscita 13242 97,7 Superstrada 11640 85,6 Entrata terminal - imbarco 11121 82 È importante notare che, con questo procedimento di calcolo dei tempi nei vari tratti, sono risultati degli intervalli di tempo negativi (tranne nel tragitto registrazione-entrata autoporto), dovuti a dei dati non accurati che presentavano, ad esempio, la data di entrata in terminal successiva a quella di imbarco. Questi, che rappresentano al massimo uno 0,3% dei dati totali per ogni tratto, non sono stati considerati nella fase di analisi. 2.5 Salvataggio e visualizzazione dei dati Un punto importante da valutare è relativo alla memorizzazione e alla visua- lizzazione dei dati presenti. Per quanto riguarda la memorizzazione, la prima cosa da affrontare è stata la scelta tra un database di tipo relazionale o non relazionale. Nel primo tutti i dati vengono memorizzati in tabelle differenti e tra di esse esistono delle relazioni mantenute tramite l’uso di chiavi primarie e secon- darie. Esso risulta essere un tipo di database molto potente ma, nonostante questo, non molto efficiente nel caso di grandi carichi di dati o di analisi di dati prelevati da sensori. Il secondo, noto per la sua alta scalabilità e flessibilità, permette di eseguire delle operazioni molto più veloci rispetto a quelle che si implementano in un database relazionale [2] ed è molto indicato nel caso di grandi moli di dati. Proprio per questa ragione, si è deciso di proseguire con questo tipo di data- base. Vi sono quattro tipi principali di database non relazionali: 15
  • 25. CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI • Key-Value store: i dati, in questo caso, vengono memorizzati come coppie di chiave-valore. Si può memorizzare qualsiasi tipo di dato, dalla stringa all’oggetto più complesso che viene rappresentato da più coppie chiave-valore. Risulta essere il più semplice tra i database non relazionali. • Document-Based store: in questo tipo di database i dati sono rappre- sentati da veri e propri documenti, i quali assumono una certa struttura predeterminata. La struttura del documento viene, di solito, definita in un file JSON ed è composta da un identificatore univoco e da un numero di attributi di qualsiasi tipo. • Column-Based store: in un column-based database, ogni colonna del database iniziale viene memorizzata in modo separato dalle altre co- lonne. È un tipo di database non relazionale utile nel caso in cui si voglia restituire l’insieme dei dati di una determinata colonna in modo rapido e veloce. • Graph store: gli elementi principali di questo tipo di database sono i nodi e i grafici. Sono molto utili nel caso di dati fortemente intercon- nessi tra di loro e permette di effettuare interrogazioni mediante un attraversamento efficiente della struttura. Considerato che si è voluto salvare, oltre ai dati dei vari intervalli di tem- po, anche le informazioni sulla registrazione quali il numero Sinfomar o la targa della motrice e del rimorchio, la scelta è ricaduta sul Document-Based database andando a memorizzare un documento per ogni registrazione (Fig. 2.4). Anche il Column-Based database sarebbe potuto essere un utile stru- mento ma avrebbe implicato una eccessiva ricerca tra le varie suddivisioni delle colonne per ritrovare tutti i dati relativi ad una registrazione. Per il tipo di database scelto sono presenti sul mercato diverse implementa- zioni, molte delle quali open source. Tra queste è stata scelta l’opzione di MongoDB, soprattutto dal momento in cui vi era già una implementazione di questo database nell’azienda di riferimento di questo elaborato, risultando più semplice la creazione di una nuova istanza del database. La visualizzazione dei dati è stata implementata in due parti principali: • Spring data: framework Java che permette di implementare il data access layer per accedere e prelevare i dati da un qualsiasi tipo di data- base, relazionale e non. In questo caso, è stata utilizzata l’integrazione per interagire con MongoDB: dopo aver riportato i parametri per ac- 16
  • 26. CAPITOLO 2. PREPARAZIONE ALL’ANALISI DEI DATI Figura 2.4: Struttura di un documento di mongoDB cedere al database nel file di configurazione, sono state definite delle aggregation pipeline 5 per il prelievo dei dati importanti per ogni tratto • Vue.js: framework javascript open-source per la creazione di interfacce utente per pagine web e applicazioni single-page. Per la visualizzazione dei grafici sono stati usati dei componenti facenti parte di Primevue, una libreria di Vue utile per la gestione dell’interfaccia grafica e delle componenti grafiche. Per generare i grafici, viene effettuata una richiesta di tipo GET, utiliz- zando una libreria che implementa un HTTP client (axios), al server che si occupa di andare ad eseguire l’aggregation pipeline necessaria e restituisce il risultato al client. A questo punto, il componente grafico, che risulta essere reattivo, è in grado di modificarsi da solo nel caso in cui i dati cambino e il nuovo grafico viene generato. 5 Elenco ordinato di operazioni chiamate “aggregazioni” che permette, in MongoDB, di eseguire delle query sui documenti presenti nel database per estrarre delle statistiche e restituirli sotto forma di collection 17
  • 27. Capitolo 3 Analisi temporale dei tratti Nei grafici successivi è rappresentata la distribuzione dei tempi nei vari tratti analizzati. Si noti che sull’asse delle ascisse troviamo il valore di tempo con una precisione di 10 minuti (es.valore dell’ascissa pari a 2 = 20-30 minuti) e nell’asse delle ordinate troviamo il numero di registrazioni che hanno fatto registrare quel tempo. Le registrazioni di cui si è tenuto conto sono quelle con destinazioni: Mersin, Pendik, Yalova e Cesme. 3.1 Registrazione - Entrata Autoporto In Figura 3.1 si può notare come i dati relativi a questo tratto rispettino le nostre aspettative: il 99,3% degli automezzi ha fatto segnalare l’entrata in autoporto entro 30 minuti dalla registrazione. Il grafico dai 70 ai 7600 minuti presenta dei dati non visibili in quanto rappresentano al massimo 1-2 unità logistiche per quegli intervalli di tempo. Figura 3.1: Distribuzione dei tempi tratto Registrazione-Entrata Autoporto 18
  • 28. CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI 3.2 Entrata - Uscita Autoporto Il grafico in Figura 3.2 riporta la distribuzione temporale per le varie registra- zioni nel tratto di permanenza nell’autoporto. Nonostante il picco di camion concentrato attorno ai 70/80 minuti, sono presenti anche dei lobi e dei picchi inaspettati nei tempi successivi. L’innalzamento dei dati attorno ai 550 minuti e attorno ai 670 minuti si può giustificare sapendo che è in vigore una legge del regolamento CE 561/2006 in cui si stabilisce che “il limite del periodo di riposo giornaliero è fissato a 11 ore, che può essere ridotto a 9 ore, non più di tre volte a settimana, tra due periodi di riposo settimanali”[6]. È inaspettato invece il lobo creatosi successivamente ai 670 minuti e i pic- chi che troviamo sui 1450 e sui 2750 minuti. Tenendo conto che i tempi di navigazione tra Trieste e Turchia sono compresi fra le 54 e le 60 ore, questi risultati ci confermano che i camion hanno dei tempi di sosta molto elevati e che rappresentano tra il 25% e il 40% del tempo totale. Figura 3.2: Distribuzione dei tempi tratto Entrata-Uscita Autoporto Nonostante i due picchi elevati, la porzione di grafico tra i 550 e i 670 minuti rappresenta solamente il 4,5% dei dati totali mentre il lobo successivo occupa il 34,1%. Quest’ultimo, suddiviso per le varie destinazioni, presenta una distribuzione come quella visibile nella tabella 3.1. È importante porre l’attenzione sul fatto che la maggioranza dei dati presenti per questo tratto sono di registra- zioni di automezzi diretti a Pendik (Fig. 3.3). 19
  • 29. CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI Figura 3.3: Distribuzione delle registrazioni per destinazione per questo tratto Destinazione Percentuale Pendik 53% Cesme 30% Yalova 4% Mersin 13% Tabella 3.1: Distribuzione dei dati per destinazione nel lobo tra i 670 e i 1430 minuti Andando ad analizzare più approfonditamente i dati a nostra disposizione e dividendoli per destinazione e per giorno della settimana, si nota come la maggior parte dei componenti del lobo in esame riporti una data di entrata, nei vari autoporti, nella giornata di venerdı̀ (Tab. 3.2). Tenendo conto che le ore definite in quell’intervallo vanno dalle 12 alle 24, si presume che una buona parte di automezzi si sposti nella giornata di sabato andando, quindi, ad aumentare la probabilità di coda in superstrada. Lunedi Martedi Mercoledi Giovedi Venerdi Sabato Domenica Mersin 15,6 10,5 14,4 14,9 22 21,9 0,7 Pendik 12,4 11,8 17,1 25,6 26,3 6,5 0,3 Yalova 1,3 17,1 12,7 19,6 49,3 0 0 Cesme 15,1 6,9 16,9 20,1 35,8 5 0,2 Tabella 3.2: Distribuzione delle entrate in autoporto (in percentuale) per destinazione e giorno della settimana. 3.3 Concessione Autorizzazione - Uscita Au- toporto In Figura 3.4 si può notare, invece, la distribuzione delle registrazioni nel tratto tra la concessione dell’autorizzazione da parte del terminal e l’uscita dell’automezzo dall’autoporto. In questo caso, il comportamento di questo grafico rispetta le aspettative dato che abbiamo un picco di registrazioni che fanno segnalare meno di 10 minuti tra la concessione dell’autorizzazione e l’uscita dall’autoporto. Da un’analisi più approfondita troviamo che il 57,1% degli automezzi ha fatto 20
  • 30. CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI registrare un’uscita entro i 60 minuti. Andando ad analizzare i tempi tra l’entrata in autoporto e la successiva autorizzazione, si rileva che la media di questi è pari a 670 minuti (equivalente a 11 ore). Il valore è facilmente spiegabile considerando il tipo di traffico che viene generato attualmente. Infatti, dato che la partenza di una nave è prevista circa ogni 24 ore, si tende a concedere l’autorizzazione in maniera distribuita, rilasciando il permesso a una parte dei camion che devono imbarcarsi nelle prime 12 ore e i restanti nelle successive 12. Tenendo conto dei 60 minuti considerati nel tratto attualmente analizzato, possiamo avere un riscontro con il grafico del tratto precedente (Fig. 3.2) in cui vi è il 58,5% delle registrazioni che segnala un’uscita prima dei 730 minuti e che rappresenta la maggior parte dei dati che compongono quel grafico. Figura 3.4: Distribuzione dei tempi tratto Concessione Autorizzazione-Uscita Autoporto Nei due grafici sottostanti, invece, si può notare la distribuzione delle registrazioni per i tratti che compongono il tratto totale: il segmento che va dalla concessione dell’autorizzazione alla stampa di quest’ultima e quello che rappresenta il tempo tra la stampa dell’autorizzazione e l’uscita effettiva dall’autoporto. Il primo grafico risulta sufficientemente regolare, con il maggior numero di elementi che fa registrare un tempo minore di 10 minuti (una parte di questi dati sono il risultato dell’ipotesi fatta precedentemente sulle registrazioni per cui mancava la data di concessione dell’autorizzazione). Il decadimento è perlopiù esponenziale, con un numero di dati che risulta essere abbastanza consistente fino a 90 minuti. Nonostante quanto detto, si calcola che,in me- dia, un autista impieghi 3 ore per stampare il proprio permesso dopo aver ricevuto l’autorizzazione dal terminal. 21
  • 31. CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI Anche il secondo grafico si presenta secondo le aspettative, con un picco nei primi 10 minuti. Si riscontra, inoltre, un numero notevole di registrazioni che riportano tempi tra i 20 e i 30 minuti. In questo caso, si evidenzia una media di due ore tra la stampa del permesso e la successiva uscita dall’autoporto. Figura 3.5: Distribuzione delle registrazioni Concessione-Stampa permesso Figura 3.6: Distribuzione per i dati Stampa permesso-Uscita autoporto 22
  • 32. CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI 3.4 Superstrada Da una prima analisi del grafico generato si può notare che, dopo una rapida crescita e il raggiungimento del picco sui 90/100 minuti, c’è un decadimento piuttosto regolare, nonostante una crescita (limitata) attorno ai 600 minuti. È importante considerare che, per l’autorità portuale, il tempo massimo con- siderato valido per percorrere questo tratto è pari a 90 minuti. Si è introdotta questa tolleranza perché il porto non ha la possibilità di tenere traccia di un automezzo nel momento in cui percorre la superstrada e quindi, nonostante i tempi di percorrenza si attestino attorno ai 30 minuti, non è possibile pre- vedere se il camion abbia trovato traffico per arrivare o vi siano stati altri intoppi durante il viaggio. Questo margine è applicato sia agli automezzi che partono dall’autoporto di Fernetti, sia a quelli che partono dai piazzali delle diverse ABA. Gli automezzi che hanno fatto registrare un tempo minore dei 90 minuti per il transito in superstrada sono comunque il 17% del totale, un valore molto bas- so e per il quale bisognerà applicare qualche iniziativa affinchè questo cresca. L’idea, infatti, è quella di avere un grafico con valori molto elevati nei tempi < 90 minuti e con una rapida discesa nei tempi > 90 minuti. Andando ad Figura 3.7: Distribuzione dei tempi tratto Superstrada analizzare più approfonditamente questi dati e dividendoli per destinazione, si può notare come solo il 9% delle registrazioni dirette a Cesme riporti un massimo tempo di percorrenza di 90 minuti. Anche per le altre destinazioni i dati non sono incoraggianti: il massimo raggiunto è del 24% negli automezzi con destinazione Yalova, nonostante sia importante considerare il fatto che questo punto di arrivo conti il numero minimo di dati [Fig. 3.8] (quindi, nel caso in cui si dovessero prendere molti più dati, la percentuale potrebbe abbassarsi ulteriormente). 23
  • 33. CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI Approfondendo l’analisi come fatto nel tratto di sosta in autoporto, si nota Figura 3.8: Distribuzione dei dati per destinazione nel tratto superstrada che la maggior parte di registrazioni che hanno fatto rilevare un tempo mag- giore di 90 minuti sono più elevati tra il martedı̀ e il venerdı̀. Solo Yalova registra un 23,5% nella giornata di sabato. Ovviamente, le percentuali sono molto basse e tendenti allo zero la domenica, in quanto possono muoversi solamente alcuni tipi di autotreni. 3.5 Entrata Terminal - Imbarco Questo grafico risulta essere quello più enigmatico in quanto troviamo una serie di lobi irregolari che vanno a decadere pian piano. Il perché di quanto avviene può essere spiegato dal fatto che, nonostante il camion possa essere imbarcato ad una determinata ora, la sua data di imbar- co viene registrata nel momento in cui tutta la nave presso cui è imbarcato viene riempita ed è pronta a partire. Questo tendenza si riscontra anche nei dati a disposizione, con molte regi- strazioni per le quali la data di imbarco è equivalente (nella realtà sarebbe impensabile questa condizione, in quanto tra l’imbarco di un automezzo e un altro passa un certo periodo di tempo). 24
  • 34. CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI Figura 3.9: Distribuzione dei tempi tratto Entrata Terminal-Imbarco 3.6 Uscite Autoporti ed Entrate Terminal Un’altra serie di dati di cui non si è parlato nel precedente capitolo ma che saranno utili al fine della realizzazione della seconda parte di questo lavoro di tesi sono quelli relativi al numero di uscite dei camion dall’autoporto e al numero di entrate in terminal in un’unità di tempo (10 minuti). Per prima cosa, dal foglio di calcolo in cui erano presenti tutti i dati, sono state selezionate le date di uscita dall’autoporto e entrata nei terminal che avessero un valore valido (quindi non pari a zero, come impostato nella pre- cedente fase di calcolo dei tratti) di ogni camion e, per entrambi i gruppi, si è provveduto a ordinare le date in ordine cronologico. Il numero di registrazioni, che hanno soddisfatto il vincolo descritto in prece- denza, sono riportate nella Tabella 3.3 con le rispettive percentuali sul totale dei dati analizzati. Evento Numero reg.valide % sul totale Uscita Autoporti 13304 98,1 Entrata Terminal 11802 87 Tabella 3.3: Numero di registrazioni valide per le date in esame Per ogni giornata, si è provveduto a calcolare, in ogni unità di tempo, il numero di automezzi che uscivano dall’autoporto e che entravano in terminal in quei 10 minuti. Successivamente, è stata calcolata la media per ogni deci- na di minuti cosı̀ da avere un risultato comune tra tutti i giorni analizzati. Nelle figure 3.10 e 3.11 troviamo i risultati ottenuti: sulle ordinate troviamo il numero medio di camion che sono usciti da un autoporto (o che sono entrati 25
  • 35. CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI in un terminal) mentre sulle ascisse troviamo le varie ore della giornata, sud- divise per unità di tempo (nei grafici sono riportati gli orari con un intervallo di 50 minuti per migliorare la leggibilità). Figura 3.10: Numero di uscite medio dagli autoporti per ogni unità di tempo (10 minuti) Figura 3.11: Numero di entrate medio nei terminal per ogni unità di tempo (10 minuti) Analizzando il grafico a sinistra, si può notare come la maggior parte delle partenze sia distribuito tra le 9 di mattina e le 19 della sera, con un piccolo calo attorno all’orario di pranzo e due ore dopo. Questo è giustificato dal momento che la maggior parte dei semafori verdi viene dato nell’orario in cui sono presenti operatori ai terminal portuali e viene poco sfruttata la funzionalità introdotta in Sinfomar che permette di dichiarare quanti camion effettivamente possono uscire in un dato periodo di tempo e il tutto potrebbe essere gestito automaticamente dal software. Dal grafico si può notare inoltre come le partenze dai vari autoporti siano pressoché nulle nelle ore notturne e questo può essere motivato dal fatto che di solito le navi partono verso le 2 della mattina e quelle successive arrivano, in media, verso le 8 di mattina. Il motivo della crescita iniziale alle 6 di mattina risulta essere lo stesso descritto precedentemente, con i camion che partono e scendono in porto andando ad occupare i parcheggi dei terminal, in attesa dell’attracco della nave. Nel secondo grafico si può notare invece come gli arrivi in terminal siano nulli solo in un intervallo di tempo, ovvero quello tra 00:40 e le 05:30. Il motivo principale per cui si verifica questo fenomeno è quello descritto in precedenza ovvero che non vi sono navi dove imbarcare i camion arrivati in quel periodo di tempo e quindi si andrebbero ad occupare parcheggi all’interno del terminal inutilmente. La maggior parte degli automezzi risulta entrare nei vari terminal solo nel pomeriggio (tra le 15 e le 19) mentre, negli altri orari, si può notare come la tendenza sia di 1-2 camion ogni 10 minuti. Importante è notare anche quel piccolo intervallo di tempo di 1 ora e 40 minuti dopo la mezzanotte: esso 26
  • 36. CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI può essere giustificato dagli eventuali “ultimi arrivi” in porto prima della partenza delle navi. 3.7 Conclusioni dell’analisi I grafici precedentemente riportati rappresentano i dati aggregati tra le re- gistrazioni inserite presso l’autoporto di Fernetti e quelle inserite presso le varie ABA. Da un’analisi più approfondita dei due insiemi separati risulta che la distribuzione dei dati per ogni raggruppamento dà luogo allo stesso comportamento che si ritrova nei grafici dei dati totali. Questo conferma che il problema delle successive code all’ingresso dei termi- nal non è favorito solo dai camion in partenza dalla zona di Fernetti, ma vi è un contributo anche da tutti gli automezzi partenti dalle ABA. L’analisi effettuata ha confermato le ipotesi relative al primo tratto, con la maggior parte delle registrazioni che entrano in autoporto non appena viene creata la registrazione nel sistema. Un comportamento inaspettato si riscontra, invece, nel periodo di perma- nenza in autoporto e nei tempi di percorrenza della superstrada per poter arrivare ad un terminal portuale. Per quanto riguarda il tratto entrata-uscita autoporto il problema principale è rappresentato sia dalla discesa non rapida dei dati prima del picco delle 9 ore sia dal lobo creatosi dopo il picco delle 11 ore. Il motivo di questi tempi cosı̀ elevati può essere dovuto anche alla particolare distribuzione dei dati nel tratto concessione autorizzazione-uscita autoporto dove si scopre che un gran numero di autisti, nonostante gli venga concessa l’autorizzazione per scendere, aspettano per molto tempo prima di uscire e imboccare la super- strada. Questo può essere condizionato dal fatto che il permesso che viene stampato da parte degli autisti ha una validità di 24 ore e quindi, i con- ducenti, sapendo di avere tutto questo tempo a disposizione, rimandano la loro partenza favorendo, in secondo luogo, un’eventuale nascita di coda in superstrada. Questo lo si può notare anche nel grafico (Fig. 3.6) riportante i tempi tra la stampa e l’effettiva uscita dall’autoporto, con un numero elevato di autisti che attraversa il varco solo dopo 20/30 minuti. Dai dati risultanti dall’analisi del tratto “Superstrada” scaturisce che essi non sono in linea con le direttive dell’autorità portuale, che si aspetta una distribuzione dei dati maggiore nei primi 90 minuti e una discesa esponenzia- le rapida per i tempi maggiori di 90 minuti. Anche in questo caso il problema può sorgere dal fatto che il tempo di permesso è troppo elevato e quindi i ca- mionisti tendono a fermarsi nelle aree di servizio presenti nel tratto di strada tra gli autoporti e il porto per riposarsi o per altri motivi. 27
  • 37. CAPITOLO 3. ANALISI TEMPORALE DEI TRATTI Sarà quindi necessario provare a limitare il tempo di permesso (e quello di possibilità di stampa di quest’ultimo) per l’entrata in terminal e capire come questo possa influenzare i tempi di percorrenza della superstrada da parte dei camion. 28
  • 38. Capitolo 4 Modellizzazione delle distribuzioni La seconda fase del lavoro di questa tesi si concentra principalmente su un’a- nalisi più approfondita dei dati risultanti del tratto definito come “Super- strada” e sulla realizzazione di un modello che possa rappresentare, in tutto e per tutto, il percorso che un automezzo compie prima di arrivare all’interno dell’area portuale. In questo capitolo si discuterà della tecnica del distribution fitting e di come è stata applicata alle distribuzioni dei nostri dati. Il processo non verrà applica- to a tutti i grafici trovati nei capitoli precedenti ma solamente a quelli relativi alla superstrada, all’uscita dai vari autoporti e all’entrata nei terminal. 4.1 Fitting dei dati Il ”distribution fitting” è la procedura che permette di selezionare la di- stribuzione statistica che più si adatta al dataset in esame proveniente da un processo casuale. A seconda delle caratteristiche del fenomeno, possono presentarsi distribuzioni più adeguate di altre: ad esempio, come riportano Büchel e Corman in [7], per i dati relativi al tempo di percorrenza di un certo tratto stradale vengono molto spesso utilizzate le distribuzioni normali, log- logistiche, lognormali ma anche la combinazione di più distribuzioni come, ad esempio, le Gaussian Mixture Model. Il punto principale delle procedure di fitting è quello di stimare i parametri delle distribuzioni con vari metodi, anche se il più utilizzato è quello della sti- ma di massima verosimiglianza (o Maximum Likelihood Estimation)[10](eq. 4.2). Questo metodo si basa sulla massimizzazione della funzione di verosimiglian- 29
  • 39. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI za (eq. 4.1), la quale rappresenta la funzione di probabilità di un campione costituito da n variabili casuali e che sia funzione di un vettore di parametri θ: per esempio, in una distribuzione normale, la funzione di verosimiglianza è dipendente dai parametri µ e σ2 che rappresentano rispettivamente la media e la varianza della distribuzione. L(x1, x2, . . . , xn; θ) = n Y i=1 f(xi, θ) (4.1) maxL(x; θ) = L(x, θ̂) θ̂ = argmaxL(x, θ) (4.2) La variabile indicata con θ̂ è lo stimatore di massima verosimiglianza e viene calcolato ricorrendo alla funzione di log-verosimiglianza, la quale è ottenuta dall’applicazione del logaritmo naturale alla funzione L(x, θ) e che preserva tutte le sue caratteristiche. Inoltre, la log-verosimiglianza risulta essere an- che più conveniente in termini di potenza computazionale [10]. Solitamente, dopo aver stimato i parametri delle distribuzioni, vengono ese- guiti dei test chiamati “Test di ipotesi” che permettono di verificare se ef- fettivamente l’insieme di dati osservati è conforme al modello calcolato, ac- cettando o meno l’ipotesi nulla che dichiara che i nostri campioni seguono la distribuzione trovata. Tra questi troviamo: • Test Chi-Quadro; • Test Kolmogorov-Smirnov; • Test Anderson-Darling; Come descritto in Büchel e Corman [7] e in Vose [8] i test sopracitati presen- tano delle limitazioni che li rendono non validi per misurare la Goodness-Of- Fit 1 di una curva ipotizzata: i test Kolmogorov-Smirnov e Anderson-Darling non risultano validi se i parametri vengono stimati a partire dall’insieme dei dati di test (procedura che viene eseguita in questo esperimento) mentre il test Chi-Quadro è fortemente dipendente dal numero di classi in cui viene suddiviso l’istogramma formato dai dati (in questo caso una classe rappre- senta un intervallo di tempo di 10 minuti) [8] e in ognuna di esse deve esserci un numero di occorrenze maggiore o uguale a 5 (situazione che non si verifica 1 La Goodness-Of-Fit rappresenta la bontà di adattamento tra un set di valori noti e un secondo insieme di valori che deriva dal ”fitting” di un modello ai dati disponibili 30
  • 40. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI in tutti i grafici visti) [9] . Un altro metodo proposto in Büchel e Corman [7] è quello di confrontare i valori di massima verosimiglianza e scegliere la distribuzione che riporta il valore massimo. Questo può portare a dei problemi di overfitting in quanto distribuzioni con più parametri possono riportare una migliore approssima- zione dei nostri dati. Per far fronte a questa problematica, sia in Büchel e Corman [7] sia in Vose [8], si propone di utilizzare dei criteri che utilizzino la massima verosimiglian- za ma che vadano anche a penalizzare le distribuzioni che utilizzano un alto numero di parametri. Queste misurano la qualità relativa del fitting propo- sto. I criteri citati sono tre: • Akaike Information Criterion (AIC): questo criterio restituisce un sin- golo valore che definisce quanto il modello calcolato è coerente con la distribuzione dei dati in nostro possesso. In questo caso, un valore più basso di questo indice indica una migliore approssimazione da parte di una certa distribuzione. La misura di quanto una certa distribuzione si adatta ai nostri campioni è data dalla log-verosimiglianza. A questa viene poi aggiunto un termine di penalità che dipende dal numero di parametri della distribuzione che viene utilizzata. L’AIC è molto utile quando si confrontano i vari modelli sulla stessa distribuzione dei dati. L’equazione per calcolare il valore dell’indice AIC è quella riportata in 4.3. AIC = −2 ln(L) + 2k (4.3) ln(L) rappresenta il logaritmo della massima verosimiglianza e k è il numero di parametri del modello utilizzato. • Bayesian Information Criterion (BIC) o Schwarz Information Criterion (SIC): anche questo criterio viene utilizzato per la scelta del miglior modello che approssima la distribuzione dei dati. In questo caso, il termine di penalizzazione per il numero di parametri è molto più grande rispetto a quello che troviamo nell’AIC. Per il calcolo dell’indice di questo criterio, oltre ad utilizzare la log-verosimiglianza come nel caso di AIC, si fa uso anche del numero di campioni presente nel dataset in esame. Come nell’AIC, il modello migliore è rappresentato da quello con il valore di indice più basso. L’equazione per il calcolo del valore di BIC è riportata in 4.4. (un termine aggiuntivo che si può ritrovare è n, che rappresenta il numero di campioni del dataset in esame) BIC = −k ln(n) − 2ln(L) (4.4) 31
  • 41. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI • Hannan-Quinn Information Criterion (HQIC): questo metodo è simile a quelli visti nei punti precedenti. Anch’esso rappresenta la bontà di adattamento di un modello tra un numero finito di modelli. Dipende dalla funzione di massima verosimiglianza (dal suo logaritmo) e pe- nalizza le distribuzioni che presentano un numero di parametri troppo elevato per evitare che vi sia overfitting. Come nel BIC, anche in questo caso si tiene conto del numero di campioni, n, del dataset analizzato. L’equazione di HQIC è quello mostrata in 4.5. HQIC = −2ln(L) + 2k ln(ln(n)) (4.5) Per selezionare il miglior modello, in questa tesi è stato scelto di calcolare i valori degli indici secondo questi criteri e di tenere la distribuzione che riportava il maggior numero di coefficienti più bassi. 4.2 Distribution Fitter Allo stato attuale, sono molti i tool che permettono di eseguire il distribution fitting. Tra questi troviamo molti software commerciali come, ad esempio, Minitab e anche molti linguaggi che implementano dei package specifici come R, Python o Matlab. Per questa parte del progetto è stata utilizzata l’applicazione Distribution Fitter [11] di Matlab facente parte dello Statistics and Machine Learning Toolbox. Dopo aver lanciato l’applicazione, digitando “distributionFitter” sulla conso- le di Matlab, appare una schermata come quella riportata in Fig.4.1: da qui è possibile selezionare che cosa si vuole mostrare nella finestra contenente il grafico (funzione di densità, funzione di ripartizione, ecc.). Inoltre, è possibile selezionare (attraverso degli appositi sottomenù): • il vettore di dati che si vuole adattare e le rispettive frequenze per ogni elemento; • i dati che eventualmente si vogliono escludere nel processo di fitting; • quali e quanti modelli mostrare per eseguire un confronto grafico; Il numero di distribuzioni possibili da utilizzare è abbastanza limitato (22) e l’applicazione rileva in automatico se vi sono dei modelli che sicuramente non riescono a seguire l’andamento dei dati (il valore di log-verosimiglianza tende a meno infinito) e li rimuove dalla lista delle distribuzioni disponibili. 32
  • 42. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI Una volta scelto il dataset su cui si vuole applicare la procedura di distri- bution fitting e dopo aver eventualmente scelto una regola di esclusione per alcuni dati, è possibile selezionare un modello tra quelli presenti e lasciare che l’applicazione trovi la miglior stima dei parametri per quella distribuzione. Una volta trovata, vengono mostrati a video i valori dei parametri dell’even- tuale distribuzione e il logaritmo della funzione di verosimiglianza, oltre alla rappresentazione grafica del modello calcolato sovrapposta all’istogramma dei dati. Figura 4.1: Schermata iniziale del Distribution Fitter di Matlab 4.3 Risultati ottenuti Nei grafici successivi, l’asse delle ascisse riporta il valore dei tempi con una precisione dei 10 minuti (Fig. 4.2, 4.4, 4.5, 4.6). 4.3.1 Superstrada Per questo tratto non sono stati considerati tutti i valori dei tempi trovati e sono stati esclusi tutti quelli con un periodo di percorrenza superiore ai 5000 minuti. Questo perchè il loro contributo era quasi nullo, con una probabilità di vedere verificati quei dati approssimativamente attorno a valori di 10−5 - 10−6 . 33
  • 43. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI È stato riscontrato che, per il tratto superstrada con tutti i dati aggregati, la miglior distribuzione che si adattava al grafico a disposizione è quello di una distribuzione generalizzata dei valori estremi (o Generalized Extreme Value). Figura 4.2: Fitting della distribuzione dei dati della superstrada Questo ha riportato il valore di log-likelihood2 più basso tra tutte le di- stribuzioni che l’applicazione forniva. Questo tipo di distribuzione risulta avere una funzione di densità di proba- bilità come quella riportata nell’eq.4.6. 1 σ t(x)ξ+1 et(x) dove t(x) = ( (1 + ξ(x−µ σ ))−1 ξ ξ 6= 0 e− (x−µ) σ ξ = 0 (4.6) In essa troviamo tre parametri fondamentali: • k (più comunemente indicato con ξ): parametro di forma. Definisce il comportamento della coda della distribuzione (Fig.4.3): – ξ > 0: distribuzione con una coda che scende meno rapidamente a zero e quindi tende ad essere molto lunga. – ξ < 0: distribuzione con una coda “sinistra” e corta, ovvero che tende a zero molto velocemente. – ξ = 0: distribuzione con una coda che tende molto più velocemen- te a zero rispetto a quella con ξ > 0. • µ: parametro di posizione. È un parametro che definisce la posizio- ne della distribuzione. Se questo aumenta, la distribuzione tende a spostarsi verso destra, se diminuisce, la distribuzione si sposta verso sinistra. 2 Termine inglese per indicare la log-verosimiglianza 34
  • 44. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI • σ: parametro di scala. Se questo aumenta, la distribuzione tende ad allargarsi, se invece diminuisce quest’ultima si restringe. Figura 4.3: Grafici della distribuzione GEV al variare di ξ, fissati i valori di µ e σ [12] Il modello generato sembra essere adatto all’andamento dei dati del tratto Superstrada. Il valore di µ pari a 15.53 denota una distribuzione che si concentra nei valori più vicini all’origine (dalla precedente analisi risulta che il picco massimo di questo tratto è presente attorno a 8, ovvero 80 minuti) e il valore di σ pari a 14.62 rivela un andamento dei nostri dati che tende a scendere molto tardi, soprattutto nella parte destra della distribuzione (abbiamo infatti valori elevati riscontrati anche a 150, ovvero a 25 ore). ξ (pari a 0.856) manifesta un andamento, a sinistra del picco, molto veloce (poche registrazioni fanno registrare valori al di sotto di 90 minuti, come visto precedentemente) e che raggiunge il massimo della distribuzione dopo poco tempo. Il valore di ξ segnala, inoltre, una coda della distribuzione molto lunga che tende a zero solo dopo aver superato una gran quantità di dati presenti (valori quasi nulli si possono riscontrare a partire dai 400, attorno alle 67 ore). 4.3.2 Superstrada senza traffico Per la validazione del modello che verrà creato successivamente, è necessario verificare quale distribuzione approssimi meglio i dati dei tempi in superstra- da, ipotizzando di prendere solo quelli relativi a dei momenti senza traffico. Per selezionare quali dati prelevare, dobbiamo andare a vedere quali di questi 35
  • 45. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI hanno fatto segnalare un maggior numero di valori minore di 90 minuti. Dai risultati ritrovati nella sezione 3.4, appare chiaro come i giorni che si possono tenere in esame sono quelli di lunedı̀, sabato e domenica. Per una questione di numero di campioni limitato, si esclude la domenica. Andando ad analizzare i due giorni rimasti e i dati ad essi collegati relativi ai tempi di percorrenza, si nota come il lunedı̀ faccia registrare tempi medi più veloci rispetto a quelli del sabato (440 minuti contro i 660 del sabato). Questo potrebbe essere anche una conseguenza del gran numero di camion che si spostano nel primo giorno del fine settimana, per evitare di rimanere bloccati in autoporto la domenica e dover aspettare un’altra giornata prima di partire. Dopo aver deciso da quale giorno prelevare i dati per applicare il processo di “distribution fitting”, è stata effettuata un’altra eliminazione di dati: dopo aver diviso i dati per l’effettivo lunedı̀ di uscita, si è tenuto conto del numero di registrazioni che avevano fatto segnalare un tempo di percorrenza maggio- re di 24 ore. Tutti quei lunedı̀ che facevano segnalare più di 15 registrazioni con tempo maggiore sono stati scartati (4 lunedı̀ su 9, il 46% dei dati di quel giorno). Al termine di questo processo di selezione i giorni considerati sono quindi stati 5: 1 Marzo, 22 Marzo, 29 Marzo, 5 Aprile, 12 Aprile. La distribuzione dei dati cosı̀ ottenuti è rappresentato dalle barre di colore viola in Fig. 4.4. Il miglior modello che si adatta alla nostra disposizione dei dati è quello rap- presentato dalla distribuzione di Burr. Questo tipo di distribuzione (anche detta distribuzione di Burr XII) ha una funzione di densità di probabilità come quella mostrata in 4.7. fBXII (x; α, c, k) = ck α x α c−1 1 + x α c−(k+1) (4.7) Questa presenta tre parametri [13] [14]: • α: parametro di scala. Indica quanto la curva identificata è schiacciata verso l’asse orizzontale. • c e k: parametri di forma. Entrambi sono valori positivi e permettono di gestire, per l’appunto, la forma della curva da generare (ad esempio, può essere generata una curva che parte dall’origine, cresce e successiva- mente scende o un’altra che parte da un valore fissato dell’asse verticale e seguire un decadimento simile ad un’esponenziale). I valori calcolati dal distribution fitter per questa distribuzione si possono ritrovare nell’andamento dei dati: un valore di c pari a 4.22 denota l’anda- mento iniziale della curva, la quale deve crescere molto velocemente in quanto 36
  • 46. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI il picco si presenta attorno al valore 8 dei dati dei tempi; anche il valore di k, pari a 0.17, fa notare la discesa più lenta verso i valori più elevati dei tempi. Figura 4.4: Fitting della distribuzione dei dati della superstrada senza traffico 4.3.3 Partenze dagli autoporti In questo caso, il grafico in questione non presenta un comportamento uni- modale in quanto vi sono diversi picchi per alcune fasi della giornata. Se si effettua un’analisi più approfondita della distribuzione riportata in Fig. 4.5, si può vedere che i picchi effettivi sono tre: uno dovuto al traffico mat- tiniero, uno a quello nell’orario dopo pranzo (anche se molto più stretto) e uno al traffico che si genera nel pomeriggio. Se prendiamo ogni sottoinsieme di questa distribuzione possiamo notare co- me effettivamente vi sia il contributo di tre gaussiane diverse centrate attorno ai picchi del grafico. Per questo motivo, è stato deciso di utilizzare una di- stribuzione di tipo “Gaussian Mixture Model”: proprio come riportato nel nome, questo tipo di distribuzione è un insieme di gaussiane, le quali possie- dono una propria media e una propria varianza ed è assegnato loro un certo peso per formare la composizione. La funzione di densità di questo tipo di distribuzione è riportata nell’eq.4.8 (n rappresenta il numero di componenti della composizione e pi(x) indica la funzione di densità di probabilità dell’i- esima componente) f(x) = n X i=1 wipi(x) (4.8) Un punto fondamentale per la realizzazione di questo tipo di modello è la scelta dell’eventuale numero di gaussiane che lo compongono. A questo pro- 37
  • 47. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI posito, è stato utilizzato il comando Matlab apposito per il calcolo della mi- glior approssimazione con un Gaussian Mixture Model (fitgmdist): questo permette, passando i dati su cui adattare il modello e il numero di gaussiane che dovrebbero comporre il modello, di trovare la media e il peso delle va- rie componenti. Il risultato che riportava il valore più basso di AIC e BIC (l’output di questo comando non prevede il calcolo dell’indice HQIC) è stato valutato come miglior adattamento. Figura 4.5: Fitting della distribuzione dei dati relativi alle uscite dagli autoporti Come si può vedere in Fig. 4.5, il miglior adattamento è stato riscontrato in un Gaussian Mixture Model con tre componenti aventi media, varianza e peso rispettivamente: • µ1 = 60, 34 ω1 = 0.45 • µ2 = 81, 16 ω2 = 0.3 • µ3 = 102, 58 ω3 = 0.25 Questo conferma l’effettivo andamento del nostro grafico con una salita e successiva discesa tra le 9 di mattina e le 11, un innalzamento con conseguente discesa rapida attorno alle 14 (dovuto alle partenze subito dopo l’ora di pranzo) e un’ultima crescita dei dati nel pomeriggio, tra le 16 e le 18. 4.3.4 Arrivi ai terminal La distribuzione dei dati di questo evento risulta essere particolare in quanto abbiamo una gran parte dei dati (il 95%) concentrata nella parte destra del grafico e il 5% rimanente all’inizio. 38
  • 48. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI Per questo motivo è stato scelto di andare ad effettuare il distribution fit- ting con l’ausilio del distribution fitter solo nella parte dove si concentravano di più i dati, trattando la parte del grafico iniziale come una distribuzione uniforme e pesando le due componenti a seconda dei dati che esse compren- devano. Dopo aver applicato il processo di adattamento ai dati descritti preceden- temente, è risultato che il miglior modello che segue l’andamento dei dati è quello rappresentante una distribuzione di Weibull (Fig. 4.6). Figura 4.6: Fitting della distribuzione dei tempi successivi di entrata nei terminal (si noti la prima parte adattata) Questo tipo di distribuzione presenta due parametri, indicati come A e B nel distribution fitter: questi rappresentano, rispettivamente, la scala e la forma della distribuzione. Il valore di B pari a 4,6 indica che il tasso di entrata nei terminal effetti- vamente cresce con il tempo (essendo maggiore di 1) e decresce abbastanza rapidamente dopo l’arrivo del picco della distribuzione. Questo fatto risulta in totale accordo con l’andamento dei dati che fanno segnalare un aumento delle entrate in terminal prima delle 15 e una diminuzione effettiva dopo le 19. Il valore di A pari a 110 segnala che effettivamente la distribuzione risulta essere spostata molto più a destra rispetto all’origine. Le distribuzioni che si adattano meglio ai nostri dati nei vari tratti ana- lizzati sono quindi riportate nella Tabella 4.1 con i rispettivi parametri cal- colati. Nella Tabella 4.2 sono indicati i valori della log-verosimiglianza delle distribuzioni, il numero di campioni del dataset del tratto, il numero di para- metri della distribuzione trovata e i valori degli indici precedentemente citati e utilizzati per la valutazione della miglior distribuzione. 39
  • 49. CAPITOLO 4. MODELLIZZAZIONE DELLE DISTRIBUZIONI Tratto Distribuzione Parametri Superstrada Generalized Extreme Value k = 0.856 σ = 14.62 µ= 15.53 Superstrada No Traffico Burr α = 5.83 c = 4.22 k = 0.17 Uscita Autoporto Gaussian Mixture Model (3 componenti) µ1 = 60, 34 ω1 = 0.45 µ2 = 81, 16 ω2 = 0.3 µ3 = 102, 58 ω3 = 0.25 Entrata Terminal 0.95×Weibull +0.05×Uniform A = 110 B = 4, 6 Tabella 4.1: Distribuzioni con miglior adattamento e relativi parametri Tratto LogLikelihood Gradi di libertà N.Campioni AIC BIC HQIC Superstrada -54791 3 398 109588 109564 109592 Superstrada No Traffico -3248 3 159 6502 6480 6505 Uscita Autoporto -193 6 145 398 356 405 Entrata Terminal (solo Weibull) -149 2 134 302 288 304 Tabella 4.2: Proprietà di ogni distribuzione e dei dati e valori degli indici 40
  • 50. Capitolo 5 Sviluppo del modello In questo capitolo verranno descritte brevemente le caratteristiche principali della teoria delle code e verranno illustrate le particolarità del tool di Matlab utilizzato per costruire il modello ed eseguire le simulazioni (Simulink[15]). Successivamente, verrà fatta una discussione sulle particolarità che il modello dovrà riportare con relativa proposta, che verrà validata utilizzando la distri- buzione “senza traffico”. Una volta verificata, questa verrà applicata ai dati dei tempi totali di percor- renza del tratto stradale, evidenziando come questi portino ad un’effettiva coda al varco di entrata dell’area portuale. 5.1 Teoria delle code La teoria delle code è un settore della matematica che studia e modella l’atto di attesa in coda. Nasce da un articolo scritto e pubblicato nel 1909 da A.K.Erlang, “The theory of probabilities and telephone conversations”, in cui cercava di capire quanti circuiti telefonici era necessario fornire ad una compagnia telefonica di Cope- naghen per prevenire un tempo di attesa troppo lungo per i clienti. Cercando di trovare una soluzione, capı̀ che il problema fosse applicabile in molti cam- pi e da qui sviluppò la teoria di cui si sta parlando. Infatti, la teoria delle code può essere applicata a svariati scenari come la coda che si accumula allo sportello di una banca o la catena di produzione di un certo prodotto. I soggetti che si presentano in questa teoria sono due: • Clienti: soggetti che richiedono un certo servizio. Essi arrivano ad un tempo ti e la differenza tra il tempo di arrivo dell’i-esimo cliente e l’i+1-esimo cliente è detta “tempo di interarrivo”. 41
  • 51. CAPITOLO 5. SVILUPPO DEL MODELLO • Servitori: soggetti che forniscono un servizio ai clienti. Sono caratte- rizzati da un “tempo di servizio” che definisce il tempo medio con cui il servizio viene erogato al cliente. Figura 5.1: Tipico modello di una coda con clienti e servitori Un altro aspetto importante della teoria delle code è la disciplina della coda, che definisce in che ordine vengono serviti i clienti che arrivano in fila. Tra le varie modalità troviamo: • First come, first serve (FCFS): in questo tipo di coda, i clienti che arrivano per primi vengono serviti per primi. • Last come, first serve (LCFS): i clienti che arrivano per ultimi nella coda, vengono serviti per primi. • Service in random order (SIRO): i clienti vengono serviti in un ordine random, è indifferente il loro tempo di arrivo. La notazione fondamentale utilizzata nella teoria delle code è chiamata “no- tazione di Kendall” che definisce le principali informazioni della coda ed è rappresentata da una n-upla di sei valori. Questi rappresentano rispettiva- mente: • Statistica degli arrivi: identifica di che tipo è la distribuzione dei pro- cessi di arrivo (markoviana, deterministica, Erlang o generale) • Statistica del servizio: identifica di che tipo è la distribuzione del processo di servizio (identiche a quelle elencate per la statistica degli arrivi) • Numero di servitori presenti nel sistema 42
  • 52. CAPITOLO 5. SVILUPPO DEL MODELLO • Numero di posti disponibili nella coda • Dimensione della popolazione • Disciplina della coda I primi tre elementi sono rappresentativi e sempre necessari mentre gli ul- timi tre hanno dei valori di default: se la capacità della coda è infinita, la dimensione della popolazione risulta essere infinita e la disciplina della coda è del tipo “First Come, First Serve”, gli ultimi tre parametri possono essere omessi. Per la maggior parte delle code esistenti, alcuni valori possono essere calcolati analiticamente come il tasso di servizio, di interarrivo o il tempo di attesa medio che un cliente deve attendere prima di essere servito. 5.2 Simulink Per questa parte di progetto è stato utilizzato il tool di Matlab Simulink, uno strumento utile per effettuare delle simulazioni del sistema in esame. Simulink propone una libreria con un grande quantitativo di blocchi, i quali rappresentano delle entità fondamentali: partendo da essi si può costruire il sistema effettivo su cui verrà eseguita la simulazione. In particolare, in questo caso, sono stati utilizzati i blocchi della categoria SimEvents che permettono la modellazione e la simulazione dei sistemi ad eventi discreti. I blocchi fondamentali utilizzati per questa simulazione sono: • Entity Generator: permette la generazione delle entità basandosi su un evento che può aver luogo all’interno del sistema o su tempi che possono essere generati da una distribuzione qualsiasi. • Entity Server: rappresentano il vero e proprio servitore, il quale viene occupato da un’entità per un tempo pari a quello che viene chiamato “tempo di servizio”. • Queue Block: blocco che identifica la coda e a cui si può associare una capacità, una disciplina e da quanti input può ricevere le entità. • Entity Terminator: blocco finale dove vengono distrutte le entità. Vie- ne utilizzato per simulare l’uscita delle entità dal modello della simu- lazione. 43
  • 53. CAPITOLO 5. SVILUPPO DEL MODELLO 5.3 Discussione e generazione del modello Il modello da realizzare deve rappresentare l’intero percorso che compie un automezzo, dall’uscita da uno degli autoporti fino all’entrata in un terminal in attesa di essere imbarcato. In particolare, tre momenti specifici devono essere evidenziati: • Uscita dall’autoporto; • Percorrenza della superstrada; • Passaggio al varco portuale e entrata in terminal; I tempi delle uscite tra un veicolo e il successivo devono essere più elevati nelle ore serali e notturne, dal momento che il maggior numero di partenze viene fatto segnalare durante il giorno. I tempi di percorrenza variano a seconda del tipo di realtà che si simula, considerando dei periodi più brevi nel caso in cui si analizzi la versione “senza traffico”. Per la realizzazione, è stato necessario tenere conto anche di due ulteriori aspetti importanti: • i varchi di accesso all’area portuale sono due: Varco 1 e Varco 4. Questi due sono distanti 6 minuti l’uno dall’altro e per questo si possono con- siderare come ingresso unico con la possibilità di gestire due automezzi contemporaneamente. Idealmente, si dovrebbe pensare come un’unica coda che converge verso questi due varchi. • il tempo medio che un camion impiega per entrare all’interno dell’area portuale si attesta attorno agli 8 minuti. Al varco portuale, un autista si sottopone ad una serie abbastanza lunga di procedure nelle quali deve mostrare alcuni permessi e documenti a vari soggetti quali PTS1 , guardie giurate e Guardia di Finanza. Nonostante la distribuzione che identifica le entrate in terminal tenga conto anche del tempo che un certo camion impiega per la percorrenza del tratto varco portuale-varco del terminal, questo verrà estromesso dalla simulazione in quanto si tratta di un intervallo di tempo medio di circa 7 minuti. Questo non porterebbe sostanziali modifiche alla distribuzione dei dati delle entrate in terminal e quindi non verrà considerato. Il modello è stato simulato su 24 ore con un’unità di tempo pari a 1 minu- to. Per questo motivo, alcuni valori delle distribuzioni trovate precedente- mente sono state riadattate per essere coerenti con la risoluzione temporale utilizzata. 1 Porto di Trieste Servizi S.r.l. 44
  • 54. CAPITOLO 5. SVILUPPO DEL MODELLO 5.3.1 Uscita dall’autoporto Il percorso del camion nella simulazione inizia dall’uscita da uno degli auto- porti e la successiva immissione in autostrada. I tempi di interarrivo tra un camion e quello successivo sono stati calcolati utilizzando le uscite medie ritrovate precedentemente. È stato supposto che, all’interno di un’unità di tempo, i camion arrivassero in maniera uniforme: ad esempio, se ad una certa ora erano stati fatti segnalare 2 camion in 10 minuti si è ipotizzato che il primo partisse al quinto minuto mentre il secondo partisse al decimo. Le uscite dei camion dagli autoporti sono state realizzate facendo uso un En- tity Generator nel quale è stato utilizzato un metodo di generazione basato sul tempo. I tempi calcolati con il metodo descritto in precedenza sono stati riportati nella casella di testo che compare dopo aver selezionato MATLAB Action come un pattern ripetuto nel quale, alla fine della sequenza, il tempo di interarrivo viene impostato ad infinito, cosicché le entità non vengano più generate. Per valutare il numero di entità effettivamente generate durante la simulazio- ne, dal pannello delle statistiche è stato attivato il contatore del numero di entità generate, per verificare che queste fossero corrispondenti con la realtà. 5.3.2 Percorrenza superstrada Il passo successivo è stato quello di modellare il percorso in superstrada. Per fare ciò, si è pensato di definire il tratto percorso dai camion come un servitore, il quale presenta una capacità infinita in quanto una volta che un automezzo si immette nella strada, quest’ultima non viene bloccata in attesa che il veicolo “fuoriesca” dal tratto stradale ed entri nell’area portuale. Il tratto di superstrada è stato quindi rappresentato da un Entity Server al quale è stato assegnato il valore Inf per indicare la capacità totale e, a seconda della situazione che si voleva simulare (senza traffico, con tutti i dati a disposizione e ottimizzato), è stato definito anche il modo con cui il tempo di servizio veniva calcolato. Per quanto riguarda la simulazione in condizioni “ideali” (senza traffico), i tempi di servizio sono stati calcolati a partire dai tempi di percorrenza fatti segnalare dalle varie registrazioni considerate e, ad ogni valore, è stato assegnato un valore di probabilità pari al numero di occorrenze che questo aveva fatto emergere. I tempi di percorrenza nel caso si tenesse conto della distribuzione dei dati totali, sono stati modellati con un comando Matlab che permette di generare dei valori random a partire da una Generalized Extreme Value (gevrnd) 45
  • 55. CAPITOLO 5. SVILUPPO DEL MODELLO passando i parametri ritrovati nella fase precedente di Distribution Fitting. I tempi di servizio cosı̀ calcolati rappresentano dei valori che identificano la decina di minuti (es. dt=2 indica un tempo di 20 minuti): per questo motivo è stato necessario moltiplicare per 10 i valori ottenuti con il comando Matlab precedentemente citato. 5.3.3 Varco portuale Una volta percorso il tratto stradale, i vari automezzi si introducono in una coda (più o meno lunga) in attesa di essere accettati al varco e successiva- mente entrare nell’area portuale. La coda che può generarsi è stata rappresentata, nel nostro modello, con un Queue Block al quale è stato attribuito una capacità infinita: questa asse- gnazione è totalmente ideale in quanto, nella realtà, se la coda raggiunge un valore di circa una ventina di camion il traffico viene bloccato e non vengono fatti scendere ulteriori automezzi dai vari autoporti. La modalità con cui le entità escono da questo tipo di coda è di tipo FCFS dal momento i primi au- tomezzi che arrivano al varco portuale verranno fatti entrare prima nell’area del porto. Per verificare il volume di traffico presente all’interno della coda in un dato istante della simulazione, è stata attivata la rispettiva statistica del blocco ed è stata collegata ad un visualizzatore di simulink (Scope). Per simulare i varchi portuali è stato utilizzato un altro Entity Server colle- gato direttamente alla coda descritta in precedenza. Come descritto all’inizio della sezione, il varco 1 e il varco 4 sono stati inglobati in un unico ingresso avente un tempo di servizio uniforme di circa 8 minuti. Per riportare que- ste ipotesi all’interno della simulazione è stato necessario riportare un valore pari a 2 nella casella di testo dove specificare la capacità del servitore (ovve- ro quante entità può servire simultaneamente) e, per impostare il tempo di servizio, è stato selezionato Dialog nella sezione Service Time Source impo- nendo un valore pari a 8 nella sezione Service Time Value. Superato il varco portuale, il camion entra nell’area del porto e successiva- mente entra in un terminal presente nei moli che prevedono l’attracco di navi Ro-Ro. Nella simulazione questa fase viene semplificata, ponendo un Entity Terminator subito dopo il servitore che rappresenta il varco e ipotizzando che l’entità stessa uscisse dal modello simulato. Il modello teorizzato è rappresentato in figura 5.2 46
  • 56. CAPITOLO 5. SVILUPPO DEL MODELLO Figura 5.2: Modello teorizzato per rappresentare lo scenario da ottimizzare 5.4 Verifica del modello Utilizzando la notazione di Kendall, si può descrivere la prima parte del mo- dello teorizzato come una G/G/∞ in quanto entrambe le distribuzioni (tempi di interarrivo e di servizio) sono “generiche” e il servitore (qui rappresentato dalla superstrada) risulta avere una capacità infinita, corrispondente ad un insieme infinito di server che lavorano in parallelo con la stessa distribuzione. La seconda parte, invece, può essere definita come una coda G/D/2 in quanto i tempi di interarrivo sono dettati dalla distribuzione caratterizzante i tempi di percorrenza del tratto stradale mentre i tempi di servizio sono costante- mente pari a 8 unità di tempo (8 minuti). Dal momento che il modello totale è una composizione delle due, risulta es- sere troppo complesso per validarlo analiticamente. Per questo motivo, si è deciso di valutare quanto il modello teorizzato fosse accurato facendo uso della distribuzione identificata come “senza traffico”, giudicando se i risultati ottenuti nella simulazione corrispondessero con quanto trovato nei dati circa le entrate in terminal durante le 24 ore e se il comportamento delle entrate simulate concordassero con la distribuzione trovata nel precedente capitolo nella sez. 4.3.4. Dopo aver applicato le opportune modifiche al modello (ovvero dopo aver cambiato la modalità con cui il tempo di percorrenza della superstrada veni- va calcolato), la simulazione è stata eseguita e i risultati ottenuti a proposito delle entrate in porto da parte degli automezzi sono state visualizzate (Fig. 5.3, sull’asse orizzontale si trova il tempo, su quello verticale il numero di camion entrati). Dal grafico si può notare che il totale di camion entrati è pari a 177 (nonostante vengano generati 231 camion), risultato che concorda con quello derivante dai dati a disposizione. Infatti, prendendo i valori medi degli ingressi tra le 7:30 e mezzanotte (ovvero quando la simulazione fa regi- strare dei camion entranti) il totale di essi è pari a 176. Inoltre, si può vedere come il grafico segua l’andamento trovato nella distri- 47
  • 57. CAPITOLO 5. SVILUPPO DEL MODELLO Figura 5.3: Grafico delle entrate in terminal nella simulazione buzione degli ingressi medi, facendo segnalare tempi più elevati all’inizio (con una media di circa 1 camion entrante ogni 10 minuti fino ai 700 minuti) e dei tempi sempre più ridotti nella parte centrale (con una media di 2-3 camion ogni 10 minuti). Nella parte finale (dai 1350 minuti) si può osservare come questi tempi tendano ad allungarsi, portando ad una diminuzione del numero di automezzi che entrano in terminal in un periodo di 10 minuti. 5.5 Applicazione del modello ai dati totali Validato il modello, si è provveduto a cambiare la distribuzione del tempo di servizio andando ad utilizzare quella ricavata dall’insieme dei dati aggregati. Come accennato nella sez. 5.3 per generare i tempi di servizio si è utilizzato un comando presente in Matlab, gevrnd, il quale, passati i parametri k, σ, µ restituisce dei valori casuali. Questi ultimi sono scelti con una probabilità il cui valore è dettato dalla distribuzione utilizzata. Dopo aver applicato le modifiche necessarie, è stata eseguita la simulazione. Dai risultati di quest’ultima (Fig. 5.4, nelle ascisse si possono trovare i minu- ti; nelle ordinate è riportato il numero di camion in coda in quel momento) si può notare che i camion tendono ad arrivare attorno alle 8 di mattina (480 48
  • 58. CAPITOLO 5. SVILUPPO DEL MODELLO Figura 5.4: Comportamento della coda ai varchi portuali minuti) e che, inizialmente, i varchi riescono a gestirli in maniera adeguata, per circa 4 ore. I due varchi sembrano non essere in grado, invece, di gestire il numero di automezzi che arrivano dalle 15 alle 19, portando ad avere una coda con un picco massimo di 21 camion verso le 7 di sera. Nonostante la successiva di- scesa, sembra che gli automezzi che si presentano in seguito portino ad un aumento della coda attorno ai 19 veicoli. Verso la conclusione del grafico vi è una diminuzione continua dei camion in coda, dovuta al fatto che l’entity generator ha fissato il tempo di interarrivo a infinito con conseguente blocco della generazione di entità e il server che rappresenta il varco portuale continua a processare i vari elementi ogni 8 unità di tempo. Esaminando i tempi di percorrenza che risultano dalla simulazione, con il tempo di permesso concesso attualmente, gli autisti tendono ad allungare eccessivamente la durata dei loro viaggi, percorrendo il tratto di superstrada 49
  • 59. CAPITOLO 5. SVILUPPO DEL MODELLO verso il porto in un tempo molto più elevato dei 90 minuti suddetti. In tal modo si presentano al varco portuale stabilendo in autonomia l’orario di arrivo (purché compreso nelle 24 ore prestabilite), quando è già presen- te un elevato quantitativo di veicoli, provocando un innalzamento dei valori della coda, come dimostrano i risultati della simulazione. Nel capitolo seguente, si pone l’obiettivo di determinare gli esiti a seguito del cambio effettivo nel tempo di permesso per l’accesso all’area portuale dalle 24 ore attuali ai 90 minuti, che condurrà ad una modifica della distri- buzione caratterizzante il tempo di percorrenza. Inoltre, si valuterà se vi sono dei vantaggi concreti rispetto alla situazione attuale. 50
  • 60. Capitolo 6 Ottimizzazione e applicazione al modello In questo capitolo verrà descritta una prima variante della distribuzione dei dati relativi ai tempi di percorrenza in superstrada (basato sull’ipotesi di una successiva modifica al tempo di permesso concesso agli autisti) e verrà valutato se vi è un effettivo miglioramento rispetto alla situazione illustrata nella sezione conclusiva del precedente capitolo. Dal momento che dalla simulazione non si noteranno dei cambiamenti favo- revoli, un’ulteriore ipotesi di ottimizzazione sulle partenze dei camion dagli autoporti verrà discussa. Effettuate le opportune modifiche al modello, verrà analizzato il risultato ottenuto, il quale presenterà notevoli miglioramenti per il caso in esame. 6.1 Sviluppo e applicazione della prima ipo- tesi La riduzione del tempo di permesso di accesso al porto da 24 ore a 90 minuti causa delle modifiche alla distribuzione dei tempi di percorrenza del tratto stradale in quanto non si dovrebbero più riscontrare degli automezzi che fan- no segnalare valori troppo elevati (ad esempio, maggiori di 5 ore). Inoltre, la maggior parte delle registrazioni dovrebbe indicare un periodo di tragitto attorno ai 35-45 minuti, tenendo conto che qualche camion potrebbe fare registrare un tempo non superiore ai 20 minuti. Il numero di veicoli che potrebbero indicare questo valore di tempo non sono molti dal momento che questi sono quelli che provengono dai piazzali di Autamarocchi e di Logeast (che nei dati a disposizione rappresentano l’8% delle registrazioni). 51