Presentazione del lavoro fatto per il corso di formazione come ricercatore industriale su software open source per soluzioni in ambito smart cities su rete TETRA. Noi ci siamo occupati di viabilità.
2. PROGRAMMA OPERATIVO NAZIONALE RICERCA E COMPETITIVITÀ 2007-2013
Azione di formazione
Servizi innovativi Open Source su TETRA
Modelli per la gestione della mobilità urbana.
Gruppo di lavoro
Rocco Picarelli
Nicola Procopio
Raffaele Vumbaca
7. Architettura
L’obiettivo e’ di creare un pacchetto software per il
processo, implementare i passi mancanti, generalizzare il
processo e unificare l’architettura tenendo come basi il
codice esistente.
9. Analisi
Raggiungibilità:
Come le differenti zone della città sono raggiungibili con i mezzi pubblici ?
Dati: TPL - GSM - GPS
Comportamenti frequenti
Ci sono tratte e/o periodi in cui gli autobus subiscono ritardi frequenti?
Analisi dei percorsi, le corse sono “ottimizzate”?
Dati: TPL
Utenza Privata vs TPL
Come il trasporto può pubblico servire il trasporto privato?
Dati: TPL - GPS
10. 1 COSTRUZIONE TIME TABLE
Costruzione di una time-table delle singole istanze di viaggio (autobus-linea)
1. Ricostruzione tabella delle paline. (Processo SQL)
1. Processo di pulizia e completamento dei dati (Processo Java)
1. Processo di costruzione Time Table (Processo Java)
11. Ricostruzione Tabella Paline
Per identificare una posizione univoca per paline con stesso identificativo è stata utilizzata una
metodologia density-based.
Per associare un'unica posizione alla fermata è stata utilizzata una metodologia che assegna maggior
peso a rilevamenti vicini. Costruendo un buffer di 50 m. attorno ad ogni fermata, si selezionano i
rilevamenti i cui buffer si intersecano. Delle fermate che hanno un’intersezione a comune, si calcola
il punto medio e si associa a quel punto la posizione effettiva della palina (Figura 2). Questa
metodologia permette di escludere punti molto lontani che possono essere generati da errori nel
gps o di trascrizione.
12. Processo di pulizia e completamento dei dati
• Dato un viaggio di un autobus costituito dai soli rilevamenti gps e
dagli eventi, si vogliono identificare le paline presso cui l’autobus si è
fermato
• Questa attività è necessaria per ricostruire un log completo e per ripulire i
dati da eventuali rilevamenti inconsistenti.
Linea A
Viaggio
Linea B
50 m
13. Processo di pulizia e completamento dei dati
Sono ordinati i log in base al time stamp selezionando per ogni linea, autobus e giorno i
diversi gruppi di log. Da questi, si sono suddivisi i viaggi (sequenze di rilevamenti in un giorno) in corse
giornaliere, tagliando le varie traiettorie in base a 3 criteri:
• Raggiungimento dell’ultima fermata della linea.
• Partenza dalla prima fermata della linea.
• Distanza temporale tra rilevamenti successivi maggiore di una soglia MAX_TIME_GAP = 30
minuti.
Linea A
Viaggio
Linea B
50 m
14. Ricostruzione Time-Table
Dai log ricavati si estrae il tempo tipico in cui un autobus arriva ad una
determinata palina come tempo medio delle varie corse.
Estraendo questa informazione per ogni palina si ottiene la time-table
.
Linea CVC A
Orario Nr. Fermata Fermata
05:18:11 0 piazza giacomo mancini
05:19:59 1 viale giacomo mancini (suburbane)
05:22:11 2 viale giacomo mancini (1o fermata)
… … …
06:13:41 61 corso umberto
06:15:41 62 piazza dei bruzi
06:17:42 63 piazza giacomo mancini
15. 2 Identificazione comportamenti
frequenti degli autobus
15
Lo scopo è analizzare i percorsi AMACO per verificare se esistono schemi
ricorrenti per quanto riguarda:
•Sovrabbondanza o carenza di linee su un’area;
•Tratte e/o periodi in cui gli autobus subiscono ritardi frequenti;
•Eccessivo carico su una palina.
Metodo:
•Processo SQL e DMQL per visualizzare graficamente le linee;
•Analisi di densità.
21. Analisi di raggiungibilità
Lo scopo è quello di calcolare i luoghi raggiungibili con il TPL dato:
Luogo partenza (una palina TPL).
Orario di partenza.
Tempo massimo di viaggio.
Metodo:
Codifica della rete TPL come un grafo diretto, dove:
Nodi: paline del TPL con associato il tempo di arrivo.
Archi: segmenti che formano una linea di TPL
Implementazione di un algoritmo di esplorazione
su grafi per calcolare le paline raggiungibili dato
l’insieme di constraints.
21
24. Analisi di raggiungibilità con mezzi privati e TPL
1. Non essendo disponibili i log OctoTelematics sono stati generati dei percorsi
con il Simulatore di Mobilita’ SumoTrack
1. Altra attività è costruire un parser per associare i percorsi generati con i dati
di OpenStreetMap
1. Una volta ottenuto il risultato si ha a disposizione i dati per confrontare i
tempi.
24
26. 5 Profilazione utenti
Obiettivo
Identificare ed etichettare gruppi
di utenti di telefonia in base ai
profili di chiamata, per meglio
comprendere e studiare la
mobilità delle persone sul
territorio.
Profili
•Residenti
•Pendolari
•Visitatori
•In transito
Processo di profilazione utenti GSM
28. Pre-Processing
Preparazione dei dati per l'algoritmo di clustering
Algoritmo utilizzato: Clustering basato su Self Organizing Map
(SOM)
Prima di eseguire l'algoritmo è necessario preparare i dati di
input nel formato accettato.
Questo passo è effettuato attraverso un wrapper java che
seleziona i dati dalla tabella dei profili e crea un file xml.
Pre-processingPre-processing
Serie temporali in XMLSerie temporali da DB
29. Self Organizing Map
Le self-organizing map (SOM) sono un particolare tipo di rete
neurale artificiale. È addestrata usando l’apprendimento non
supervisionato per produrre una rappresentazione dei campioni
di training in uno spazio a bassa dimensione preservando
le proprietà topologiche dello spazio degli ingressi.
33. Interpretazione dei dati
Metodologia di classificazione
• creazione di un prototipo per ogni profilo;
• discretizzazione dei valori che caratterizzano i nodi;
• calcolo della similarità (coseno di similarità);
• affinamento dell’indice di similarità;
• assegnamento del profilo più simile al nodo.