Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Mario Incarnati - The power of data visualization

115 views

Published on

https://www.meetup.com/it-IT/Machine-Learning-Data-Science-Meetup/events/261130577/

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Mario Incarnati - The power of data visualization

  1. 1. La nostra mission "Helping people make sense of data"
  2. 2. Chi siamo Nati nel 2009 a Londra 8 sedi in Europa Tableau EMEA Partner Reseller of the year 2013, 2014 e 2016 Tableau Partner Reseller of the year 2017 in UK&I, DACH 2017 Alteryx partner of the year 2016, 2017, 2018 200+ consulenti certificati Tableau e Alteryx Data School e Data Academy: centri di eccellenza per la formazione di Data Analysts
  3. 3. Quali servizi offriamo LICENZE Vendita licenze Supporto e assistenza tecnica Supporto operativo ‘’How to…?’’ Accesso al Center of Excellence FORMAZIONE Corsi ufficiali Tableau e Alteryx, con trainer certificati Corsi personalizzati Webinar e Workshop in aula Corsi e formazione online CONSULENZA Consulenza ‘’Quick start’’ Core Team Consultancy (sviluppo progetti complessi) Data Academy Program (supporto continuativo on-premise) Management Consulting su Data Intelligence
  4. 4. I nostri Clienti
  5. 5. La Data Science 2.0 L’evoluzione della disciplina
  6. 6. AGENDA • L’evoluzione della DataScience La Data Science, ormai in evoluzione, è la disciplina che nel mondo delle informazioni ci viene in soccorso e ci consente di analizzare, gestire ed ordinare i dati nel modo corretto ma soprattutto rappresenta per le aziende un supporto decisionale ormai imprescindibile. • L’introduzione della DataVisualization L’evoluzione di questa disciplina ha portato alla creazione di nuovi strumenti, che si focalizzano sulla Data Visualization, ovvero la possibilità di rappresentare graficamente in modo rapido ed efficiente i dati a nostra disposizione. • Caso di studio: PROGETTO FASTWEB
  7. 7. Evoluzione della Datascience Data Science Data Analysis Data Science: è un campo multidisciplinare che utilizza metodi, processi, algoritmi e sistemi scientifici per estrarre conoscenze e intuizioni da dati strutturati e non strutturati. Data Analysis: è il processo di applicazione sistematica di tecniche statistiche e/o logiche per descrivere e illustrare, condensare e ricapitolare e valutare i dati. Data Mining: è l'insieme di tecniche finalizzate all'estrazione di informazioni utili da grandi quantità di dati, attraverso metodi automatici o semi-automatici che possano supportare il processo analitico e predittivo. Data Mining Data Visualization
  8. 8. Data Visualization Data Visualization: è la rappresentazione grafica di informazioni e dati. Utilizzando elementi visivi come grafici, grafici e mappe, gli strumenti di visualizzazione dei dati forniscono un modo accessibile per vedere e comprendere le tendenze, gli outlier e i modelli dei dati. Nel mondo dei Big Data, gli strumenti e le tecnologie di visualizzazione dei dati sono essenziali per analizzare enormi quantità di informazioni e prendere decisioni basate sui dati.
  9. 9. USE CASE
  10. 10. USE CASE: Overview L’obiettivo del lavoro commissionato dal cliente, è di confezionare pacchetti di offerte orientati alle fasce di popolazione con redditi medio-bassi, quindi l’analisi svolta mira ad una stima dei redditi per sezione censuaria finalizzata ad una clusterizzazione secondo caratteristiche o indicatori socio-economici e territoriali. Software utilizzati per lo sviluppo:
  11. 11. USE CASE: Overview Fasi del progetto:  DATA PREPARATION: preparazione, pulizia del dato • Variazioni_amministrative_territoriali.csv (Fonte ISTAT) • Redditi_e_principali_variabili_IRPEF_su_base_comunale_CSV_2016.csv (Fonte Ministero EF) • R*_indicatori_2011_sezioni.csv (Fonte ISTAT)  ANALISI CORRELAZIONI: finalizzata alla crematura di determinate variabili socio-economiche e territoriali da inserire nel modello  STIMA REDDITO CON RANDOM FOREST: stima redditi a livello di sezione censuaria  CLUSTERING: Clusterizzazione per variabili socio-economiche e territoriali  CREAZIONE DATASET PER RAPPRESENTAZIONE SU TABLEAU
  12. 12. USE CASE: Data preparation tools Per ogni fase del processo di elaborazione dati sono stati utilizzati dei tool specifici:  AUTOFIELD  SELECT  FORMULA
  13. 13. USE CASE: Join and transform tools  JOIN  UNION  SUMMARIZE
  14. 14. USE CASE: Statistics tools  ASSOCIATION ANALYSIS  RANDOM FOREST  K-CENTROID CLUSTER ANALYSIS
  15. 15. USE CASE: Tableau Dashboard Pannello di controllo:  Filtro provincia  Filtro comune  Dettaglio reddito/cluster  Legenda Dati demografici e socioeconomici N. Sezioni per cluster Distribuzione per reddito Georeferenziazione

×