MongoDB 3.6 ti permette di *muoverti alla stessa velocità dei tuoi dati*, trasformando analisti, sviluppatori e sistemisti in un motore di crescita per il business. Con MongoDB 3.6, le applicazioni arrivano prima sul mercato, sono affidabili e sicure nell'esecuzione in scala, offrono intelligence e informazioni utili in tempo reale. https://www.mongodb.com/mongodb-3.6
Continous Delivery e codice di Alta Qualità in PHP. Usare Git , Jenkins e diversi tool per realizzare codice di qualità e per effettuare il deploy in maniera automatica.
Presentazione effettuata al 5 incontro del Palermo PHP User Group al teatro Gregotti
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...Denodo
Guarda qui: https://bit.ly/3imvkq4
Le odierne strategie di migrazione verso il cloud devono tenere conto della maggiore complessità, in tali contesti, delle attività di Governance dei dati e di definizione delle architetture ibride e multi-cloud, riducendo al contempo i rischi intrinseci di perturbare le attività degli utenti e delle applicazioni durante la migrazione. I vantaggi principali della tecnologia di virtualizzazione dei dati forniscono l'astrazione necessaria per disaccoppiare gli utenti e le applicazioni da attività quali la migrazione e il consolidamento dei dati, aggiungendo al contempo la semantica e la governance, necessarie nei moderni ambienti di dati.
Unisciti agli esperti di Miriade e Denodo per sentire come la tua azienda può affrontare e superare le sfide insite nell’adozione di un modello Cloud e conoscere le Best Practice per una corretta gestione dei dati e dei costi in un tale modello.
In questa sessione, parleremo di:
- come l'astrazione dei dati è fondamentale per sostenere gli utenti e le applicazioni durante la migrazione dei dati;
- come l'astrazione dei dati riduce la complessità degli ambienti Cloud ibridi;
- come l'astrazione dei dati consente di accelerare le migrazioni del Cloud verso le moderne piattaforme dati e i Data Lakes;
- come l'astrazione dei dati ottimizza in modo continuo i dati nel Cloud
MongoDB 3.6 ti permette di *muoverti alla stessa velocità dei tuoi dati*, trasformando analisti, sviluppatori e sistemisti in un motore di crescita per il business. Con MongoDB 3.6, le applicazioni arrivano prima sul mercato, sono affidabili e sicure nell'esecuzione in scala, offrono intelligence e informazioni utili in tempo reale. https://www.mongodb.com/mongodb-3.6
Continous Delivery e codice di Alta Qualità in PHP. Usare Git , Jenkins e diversi tool per realizzare codice di qualità e per effettuare il deploy in maniera automatica.
Presentazione effettuata al 5 incontro del Palermo PHP User Group al teatro Gregotti
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...Denodo
Guarda qui: https://bit.ly/3imvkq4
Le odierne strategie di migrazione verso il cloud devono tenere conto della maggiore complessità, in tali contesti, delle attività di Governance dei dati e di definizione delle architetture ibride e multi-cloud, riducendo al contempo i rischi intrinseci di perturbare le attività degli utenti e delle applicazioni durante la migrazione. I vantaggi principali della tecnologia di virtualizzazione dei dati forniscono l'astrazione necessaria per disaccoppiare gli utenti e le applicazioni da attività quali la migrazione e il consolidamento dei dati, aggiungendo al contempo la semantica e la governance, necessarie nei moderni ambienti di dati.
Unisciti agli esperti di Miriade e Denodo per sentire come la tua azienda può affrontare e superare le sfide insite nell’adozione di un modello Cloud e conoscere le Best Practice per una corretta gestione dei dati e dei costi in un tale modello.
In questa sessione, parleremo di:
- come l'astrazione dei dati è fondamentale per sostenere gli utenti e le applicazioni durante la migrazione dei dati;
- come l'astrazione dei dati riduce la complessità degli ambienti Cloud ibridi;
- come l'astrazione dei dati consente di accelerare le migrazioni del Cloud verso le moderne piattaforme dati e i Data Lakes;
- come l'astrazione dei dati ottimizza in modo continuo i dati nel Cloud
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...Data Driven Innovation
Oggi il tema non è più SI o NO ai sistemi NoSQL. Il problema sta nella capacità di essere “poliglotti” nell’uso di tecnologie per la gestione di dati e informazioni. Le strategie di innovazione sui Big Data nelle aziende non può prescindere dalla Polyglot Persistence, ma le difficoltà sono tante, specie in ambienti complessi ed enterprise. Ma la necessità di fare innovazione non è forte solo nelle startup, anzi…
Introduzione al Domain Driven Design (DDD)DotNetMarche
In questa sessione si approfondirà il concetto di Domain Driven Design, un principio di progettazione che può essere visto come una “forma-mentis” per aiutare a concepire e modellare applicazioni enterprise che fanno un forte uso del Domain Model. Questa metodologia, introdotta da Eric Evans, mette in risalto il dominio applicativo di un progetto, costituendo quindi il collante tra il modello analitico e il modello implementativo e trovando la sua naturale applicazione in ambienti di sviluppo agili come Extreme Programming. Come completamento della sessione verranno esaminate alcune tecniche di Layering e pattern architetturali che ben si sposano con questa tecnica.
In queste slide, presentate durante il Google Developer Group Dev Fest Mediterranean 2014 vi è una introduzione alla "Continuous integration" una pratica di sviluppo software dove i membri di un team integrano il loro lavoro frequentemente.Sono inoltre presentati alcuni tool integrabili in una "build" per misurare la qualità del codice PHP così da rispettare diverse metriche ed avere codice di qualità.
MySQL Day Milano 2017 - Dalla replica a InnoDB Cluster: l’HA secondo MySQLPar-Tec S.p.A.
In occasione del MySQL Day 2017 di Milano il TechAdvisor Michelangelo Uberti ha fornito una panoramica delle soluzioni native di alta disponibilità di MySQL.
I punti trattati durante la presentazione sono:
- Presentazione dell’offerta Par-Tec dedicata a MySQL Enterprise
- High Availability: cause, esigenze, aspettative
- Funzionamento, benefici e limiti dei principali approcci:
- Replica tradizionale
- MySQL Cluster
- MySQL Group Replication
- La novità: MySQL InnoDB Cluster
Per saperne di più, scaricate le slide e guardate il video della presentazione del nostro TechAdvisor su https://www.par-tec.it/dalla-replica-a-innodb-cluster-l-ha-secondo-mysql-milano
Come scegliere una piattaforma di Web analytics, quali sono le domande che dobbiamo formulare ad un fornitore? Come districarsi tra le varie offerte dei fornitori?
Analysts spend up to 80% of their time on data preparation delaying the time to analysis and decision making.” -Analysts spend up to 80% of their time on data preparation delaying the time to analysis and decision making.” Gartner
Business Intelligence e Business Analytics sono termini che ricorrono ormai quotidianemente. Cosa significano? Che valore portano in una azienda? Come si crea una soluzione di Business Intelligece e di Business Analytics? Che strumenti mette a disposizione la piattaforma Microsoft? In questa sessione andremo ad introdurre tutti gli attori, gli strumenti e le tecnologie che concorrono a realizzare tali soluzioni, vendendone alcune "dal vivo" per capire come si usano ed il grande valore aggiunto che, in una società sempre più affamata di informazioni, ma ricca solo di dati, possono portare.
Festival della Tecnologia - panel Open data: bene comune - 2019-11-09Synapta
con Ciro Cattuto, Francesca De Chiara, Federico Morando
Abstract: I dati aperti sono un bene comune che fornisce descrizioni condivise della realtà, stimola dibattiti, livella asimmetrie informative, riduce le barriere all'ingresso per startup e PMI innovative, incoraggia responsabilità e trasparenza. Governare la trasformazione digitale nell'interesse dei cittadini richiede una riflessione su meccanismi e incentivi che sostengono la creazione di tale bene comune.
Sabato, 9 Novembre 2019 - 10:00
Sede Centrale del Politecnico di Torino
Aula 1, corso Duca degli Abruzzi 24, Torino
More Related Content
Similar to Marco Berlot - Qualità dati - Lunch Nexa
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...Data Driven Innovation
Oggi il tema non è più SI o NO ai sistemi NoSQL. Il problema sta nella capacità di essere “poliglotti” nell’uso di tecnologie per la gestione di dati e informazioni. Le strategie di innovazione sui Big Data nelle aziende non può prescindere dalla Polyglot Persistence, ma le difficoltà sono tante, specie in ambienti complessi ed enterprise. Ma la necessità di fare innovazione non è forte solo nelle startup, anzi…
Introduzione al Domain Driven Design (DDD)DotNetMarche
In questa sessione si approfondirà il concetto di Domain Driven Design, un principio di progettazione che può essere visto come una “forma-mentis” per aiutare a concepire e modellare applicazioni enterprise che fanno un forte uso del Domain Model. Questa metodologia, introdotta da Eric Evans, mette in risalto il dominio applicativo di un progetto, costituendo quindi il collante tra il modello analitico e il modello implementativo e trovando la sua naturale applicazione in ambienti di sviluppo agili come Extreme Programming. Come completamento della sessione verranno esaminate alcune tecniche di Layering e pattern architetturali che ben si sposano con questa tecnica.
In queste slide, presentate durante il Google Developer Group Dev Fest Mediterranean 2014 vi è una introduzione alla "Continuous integration" una pratica di sviluppo software dove i membri di un team integrano il loro lavoro frequentemente.Sono inoltre presentati alcuni tool integrabili in una "build" per misurare la qualità del codice PHP così da rispettare diverse metriche ed avere codice di qualità.
MySQL Day Milano 2017 - Dalla replica a InnoDB Cluster: l’HA secondo MySQLPar-Tec S.p.A.
In occasione del MySQL Day 2017 di Milano il TechAdvisor Michelangelo Uberti ha fornito una panoramica delle soluzioni native di alta disponibilità di MySQL.
I punti trattati durante la presentazione sono:
- Presentazione dell’offerta Par-Tec dedicata a MySQL Enterprise
- High Availability: cause, esigenze, aspettative
- Funzionamento, benefici e limiti dei principali approcci:
- Replica tradizionale
- MySQL Cluster
- MySQL Group Replication
- La novità: MySQL InnoDB Cluster
Per saperne di più, scaricate le slide e guardate il video della presentazione del nostro TechAdvisor su https://www.par-tec.it/dalla-replica-a-innodb-cluster-l-ha-secondo-mysql-milano
Come scegliere una piattaforma di Web analytics, quali sono le domande che dobbiamo formulare ad un fornitore? Come districarsi tra le varie offerte dei fornitori?
Analysts spend up to 80% of their time on data preparation delaying the time to analysis and decision making.” -Analysts spend up to 80% of their time on data preparation delaying the time to analysis and decision making.” Gartner
Business Intelligence e Business Analytics sono termini che ricorrono ormai quotidianemente. Cosa significano? Che valore portano in una azienda? Come si crea una soluzione di Business Intelligece e di Business Analytics? Che strumenti mette a disposizione la piattaforma Microsoft? In questa sessione andremo ad introdurre tutti gli attori, gli strumenti e le tecnologie che concorrono a realizzare tali soluzioni, vendendone alcune "dal vivo" per capire come si usano ed il grande valore aggiunto che, in una società sempre più affamata di informazioni, ma ricca solo di dati, possono portare.
Similar to Marco Berlot - Qualità dati - Lunch Nexa (20)
Festival della Tecnologia - panel Open data: bene comune - 2019-11-09Synapta
con Ciro Cattuto, Francesca De Chiara, Federico Morando
Abstract: I dati aperti sono un bene comune che fornisce descrizioni condivise della realtà, stimola dibattiti, livella asimmetrie informative, riduce le barriere all'ingresso per startup e PMI innovative, incoraggia responsabilità e trasparenza. Governare la trasformazione digitale nell'interesse dei cittadini richiede una riflessione su meccanismi e incentivi che sostengono la creazione di tale bene comune.
Sabato, 9 Novembre 2019 - 10:00
Sede Centrale del Politecnico di Torino
Aula 1, corso Duca degli Abruzzi 24, Torino
Analisi della qualità dei dati di ContrattiPubblici.orgSynapta
Tesi per il master in analisi dati per la business intelligence e data science di Sofia Rosati sulla qualità dei dati degli appalti italiani presenti nel progetto ContrattiPubblici.org
Sound Archives and Musical Instrument CollectionsSynapta
In this project, held by the University of Turin, we developed a cataloguing system based on Collective Access and Wikidata. The catalogue of "Museo del Paesaggio Sonoro" will be published as Linked Open Data and published on the MIMO platform.
Pilota CoBiS Linked Data - presentazione MABSynapta
Convegno "Facciamoci trovare - Il patrimonio culturale e gli open data". Tavola rotonda organizzata Venerdì 18 maggio 2018, ore 9.30-13.00 presso il Polo del '900.
CoBiS Linked Open Data - presentazione finale del progetto pilotaSynapta
Presentazione nell'ambito della giornata "Il catalogo aumentato: come cambia oggi il modo di accedere ai documenti e alle informazioni", 11 dicembre, Torino
ContrattiPubblici.org - Seminario ANCI - Roma - SAA2017Synapta
Venerdì 10 Marzo 2017, sala Conferenze ANCI a Roma, Federico Morando presenta ContrattiPubblici.org nell’ambito di un seminario del Corso di Formazione Specialistica in Amministrazione Municipale (ForsAM_V Edizione): "L'Open Government per i giovani amministratori: incontro con gli studenti del Corso di Formazione specialistica in Amministrazione Municipale".
Iniziativa nell'ambito della Settimana dell’Amministrazione Aperta.
1. Uno strumento per misurare la qualità dei dati
Tell Me Quality
Marco Berlot
2. Qualità dei Dati
•Lo stato di completezza, validità, consistenza e
accuratezza che rende un dato efficiente per un
utilizzo specifico.
•La qualità dei dati viene identificata come il grado
con cui le caratteristiche dei dati, utilizzate in
condizioni specifiche, soddisfano determinati
requisiti.
2
3. Dati di Bassa Qualità
• Un nominativo scritto male ("mrio rossi" invece di "Mario Rossi") è
indice di scarsa accuratezza sintattica.
• Un termine come "Patrizia Rossi" al posto di "Patrizio Rossi" è
anche indice di non accuratezza semantica.
3
7. E’ realmente un problema?
Attualmente la qualità dei dati è un problema per molti
professionisti operanti in un ampio settore dei sistemi
d’informazione. Uno studio aziendale ha stimato che il costo totale
per l’economia degli Stati Uniti legata ai problemi di qualità dati
superi i 600 miliardi di dollari l’anno (Eckerson, 2002).
7
17. Shape File
“ SHACL Shapes Constraint
Language, a language for
validating RDF graphs against a
set of conditions. These conditions
are provided as shapes and other
constructs expressed in the form
of an RDF graph. RDF graphs that
are used in this manner are called
"shapes graphs" in SHACL and
the RDF graphs that are validated
against a shapes graph are called
"data graphs” vocabolario,insieme
vocabolario,vincoli dati
17
22. Pagine interamente dinamiche
• Minor numero di linee di codice.
• Unica pagina che si crea
dinamicamente in base ai
parametri generati dal backend.
• Maggior complessità nella
scrittura all’inizio ma permette una
manutenzione del codice molto
più semplice. https://mustache.github.io/
Mustache Framework
22
23. Visualizzazione dei risultati
• Un risultato che riassume la
performance di ogni categoria
di misure e che permette di
confrontarle velocemente.
• Un risultato che permette di
confrontare la performance di
ogni misurazione in modo
approfondito.
Due tipologie di risultati: April
May
June
July
0 25 50 75 100
23
24. Radar Chart
Confronto non preciso di aree, ma che riesce a dare una buona idea generale.
24
Currentness
25. Grafico a barre orizzontali
Buona precisione nel confronto tra le diverse misurazioni.
25
26. Un caso reale
Le informazioni fornite al sistema provengono da più di 300,000 XML files
pubblicati da 15,000 pubbliche amministrazioni
26
35. Conclusioni
35
• Le percentuali di errori, per quanto basse, su un numero di file molto
alto sono significative.
• Una buona performance nella compliance del formato produce dati di
buona qualità (e.g. nella precisione).
• Currentness e completness sono collegate poiché alcuni dati si sanno
solo dopo (e.g. pagamento e data fine).
• La presenza di diversi errori di accuratezza possono essere un
campanello di allarme per inserimenti manuali e/o non controllati che
possono produrre dati errati anche oltre quelli rilevati dal nostro studio.
• Nell'accuratezza ci sono più errori semantici che sintattici.