Gartner prevede che oltre il 70 % delle implementazioni di Hadoop non soddisferà gli obiettivi di generazione di business e di riduzione dei costi a causa della mancanza di competenze sul mercato oltre che alle difficoltà d’integrazione.
Dell™ PowerEdge™ VRTX è la nuova e unica piattaforma di soluzioni che rivoluziona l'infrastruttura IT per le piccole e medie imprese. Scalabile, integrata e di semplice gestione è in grado di eseguire più applicazioni ed è predisposta per la virtualizzazione: la piattaforma PowerEdge VRTX è un centro dati versatile e semplificato con le dimensioni di un tipico server tower a due socket 5U.
Dopo anni di dominio incontrastato da parte dei database relazionali assistiamo ad un'incredibile proliferazione di soluzioni alternative.
Questa presentazione fornirà una mappa per navigare nel vasto mare dei database non relazionali senza andare alla deriva.
The document discusses how the database world is changing with the rise of NoSQL databases. It provides an overview of different categories of NoSQL databases like key-value stores, column-oriented databases, document databases, and graph databases. It also discusses how these NoSQL databases are being used with cloud computing platforms and how they are relevant for .NET developers.
Gartner prevede che oltre il 70 % delle implementazioni di Hadoop non soddisferà gli obiettivi di generazione di business e di riduzione dei costi a causa della mancanza di competenze sul mercato oltre che alle difficoltà d’integrazione.
Dell™ PowerEdge™ VRTX è la nuova e unica piattaforma di soluzioni che rivoluziona l'infrastruttura IT per le piccole e medie imprese. Scalabile, integrata e di semplice gestione è in grado di eseguire più applicazioni ed è predisposta per la virtualizzazione: la piattaforma PowerEdge VRTX è un centro dati versatile e semplificato con le dimensioni di un tipico server tower a due socket 5U.
Dopo anni di dominio incontrastato da parte dei database relazionali assistiamo ad un'incredibile proliferazione di soluzioni alternative.
Questa presentazione fornirà una mappa per navigare nel vasto mare dei database non relazionali senza andare alla deriva.
The document discusses how the database world is changing with the rise of NoSQL databases. It provides an overview of different categories of NoSQL databases like key-value stores, column-oriented databases, document databases, and graph databases. It also discusses how these NoSQL databases are being used with cloud computing platforms and how they are relevant for .NET developers.
Una presentazione su Netflix, per conoscerne gli aspetti generali, il funzionamento, la sua architettura e i servizi di cui usufruisce, con particolare focus sulla scalabilità
Logical Data Lake: polifunzionale e decentralizzato per l'analisi dei datiDenodo
Watch full webinar here: https://bit.ly/2KFC4j6
Storicamente il data lake viene strutturato come una piattaforma centralizzata di archiviazione dei dati al fine di consentire l'analisi e la gestione di grandi quantitativi di dati, per esempio da parte dei data scientist, e per ridurre i costi di archiviazione.
Al giorno d'oggi, avere successo con questo metodo di lavoro orientato su una repository di dati centralizzata, è reso più problematico dall'esplosione del big data, dalle nuove regole sulla privacy dei dati e dalle restrizioni intra-dipartimentali. In questo webinar discuteremo del perché i data lake multifunzionali e decentralizzati sono il futuro dell'analisi dei dati.
Partecipa a questa sessione per imparare:
- Le restrizioni del data lake fisico monofunzionale;
- Come costruire un Logical Datalake multifunzionale per i business users aziendali;
- I casi d'uso più recenti che rendono necessari un data lake multifunzionale e decentralizzato;
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...Data Driven Innovation
Oggi il tema non è più SI o NO ai sistemi NoSQL. Il problema sta nella capacità di essere “poliglotti” nell’uso di tecnologie per la gestione di dati e informazioni. Le strategie di innovazione sui Big Data nelle aziende non può prescindere dalla Polyglot Persistence, ma le difficoltà sono tante, specie in ambienti complessi ed enterprise. Ma la necessità di fare innovazione non è forte solo nelle startup, anzi…
Come gestire un sistema nel quale lo schema dei dati non è definibile a priori? Come poter cercare entità i cui dati stanno su più righe? In questa sessione andremo ad affrontare tutti questi problemi, storicamente tra i più complessi per chi si trova a doverli gestire eppure molto comuni e particolarmente delicati per quanto riguarda le performance.
Multitenancy con SQL Server e Azure SQL DatabaseGianluca Hotz
In questa sessione faremo il punto sulle soluzioni disponibili per venire incontro agli scenari di implementazione multitenancy con SQL Server e Azure SQL Database.
Analysts spend up to 80% of their time on data preparation delaying the time to analysis and decision making.” -Analysts spend up to 80% of their time on data preparation delaying the time to analysis and decision making.” Gartner
Descrizione delle principali tecnologie abilitanti alla gestione dei Big Data, con particolare attenzione all’ecosistema che gravita intorno al framework Hadoop di Apache.
Azure Synapse: data lake & modern data warehouse dalla A alla ZRoberto Messora
Con Azure Synapse abbiamo finalmente a disposizione un ambiente integrato in cui poter implementare compiutamente un modern Data Warehouse. Abbiamo ormai capito sul campo che non ha senso mettere in competizione fra di loro data lake e data warehouse, con Azure Synapse la piena collaborazione fra di loro diventa il punto di forza di una strategia sui dati che unifica in un unico ambiente data ingestion, data preparation e analytics.In questa sessione verrà mostrato come Azure Synapse permetta di fare tutto questo a partire dal dato grezzo proveniente dalle più svariate fonti dati.
MySQL Day Milano 2017 - Dalla replica a InnoDB Cluster: l’HA secondo MySQLPar-Tec S.p.A.
In occasione del MySQL Day 2017 di Milano il TechAdvisor Michelangelo Uberti ha fornito una panoramica delle soluzioni native di alta disponibilità di MySQL.
I punti trattati durante la presentazione sono:
- Presentazione dell’offerta Par-Tec dedicata a MySQL Enterprise
- High Availability: cause, esigenze, aspettative
- Funzionamento, benefici e limiti dei principali approcci:
- Replica tradizionale
- MySQL Cluster
- MySQL Group Replication
- La novità: MySQL InnoDB Cluster
Per saperne di più, scaricate le slide e guardate il video della presentazione del nostro TechAdvisor su https://www.par-tec.it/dalla-replica-a-innodb-cluster-l-ha-secondo-mysql-milano
Descrizione delle principali tecnologie abilitanti alla gestione dei Big Data, con particolare attenzione all’ecosistema che gravita intorno al framework Hadoop di Apache.
[AxonIQ Italia Community] Architetture distribuite a eventi: sono adatte al m...Corrado Musumeci
Architetture distribuite a eventi: sono adatte al mio progetto?
Una rapida introduzione ai vantaggi che possiamo ottenere dall'adozione di una architettura a microservizi guidata dagli eventi.
Quali sono i problemi che tipicamente affliggono i sistemi software complessi?
Quali di questi problemi possono risolti adottando un approccio distribuito?
Che complessità dobbiamo affrontare nello sviluppo di applicazioni distribuite?
Cercheremo di sviscerare questi e altri dubbi relativi all'implementazione di sistemi event-driven distribuiti.
Una presentazione su Netflix, per conoscerne gli aspetti generali, il funzionamento, la sua architettura e i servizi di cui usufruisce, con particolare focus sulla scalabilità
Logical Data Lake: polifunzionale e decentralizzato per l'analisi dei datiDenodo
Watch full webinar here: https://bit.ly/2KFC4j6
Storicamente il data lake viene strutturato come una piattaforma centralizzata di archiviazione dei dati al fine di consentire l'analisi e la gestione di grandi quantitativi di dati, per esempio da parte dei data scientist, e per ridurre i costi di archiviazione.
Al giorno d'oggi, avere successo con questo metodo di lavoro orientato su una repository di dati centralizzata, è reso più problematico dall'esplosione del big data, dalle nuove regole sulla privacy dei dati e dalle restrizioni intra-dipartimentali. In questo webinar discuteremo del perché i data lake multifunzionali e decentralizzati sono il futuro dell'analisi dei dati.
Partecipa a questa sessione per imparare:
- Le restrizioni del data lake fisico monofunzionale;
- Come costruire un Logical Datalake multifunzionale per i business users aziendali;
- I casi d'uso più recenti che rendono necessari un data lake multifunzionale e decentralizzato;
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...Data Driven Innovation
Oggi il tema non è più SI o NO ai sistemi NoSQL. Il problema sta nella capacità di essere “poliglotti” nell’uso di tecnologie per la gestione di dati e informazioni. Le strategie di innovazione sui Big Data nelle aziende non può prescindere dalla Polyglot Persistence, ma le difficoltà sono tante, specie in ambienti complessi ed enterprise. Ma la necessità di fare innovazione non è forte solo nelle startup, anzi…
Come gestire un sistema nel quale lo schema dei dati non è definibile a priori? Come poter cercare entità i cui dati stanno su più righe? In questa sessione andremo ad affrontare tutti questi problemi, storicamente tra i più complessi per chi si trova a doverli gestire eppure molto comuni e particolarmente delicati per quanto riguarda le performance.
Multitenancy con SQL Server e Azure SQL DatabaseGianluca Hotz
In questa sessione faremo il punto sulle soluzioni disponibili per venire incontro agli scenari di implementazione multitenancy con SQL Server e Azure SQL Database.
Analysts spend up to 80% of their time on data preparation delaying the time to analysis and decision making.” -Analysts spend up to 80% of their time on data preparation delaying the time to analysis and decision making.” Gartner
Descrizione delle principali tecnologie abilitanti alla gestione dei Big Data, con particolare attenzione all’ecosistema che gravita intorno al framework Hadoop di Apache.
Azure Synapse: data lake & modern data warehouse dalla A alla ZRoberto Messora
Con Azure Synapse abbiamo finalmente a disposizione un ambiente integrato in cui poter implementare compiutamente un modern Data Warehouse. Abbiamo ormai capito sul campo che non ha senso mettere in competizione fra di loro data lake e data warehouse, con Azure Synapse la piena collaborazione fra di loro diventa il punto di forza di una strategia sui dati che unifica in un unico ambiente data ingestion, data preparation e analytics.In questa sessione verrà mostrato come Azure Synapse permetta di fare tutto questo a partire dal dato grezzo proveniente dalle più svariate fonti dati.
MySQL Day Milano 2017 - Dalla replica a InnoDB Cluster: l’HA secondo MySQLPar-Tec S.p.A.
In occasione del MySQL Day 2017 di Milano il TechAdvisor Michelangelo Uberti ha fornito una panoramica delle soluzioni native di alta disponibilità di MySQL.
I punti trattati durante la presentazione sono:
- Presentazione dell’offerta Par-Tec dedicata a MySQL Enterprise
- High Availability: cause, esigenze, aspettative
- Funzionamento, benefici e limiti dei principali approcci:
- Replica tradizionale
- MySQL Cluster
- MySQL Group Replication
- La novità: MySQL InnoDB Cluster
Per saperne di più, scaricate le slide e guardate il video della presentazione del nostro TechAdvisor su https://www.par-tec.it/dalla-replica-a-innodb-cluster-l-ha-secondo-mysql-milano
Descrizione delle principali tecnologie abilitanti alla gestione dei Big Data, con particolare attenzione all’ecosistema che gravita intorno al framework Hadoop di Apache.
[AxonIQ Italia Community] Architetture distribuite a eventi: sono adatte al m...Corrado Musumeci
Architetture distribuite a eventi: sono adatte al mio progetto?
Una rapida introduzione ai vantaggi che possiamo ottenere dall'adozione di una architettura a microservizi guidata dagli eventi.
Quali sono i problemi che tipicamente affliggono i sistemi software complessi?
Quali di questi problemi possono risolti adottando un approccio distribuito?
Che complessità dobbiamo affrontare nello sviluppo di applicazioni distribuite?
Cercheremo di sviscerare questi e altri dubbi relativi all'implementazione di sistemi event-driven distribuiti.
[AxonIQ Italia Community] Architetture distribuite a eventi: sono adatte al m...
No Sql Intro
1. Università degli Studi di Salerno
Sistemi Informatici e Tecnologie del Software
NOSQL DATABASE
!
Basi di Dati II
Anno 2013/2014
Prof.ssa G.Tortora Prof. G.Polese
Branca Carlo
Grano Giovanni
Merola Matteo
Scalabrino Simone
Overview, classificazione e utilizzi pratici
7. RDBMS - Motivazioni
• Schema predefinito per lo storage di dati strutturati
• Struttura BCNF già familiare
• Strong consistency
• Transazioni
• Maturi e accuratamente testati (la maggior parte)
• Facile adozione/integrazione
• Basati sulle proprietà ACID
• Data Retrieval: Standard Query Language (SQL) - versatile e potente
• Scalabilità verticale: se volessimo rendere un DB SQL scalabile, l’unica
alternativa sarebbe quella di potenziare l’hardware sul quale il DBMS è installato
10. Introduzione - BIG USERS
Un gran numero di utenti combinato con la una natura fortemente dinamica dei pattern di
gestione dei dati sta guidando il bisogno di nuove database scalabili. Con le tecnologie
relazionali, molti sviluppatori trovano difficile raggiungere la scalabilità dinamica richiesta
dalle applicazioni per garantire il livello di performance richiesto dagli utenti…
… molti si stanno rivolgendo ai NoSQL!
12. Introduzione - BIG DATA
L’ammontare dei dati è in rapida crescita e la natura di questi dati dati sta cambiando in
conseguenza all’utilizzo che gli sviluppatori fanno di nuovi tipi di dati (per la maggior parte
non strutturati o semi strutturati) nelle loro applicazioni
14. Introduzione - The Internet of Things
THE INTERNET OF THINGS
!
• Ci sono 14 milioni di “cose” connesse ad Internet. Si tratta di fabbriche, aziende
agricole, ospedali e warehouses. Ci si connette da casa o dall’auto. Ci si
connette dallo smarthphone e dal tablet. Si ricevono continuamente dati su
ambiente, posizioni geografiche, spostamenti, temperature, meteo da oltre 50
bilioni di sensori
• La chiave è l’accesso globale real-time!
• I dati relativi alle telemetrie sono di piccole dimensioni, semi-strutturati e continui.
Si tratta di una grossa sfida per i database relazionali i quali richiedono dati
strutturati e con uno schema rigido
• I NoSQL raccolgono questa sfida! Sempre più aziende innovative si affidano a
questi database richiedendo una tecnologia per sia in grado di scalare con le
milioni di “cose” connesse ad Internet
17. Caratteristiche
NOSQL KEYWORD
• Non relazionali: l’approccio rigido dei db relazionali non permette di
memorizzare dati fortemente dinamici. I db NoSQL sono “schemaless” e
consentono di memorizzare “on the fly” attributi, anche senza averli definiti a
priori
• Distribuiti: la flessibilità nella clusterizzazione e nella replicazione dei dati
permette di distribuire su più nodi lo storage, in modo da realizzare potenti
sistemi “fault tollerance”
• Scalabili orizzontalmente: in contrapposizione alla scalabilità verticale, abbiamo
architetture enormemente scalabili, che consentono di memorizzare e gestire una
grande quantità di informazioni
• Open-source: filosofia alla base del movimento NoSQL
19. • Grossi volumi di dati
• Goodbye DBAs: un sistema RDBMS di
alto livello può essere mantenuto
s o l ame n t e c o n l ’ a s s i s t e n z a d i
amministratori altamente esperti (e
costosi). I Database NoSQL sono
generalmente ideati per richiede una
minore manutenzione.
• Velocità di risposta alle query!
• BASE - le proprietà ACID non sono
richieste
• CAP Theorem
Caratteristiche
20. Transazioni BASE
Caratteristiche
I NoSQL si basano su un modello più morbido e flessibile. Il modello BASE si sposa
con la flessibilità offerta dai NoSQL e da approcci similari per il management dei
dati non strutturati
• Basically Available: l’approccio dei database NoSQL si basa sul garantire la
disponibilità dei dati anche in presenza di fallimenti multipli. Questo obiettivo è
raggiunto attraverso un approccio fortemente distribuito
• Soft state: i database BASE abbandonano il requisito della consistenza dei
modelli ACID quasi completamente. La consistenza dei dati è un problema dello
sviluppatore e non deve essere gestita dal database.
• Eventually Consistent: l’unico requisito riguardante la consistenza è garantire
che in un certo punto nel futuro i dati possano convergere ad uno stato
consistente
22. Caratteristiche
Brewer’s CAP Theorem
Un sistema distribuito è in grado di supportare
solamente due tra le seguenti caratteristiche:
• Consistency: tutti i nodi vedono lo stesso dato
allo stesso tempo
• Availability: ogni operazione deve sempre
ricevere una risposta
• Partition Tolerance: capacità di un sistema di
essere tollerante ad una aggiunta, una rimozione
di un nodo nel sistema distribuito o alla non
disponibilità di un componente singolo
24. Caratteristiche - Challenges
Troppo entusiasmo…?
• Maturità: i sistemi RDBMS sono in esercizio da tanto tempo. Per i sostenitori del
movimento NoSQL questo è un segno della loro obsolescenza; per molti CIO
invece, la maturità di un RDBMS è rassicurate
• Supporto: tutte le aziende che sviluppato e vendono RDBMS forniscono un alto
livello di supporto alle aziende. I sistemi NoSQL invece sono spesso progetti
open source
• Business Intelligence: la business intelligence è un elemento chiave per le
aziende IT; spesso i tools per la BI non supportano connettività con i database
NoSQL
• Amministrazione: un obiettivo di design per i database NoSQL è quello di non
necessitare di gran supporto amministrativo ma la realtà è che al giorno d’oggi
sono necessarie grosse competenze per la loro installazione e manutenzione
• Expertise: è più semplice trovare un esperto amministrazione RDBMS che non
un espero in NoSQL
27. Classificazione
KEY-VALUE DATA STORE
!
• Utilizza un associative array (chiave-valore)
come modello fondamentale per lo storage
• Storage, update e ricerca basato sulle chiavi
• Tipi di dati primitivi familiari ai programmatori
• Semplice
• Veloce recupero dei dati
• Grandi moli di dati
29. Classificazione
DOCUMENT DATA STORE
!
• Utilizzando dati non strutturati
• Supporto a diversi tipi di documento
• Un documento è identificato da una chiave
primaria
• Schema-less
• Scalabilità orizzontale
!
31. Classificazione
COLUMN-ORIENTED DATA
STORE
!
• I dati sono nelle colonne anziché nelle righe
• Un gruppo di colonne è chiamato famiglia ed vi è
un’analogia con le tabelle di un database relazionale
• Le colonne possono essere facilmente distribuite
• Scalabile
• Performante
• Fault-tollerance
!
33. Classificazione
GRAPH-BASED DATA STORE
!
• Utilizza nodi (entità), proprietà (attributi) e archi
(relazioni)
• Modello logico semplice e intuitivo
• Ogni elemento contiene un puntatore
all’elemento adiacente
• Attraversamento del grafo per trovare i dati
• Efficiente per la rappresentazione di reti sociali o
dati sparsi
• Relazioni tra i dati centrali
35. Classificazione
Operational complexity: all’aumentare della complessità nella struttura dati
diminuisce la capacità di memorizzazione dei dati stessi (parametro size)
38. Ranking
DB-Engines elenca 221 tipi differenti di database management systems, ognuno
classificato secondo un modello differente.
Questo chart mostra il numero di sistemi per ogni categoria. Alcuni sistemi possono
appartenere a più di una categoria.
40. Ranking
Questo chart-diagram mostra la popolarità di ogni categoria. È calcolato utilizzando
la popolarità (lo score nel ranking) di ogni sistema per categoria.
La somma dei ranking rappresenta il 100%
42. Ranking
Questo diagramma mostra il trend storico della popolarità per ogni categoria. Ogni
mese, i primi tre sistemi per categoria sono scelti e la media del loro ranking score
è calcolata. Per permettere delle comparazioni, il valore iniziale è normalizzato a
100.
43.
44. Scarica questa presentazione
http://goo.gl/NHIC8k
Giovanni Grano
granogiovanni90@gmail.com
Università degli Studi di Salerno