Per il corso di Sistemi Operativi Avanzati ho studiato l'articolo "Google File System" scritto da Sanjay Ghemawat, Howard Gobioff, e Shun-Tak Leung, inquadrandone il contesto storico, gli obiettivi, le prestazioni e le principali differenze con l'HDFS.
La presentazione è stata realizzato per un seminario da tenere durante il corso di Sistemi Operativi Avanzati. Durante la presentazione si è discusso di Hadoop partendo dalle origini fino ad arrivare a parlare di qualche dettaglio più approfondito. Non si è scelto di entrare troppo nel dettaglio in quanto in seguito alla presentazione si è tenuta una demo sull'utilizzo di Hadoop su un cluster da noi allestito all'interno dell'università.
Soluzioni distribuite per l’analisi di dati biomedici in ambiente Virtual Dat...Giuseppe Luciano
Risultati dei test di scalabilità di due applicazioni di bio-informatica (conteggio di kmer) sviluppate con Apache Spark e Apache Hadoop.
I test sono stati eseguiti su un cloud del GARR.
Slide della mia tesi magistrale in Informatica.
Deploy MongoDB su Infrastruttura Amazon Web ServicesStefano Dindo
Lo scopo della presentazione è quella di fornire una visione a 360 gradi su come realizzare un'architettura MongoDB su un'infrastruttura Cloud Amazon Web Services.
La presentazione è suddivisa in quattro aree:
- Introduzione di base su MongoDB
- Preview delle caratteristiche di MongoDB 3
- Come organizzare architetture Replica Set e Sharding di MongoDB in VPC Cloud di Amazon Web Services
- Introduzione alle logiche di Schema Design di MongoDB
RDX e Windows Backup: semplice ed economica protezione dei datiPaolo Rossi
Presentazione dell`integrazione tra RDX e Windows Backup.
L'agenda prevede un introduzione a Sphere3D, alle soluzioni RDX QuikStor e a WIndows Backup. Possibili campi di utilizzo e una Live Demo.
La presentazione e' stata utilizzata per un Webinar in Italiano gratuito. Da oggi il portafoglio delle soluzioni Sphere3D, Overland Storage e Tandberg Data comprende soluzioni di storage, backup, archiving, cloud, virtualizzazione e mobile.
Talk divulgativo sull’evoluzione dei sistemi database nel corso negli anni, dalla nascita del modello relazionale fino alla definizione di nuovi modelli per la gestione di dati non strutturati ed esecuzione di elaborazioni dati parallele; in particolare vedremo insieme:
- Proprietà e limiti modello relazionale
- Big Data, Google e Hadoop
- Sharding, Amazon e NoSQL
- Database documentali
- Database a grafo
- Database orientati alle colonne
- Database In-Memory
Per il corso di Sistemi Operativi Avanzati ho studiato l'articolo "Google File System" scritto da Sanjay Ghemawat, Howard Gobioff, e Shun-Tak Leung, inquadrandone il contesto storico, gli obiettivi, le prestazioni e le principali differenze con l'HDFS.
La presentazione è stata realizzato per un seminario da tenere durante il corso di Sistemi Operativi Avanzati. Durante la presentazione si è discusso di Hadoop partendo dalle origini fino ad arrivare a parlare di qualche dettaglio più approfondito. Non si è scelto di entrare troppo nel dettaglio in quanto in seguito alla presentazione si è tenuta una demo sull'utilizzo di Hadoop su un cluster da noi allestito all'interno dell'università.
Soluzioni distribuite per l’analisi di dati biomedici in ambiente Virtual Dat...Giuseppe Luciano
Risultati dei test di scalabilità di due applicazioni di bio-informatica (conteggio di kmer) sviluppate con Apache Spark e Apache Hadoop.
I test sono stati eseguiti su un cloud del GARR.
Slide della mia tesi magistrale in Informatica.
Deploy MongoDB su Infrastruttura Amazon Web ServicesStefano Dindo
Lo scopo della presentazione è quella di fornire una visione a 360 gradi su come realizzare un'architettura MongoDB su un'infrastruttura Cloud Amazon Web Services.
La presentazione è suddivisa in quattro aree:
- Introduzione di base su MongoDB
- Preview delle caratteristiche di MongoDB 3
- Come organizzare architetture Replica Set e Sharding di MongoDB in VPC Cloud di Amazon Web Services
- Introduzione alle logiche di Schema Design di MongoDB
RDX e Windows Backup: semplice ed economica protezione dei datiPaolo Rossi
Presentazione dell`integrazione tra RDX e Windows Backup.
L'agenda prevede un introduzione a Sphere3D, alle soluzioni RDX QuikStor e a WIndows Backup. Possibili campi di utilizzo e una Live Demo.
La presentazione e' stata utilizzata per un Webinar in Italiano gratuito. Da oggi il portafoglio delle soluzioni Sphere3D, Overland Storage e Tandberg Data comprende soluzioni di storage, backup, archiving, cloud, virtualizzazione e mobile.
Talk divulgativo sull’evoluzione dei sistemi database nel corso negli anni, dalla nascita del modello relazionale fino alla definizione di nuovi modelli per la gestione di dati non strutturati ed esecuzione di elaborazioni dati parallele; in particolare vedremo insieme:
- Proprietà e limiti modello relazionale
- Big Data, Google e Hadoop
- Sharding, Amazon e NoSQL
- Database documentali
- Database a grafo
- Database orientati alle colonne
- Database In-Memory
Presentazione del company profile di Xenesys, un solution & service integrator che offre consulenza, progettazione e vendita di soluzioni, servizi e infrastrutture IT.
The document discusses how personalization and dynamic content are becoming increasingly important on websites. It notes that 52% of marketers see content personalization as critical and 75% of consumers like it when brands personalize their content. However, personalization can create issues for search engine optimization as dynamic URLs and content are more difficult for search engines to index than static pages. The document provides tips for SEOs to help address these personalization and SEO challenges, such as using static URLs when possible and submitting accurate sitemaps.
Lightning Talk #9: How UX and Data Storytelling Can Shape Policy by Mika Aldabaux singapore
How can we take UX and Data Storytelling out of the tech context and use them to change the way government behaves?
Showcasing the truth is the highest goal of data storytelling. Because the design of a chart can affect the interpretation of data in a major way, one must wield visual tools with care and deliberation. Using quantitative facts to evoke an emotional response is best achieved with the combination of UX and data storytelling.
This document summarizes a study of CEO succession events among the largest 100 U.S. corporations between 2005-2015. The study analyzed executives who were passed over for the CEO role ("succession losers") and their subsequent careers. It found that 74% of passed over executives left their companies, with 30% eventually becoming CEOs elsewhere. However, companies led by succession losers saw average stock price declines of 13% over 3 years, compared to gains for companies whose CEO selections remained unchanged. The findings suggest that boards generally identify the most qualified CEO candidates, though differences between internal and external hires complicate comparisons.
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 1MongoDB
MongoDB Atlas è il servizio DBaaS (Database-as-a-Service) che ti consente distribuire, gestire e scalare un database MongoDB in ambiente cloud con pochi clic.
Cloud storage in azienda: perche` Riak ci e` piaciutoBioDec
La realizzazione di un software per l'automazione di un processo di
lavoro ha portato all'implementazione di un sistema di storage in
grado di gestire imponenti flussi di dati (raw data, immagini...).
Il core del sistema di archiviazione e` il database NoSql Riak. A
quasi un anno dall'entrata in produzione, tale configurazione si e`
confermata robusta e performante (vengono acquisiti in modo
ridondato centinaia di migliaia di files ogni mese, realizzando un
archivio permanente in costante crescita dell'ordine di terabytes).
Nel corso dell'intervento verranno mostrate le motivazioni che hanno
portato a questa scelta.
Oltre ad una rapida panoramica volta ad illustrare le funzionalita`
di Riak si intende condividere in modo pratico il know-how acquisito
ripercorrendo le problematiche riscontrate durante il setup, la
configurazione e la gestione di un cluster Riak (ambienti di
sviluppo e produzione, ottimizzazioni, deploy del cluster, backup,
disaster recovery, ...).
Back to Basics, webinar 6: Messa in esercizioMongoDB
Questo è l'ultimo webinar della serie Back to Basics
che ti offrirà un'introduzione al database MongoDB. Questo webinar ti guiderà attraverso tutti i passaggi per l'implementazione della produzione.
Presentazione del company profile di Xenesys, un solution & service integrator che offre consulenza, progettazione e vendita di soluzioni, servizi e infrastrutture IT.
The document discusses how personalization and dynamic content are becoming increasingly important on websites. It notes that 52% of marketers see content personalization as critical and 75% of consumers like it when brands personalize their content. However, personalization can create issues for search engine optimization as dynamic URLs and content are more difficult for search engines to index than static pages. The document provides tips for SEOs to help address these personalization and SEO challenges, such as using static URLs when possible and submitting accurate sitemaps.
Lightning Talk #9: How UX and Data Storytelling Can Shape Policy by Mika Aldabaux singapore
How can we take UX and Data Storytelling out of the tech context and use them to change the way government behaves?
Showcasing the truth is the highest goal of data storytelling. Because the design of a chart can affect the interpretation of data in a major way, one must wield visual tools with care and deliberation. Using quantitative facts to evoke an emotional response is best achieved with the combination of UX and data storytelling.
This document summarizes a study of CEO succession events among the largest 100 U.S. corporations between 2005-2015. The study analyzed executives who were passed over for the CEO role ("succession losers") and their subsequent careers. It found that 74% of passed over executives left their companies, with 30% eventually becoming CEOs elsewhere. However, companies led by succession losers saw average stock price declines of 13% over 3 years, compared to gains for companies whose CEO selections remained unchanged. The findings suggest that boards generally identify the most qualified CEO candidates, though differences between internal and external hires complicate comparisons.
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 1MongoDB
MongoDB Atlas è il servizio DBaaS (Database-as-a-Service) che ti consente distribuire, gestire e scalare un database MongoDB in ambiente cloud con pochi clic.
Cloud storage in azienda: perche` Riak ci e` piaciutoBioDec
La realizzazione di un software per l'automazione di un processo di
lavoro ha portato all'implementazione di un sistema di storage in
grado di gestire imponenti flussi di dati (raw data, immagini...).
Il core del sistema di archiviazione e` il database NoSql Riak. A
quasi un anno dall'entrata in produzione, tale configurazione si e`
confermata robusta e performante (vengono acquisiti in modo
ridondato centinaia di migliaia di files ogni mese, realizzando un
archivio permanente in costante crescita dell'ordine di terabytes).
Nel corso dell'intervento verranno mostrate le motivazioni che hanno
portato a questa scelta.
Oltre ad una rapida panoramica volta ad illustrare le funzionalita`
di Riak si intende condividere in modo pratico il know-how acquisito
ripercorrendo le problematiche riscontrate durante il setup, la
configurazione e la gestione di un cluster Riak (ambienti di
sviluppo e produzione, ottimizzazioni, deploy del cluster, backup,
disaster recovery, ...).
Back to Basics, webinar 6: Messa in esercizioMongoDB
Questo è l'ultimo webinar della serie Back to Basics
che ti offrirà un'introduzione al database MongoDB. Questo webinar ti guiderà attraverso tutti i passaggi per l'implementazione della produzione.
NTFS è uno dei file system più diffusi, essendo quello usato di default dai sistemi Windows e anche negli hard disk esterni ad alta capacità. Quando accade un danno hardware o software, può verificarsi la corruzione di una o più partizioni, che diventano illeggibili.
In questo talk viene presentato l'uso di RecuperaBit, software sviluppato dal relatore per la ricostruzione forense di NTFS e il recupero dei dati, anche con metadati parzialmente danneggiati.
Slide dell'evento One Day Cache (http://www.xedotnet.org/eventi/one-day-performance-optimization/)
ABSTRACT: Cache, amica e nemica di molti dev.
Uno dei modi per incrementare le performance di un'applicativo è l'utilizzo della cache, ma non è tutto oro quel che luccica.
In questa sessione vedremo quali tipologie di cache esistono, ed il come poterle utilizzare al meglio. Output cache, cache applicativa, Redis, Memcached...cerchiamo di fare un pò di chiarezza e capiamo i pro e contro delle varie soluzioni.
1. EMC 2 Data Domain L’evoluzione del backup Danilo Chiavari Project Engineer [email_address]
2.
3.
4.
5.
6.
7. Architettura di base WAN REPLICA CIFS, NFS, NDMP e OpenStorage Virtual Tape Library (VTL) Primary Backup Disaster Recovery Integrazione immediata con l’infrastruttura di backup Applicazioni di backup e archiviazione ETHERNET FIBRE CHANNEL Drastico incremento della capacità di retention Massima sicurezza dei dati: Data Invulnerability Architecture Replica via WAN estremamente snella ed efficiente 1 2 3 4
8. La deduplicazione all’opera H I J Dati Capacità logica Riduzione Capacità fisica di backup stimata Backup incrementale, lunedì 100 GB 7 – 10x 10 GB Backup incrementale, martedì 100 GB 7 – 10x 10 GB K L Backup incrementale, mercoledì 100 GB 7 – 10x 10 GB Backup incrementale, giovedì 100 GB 7 – 10x 10 GB Secondo BACKUP COMPLETO, VENERDÌ 1 TB 50 – 60x 18 GB TOTALE 2,4 TB 7,8x 308 GB BACKUP COMPLETO, VENERDÌ 1 TB 2 – 4x 250 GB Secondo backup completo, venerdì B C D E F L G H A B C D E F G Backup completo, venerdì A B C D A E F G Backup incrementale, lunedì A B H Backup incrementale, martedì C B I Backup incrementale, giovedì A C K Backup incrementale, mercoledì E G J
9. Vantaggi maggiori a lungo termine Settimana 1 Dati Capacità logica Riduzione Capacità fisica di backup cumulativa prevista 14 aprile 3,8 TB 10x 366 GB 21 aprile 5,2 TB 12x 424 GB 28 aprile 6,6 TB 14x 482 GB 31 maggio 12,2 TB 17x 714 GB 30 giugno 17,8 TB 19x 946 GB TOTALE 23,4 TB 20x 1.178 GB 07 aprile 2,4 TB 8x 308 GB Settimana 2 Settimana 3 Mese 1 Mese 2 Mese 3 Mese 4 31 luglio 23,4 TB 20x 1.178 GB Primo backup completo 1 TB 4x 250 GB
10.
11.
12. La famiglia Data Domain DD140 DD610 DD630 DD660 DD690 DD880 Global Deduplication Array (GDA) Array DDX Velocità 450 GB/h 675 GB/h 1,1 TB/h 2,0 TB/h 2,7 TB/h 5,4 TB/h 12,8 TB/h 86,4 TB/h Capacità logica 17 – 43 TB 75 – 195 TB 165 – 420 TB 0,5 – 1,3 PB 0,710 – 1,7 PB 2,8 – 7,1 PB 5,7 – 14,2 PB 45,6 – 114 PB Capacità totale 1,5 TB Fino a 6 TB Fino a 12 TB Fino a 36 TB Fino a 48 TB Fino a 192 TB Fino a 384 TB Fino a 3,07 PB Capacità utilizzabile 0,86 TB Fino a 3,98 TB Fino a 8,4 TB Fino a 26,1 TB Fino a 35,3 TB Fino a 142,5 TB Fino a 285 TB Fino a 2,28 PB Serie array DDX Opzioni software: - Virtual Tape Library (VTL) - Replicator - Retention Lock (WORM) - Encryption Fino a 16 controller Appliance DD140 per uffici remoti DD600 Serie di appliance DD880 Global Deduplication Array (GDA)