Presentazione  Database VERTICA
Introduzione a Vertica COS’E’ VERTICA: E’ l’innovativo database DBMS che garantisce elevate performance  sull’analisi di grandi volumi di dati (unità di Terabyte) PERCHE’ VERTICA: E’ veloce, è semplice, e… costa poco!
Per chi è pensato La grande esperienza del nostro gruppo ci  ha portati ad individuare alcune aree critiche nei progetti dedicati ad aziende che hanno necessità di gestire  grandi volumi di dati  con  tempi di risposta  molto rapidi. Vertica nasce specificamente per soddisfare questo tipo di esigenze : Progetto a  basso impatto   sull’azienda Possibilità di analisi fino alla  singola riga  di dettaglio Ottenere rapidi  tempi di risposta  gestendo grandi volumi di dati Gestione di base dati delle dimensioni di  TeraByte
Posizionamento sul mercato Kx KDB Sybase IQ Teradata “ RAM” DBMSs Postgres/EnterpriseDB MySQL Oracle IBM DB2 Sybase ASE Greenplum(Postgres) Datallegro (Ingres) Netezza (Postgres) Microsoft SQLServer TCO (Costo di Possesso) Adatto allo scopo APPLICAZIONI TRANSAZIONALI ALTO BASSO APPLICAZIONI ANALITICHE
Caratteristiche Value Value TECNOLOGIA “ COLUMN-ORIENTED” RISPOSTE 10-100 VOLTE MAGGIORI ELEVATA COMPRESSIONE DATI NECESSITA DI POCO SPAZIO INSTALLABILE SU  HARDWARE LINUX GIA’ ESISTENTE IN AZIENDA PIATTAFORMA HARDWARE  A BASSO IMPATTO ECONOMICO CARICAMENTO DATI CONTINUO REPORT SEMPRE AGGIORNATI INTERFACCIA SQL STANDARD RAPIDA INTEGRAZIONE E IMPLEMENTAZIONE DESIGN DEL DATABASE SEMPLICE ED EFFICIENTE BASSO COSTO DI MANUTENZIONE
Architettura Nuvola  è l’ottimizzazione dell’ interfaccia per  Vertica , il database è comunque aperto all’interrogazione di altri strumenti di reportistica. Strumenti di Reporting Apps OLTP EDW Files Sistemi Sorgenti Extraction Transformation Loading ETL
Analisi comparativa TCO Comparazione Costo Totale di Possesso (TCO) VS principali Competitors espresso in % 100 0 60 40 20 80 TCO % Oracle NTS IBM Teradata
Alcune referenze di Vertica
1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 0000001 0000001 0000003 0000003 0000005 0000011 0000011 0000020 0000026 0000050 0000051 0000052 0000053 0000068 0000069 0000071 Data ID CLiente Trade  Run-length Encoding (Pochi Valori, ordinati) 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE’ E’ VELOCE  Perché usare Vertica
1/17/2007, 16 Data ID CLiente Trade  Run-length Encoding (Pochi Valori, ordinati) Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE’ E’ VELOCE ? 0000001 0 2 2 4 10 10 19 25 49 50 51 52 67 68 70 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 perchè  sfrutta algoritmi di compressione molto performanti perché  ogni dato viene letto  una sola volta per ogni occorrenza perché  i dati organizzati secondo colonne mantengono lo stesso formato Perché usare Vertica
Test: Dimensioni DB: 600GB 14 interrogazioni 1 tabella, 200 colonne Risultati di Vertica: Tempo di caricamento  3 volte più veloce Interrogazioni  214 volte più veloci Immagazzina 1.5 anni  nello stesso spazio in cui un normale sistema immagazzinerebbe 90 giorni di dati di vendita. L’Hardware costa meno della metà Sommario Benchmark Telecom Datawarehouse proprietario Caricamento 2.4 ore 8 ore Dimensione DB 56 GB 948 GB Tempi di risposta 8.7 secondi 30 minuti e 57.0 secondi Costi Hardware $20,000 $48,000 $$  ??
Analisi su Record di dettaglio telefonate Customer Benchmark Mobile Communications co 21TB di dettaglio telefonate Cluster di 5 nodi ognuno con: 2x4-core CPUs 8GB RAM 7x146 GB HDDs Risultati tempo medio query: 3m 41s tempo di caricamento: 58 ore DIMENSIONE DB: 21TB
Comparazione Vertica vs OLTP Comparazione: 1.5TB Record Dettaglio Telefonate Vertica : 3- node cluster vs. OLTP DBMS on 24-vie server + SAN Queries 60 volte più veloci Compressione migliorata di 4 volte 25 volte più veloce in fase di caricamento 470.000£ in meno di Hardware
Contatti Per ulteriori informazioni rivolgersi a:  Ing. Enrico Gasparoni  E-mail:  [email_address] Mobile: 348-8863011

Presentazione Nuvola Vertica Light

  • 1.
  • 2.
    Introduzione a VerticaCOS’E’ VERTICA: E’ l’innovativo database DBMS che garantisce elevate performance sull’analisi di grandi volumi di dati (unità di Terabyte) PERCHE’ VERTICA: E’ veloce, è semplice, e… costa poco!
  • 3.
    Per chi èpensato La grande esperienza del nostro gruppo ci ha portati ad individuare alcune aree critiche nei progetti dedicati ad aziende che hanno necessità di gestire grandi volumi di dati con tempi di risposta molto rapidi. Vertica nasce specificamente per soddisfare questo tipo di esigenze : Progetto a basso impatto sull’azienda Possibilità di analisi fino alla singola riga di dettaglio Ottenere rapidi tempi di risposta gestendo grandi volumi di dati Gestione di base dati delle dimensioni di TeraByte
  • 4.
    Posizionamento sul mercatoKx KDB Sybase IQ Teradata “ RAM” DBMSs Postgres/EnterpriseDB MySQL Oracle IBM DB2 Sybase ASE Greenplum(Postgres) Datallegro (Ingres) Netezza (Postgres) Microsoft SQLServer TCO (Costo di Possesso) Adatto allo scopo APPLICAZIONI TRANSAZIONALI ALTO BASSO APPLICAZIONI ANALITICHE
  • 5.
    Caratteristiche Value ValueTECNOLOGIA “ COLUMN-ORIENTED” RISPOSTE 10-100 VOLTE MAGGIORI ELEVATA COMPRESSIONE DATI NECESSITA DI POCO SPAZIO INSTALLABILE SU HARDWARE LINUX GIA’ ESISTENTE IN AZIENDA PIATTAFORMA HARDWARE A BASSO IMPATTO ECONOMICO CARICAMENTO DATI CONTINUO REPORT SEMPRE AGGIORNATI INTERFACCIA SQL STANDARD RAPIDA INTEGRAZIONE E IMPLEMENTAZIONE DESIGN DEL DATABASE SEMPLICE ED EFFICIENTE BASSO COSTO DI MANUTENZIONE
  • 6.
    Architettura Nuvola è l’ottimizzazione dell’ interfaccia per Vertica , il database è comunque aperto all’interrogazione di altri strumenti di reportistica. Strumenti di Reporting Apps OLTP EDW Files Sistemi Sorgenti Extraction Transformation Loading ETL
  • 7.
    Analisi comparativa TCOComparazione Costo Totale di Possesso (TCO) VS principali Competitors espresso in % 100 0 60 40 20 80 TCO % Oracle NTS IBM Teradata
  • 8.
  • 9.
    1/17/2007 1/17/2007 1/17/20071/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 0000001 0000001 0000003 0000003 0000005 0000011 0000011 0000020 0000026 0000050 0000051 0000052 0000053 0000068 0000069 0000071 Data ID CLiente Trade Run-length Encoding (Pochi Valori, ordinati) 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE’ E’ VELOCE Perché usare Vertica
  • 10.
    1/17/2007, 16 DataID CLiente Trade Run-length Encoding (Pochi Valori, ordinati) Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE’ E’ VELOCE ? 0000001 0 2 2 4 10 10 19 25 49 50 51 52 67 68 70 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 perchè sfrutta algoritmi di compressione molto performanti perché ogni dato viene letto una sola volta per ogni occorrenza perché i dati organizzati secondo colonne mantengono lo stesso formato Perché usare Vertica
  • 11.
    Test: Dimensioni DB:600GB 14 interrogazioni 1 tabella, 200 colonne Risultati di Vertica: Tempo di caricamento 3 volte più veloce Interrogazioni 214 volte più veloci Immagazzina 1.5 anni nello stesso spazio in cui un normale sistema immagazzinerebbe 90 giorni di dati di vendita. L’Hardware costa meno della metà Sommario Benchmark Telecom Datawarehouse proprietario Caricamento 2.4 ore 8 ore Dimensione DB 56 GB 948 GB Tempi di risposta 8.7 secondi 30 minuti e 57.0 secondi Costi Hardware $20,000 $48,000 $$ ??
  • 12.
    Analisi su Recorddi dettaglio telefonate Customer Benchmark Mobile Communications co 21TB di dettaglio telefonate Cluster di 5 nodi ognuno con: 2x4-core CPUs 8GB RAM 7x146 GB HDDs Risultati tempo medio query: 3m 41s tempo di caricamento: 58 ore DIMENSIONE DB: 21TB
  • 13.
    Comparazione Vertica vsOLTP Comparazione: 1.5TB Record Dettaglio Telefonate Vertica : 3- node cluster vs. OLTP DBMS on 24-vie server + SAN Queries 60 volte più veloci Compressione migliorata di 4 volte 25 volte più veloce in fase di caricamento 470.000£ in meno di Hardware
  • 14.
    Contatti Per ulterioriinformazioni rivolgersi a: Ing. Enrico Gasparoni E-mail: [email_address] Mobile: 348-8863011