ORGANIZZARE
IL PROPRIO
LAVORO

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL

ANALIZZARE

TAGS
Analizzare dati di speso o fa...
In questo tutorial viene affrontato il tema del controllo e validazione di un database in Excel
I dati utilizzati, di pura...
CAMPI DATABASE ORIGINALE: DESCRIZIONE E
VALORI
Nome del
campo

Mese

Sito
Sito
produttivo_
produttivo
descr

gen-12
feb-12...
IL DATABASE ORIGINALE: CARATTERISTICHE E STRUTTURA
Mese

Il database originale è
costituito da 5.108
righe ed ogni riga
co...
A. LA PRIMA OSSERVAZIONE DEI DATI
Già dalla prima osservazione
può emergere la presenza di
imprecisioni.
In questo caso:
1...
B. LA VALIDAZIONE - INDIVIDUAZIONE DEI
VALORI NON VALIDI O MANCANTI
A questo punto possiamo procedere con la validazione d...
Questi sono i valori validi per ciascun campo. Se troviamo dei valori diversi da questi, dobbiamo
correggerli

Per il cont...
MACROCATEGORIA

A destra la tabella riportante le
categorie merceologiche
d’acquisto.

MACROCATEGORIA
E’ la categoria di l...
1

Per verificare l’esistenza dei
codici riportati in [C12],
possiamo inserire una
colonna nuova, che
chiameremo [C12_chec...
LA FUNZIONE SE – sintassi

LA FUNZIONE VAL.ERRORE
La funzione Val.errore serve ad identificare
gli errori (#N/D, #RIF, etc...
Per l’analisi delle corrispondenze incrociate, lo strumento migliore è senza dubbio la tabella pivot. Prima di
effettuare ...
2) Un’informazione derivata dalla
conoscenza della realtà analizzata è che gli
acquisti diretti non possono essere
investi...
C. LA VALIDAZIONE – CORREZIONE DEI VALORI
NON VALIDI E IMPUTAZIONE DI QUELLI MANCANTI
Per correggere i valori non validi e...
Analizziamo con le tecniche descritte, uno alla volta, i campi in cui abbiamo
riscontrato valori non validi.
SITO PRODUTTI...
C12
Bisogna correggere i valori per cui il check aveva dato come risultato “no”. Nella tabella seguente
vengono elencati i...
VALIDAZIONI INCROCIATE
Sfruttando la tabella pivot e l’identificatore andiamo a correggere tutte le incompatibilità riscon...
In conclusione, ripercorriamo gli step che abbiamo seguito in questa prima analisi e validazione dei
dati:


Osservazione...
Upcoming SlideShare
Loading in …5
×

Validare un database in Excel

1,092 views

Published on

Tutorial sull'analisi di dati in Excel, in particolare viene affrontata la tematica del controllo, validazione di un database e pulizia dei dati da imprecisioni ed errori di inserimento. I dati sono di natura finanziaria e riguardano gli acquisti effettuati da un'ipotetica azienda in un arco di tempo annuale.

Seguiranno altri due tutorial sulla preparazione dei dati e successiva creazione dei report di sintesi.


Per scaricare il file di esempio copia il link seguente e incollalo sulla barra di ricerca: http://tinyurl.com/p69nl8x

Per essere sempre aggiornato sugli ultimi caricamenti seguici su twitter, pinterest e google+ @suiteufficio o visita il sito www.suiteufficio.it
Se il video è sfocato, riavviare la riproduzione.

Published in: Self Improvement
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,092
On SlideShare
0
From Embeds
0
Number of Embeds
66
Actions
Shares
0
Downloads
25
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Validare un database in Excel

  1. 1. ORGANIZZARE IL PROPRIO LAVORO CONTROLLARE E VALIDARE UN DATABASE IN EXCEL ANALIZZARE TAGS Analizzare dati di speso o fatturato Formattare una tabella Controllare e validare un database Confrontare 2 tabelle Lavorare con i codici, incrociare informazioni provenienti da tabelle differenti Filtri, formattazione, trova-sostituisci funzione cerca vert, funzione if, funzione val.errore, blocchi, tabelle pivot, uso della tastiera
  2. 2. In questo tutorial viene affrontato il tema del controllo e validazione di un database in Excel I dati utilizzati, di pura invenzione, sono quelli relativi agli acquisti mensili effettuati da un’azienda manifatturiera X in un determinato anno. Supponiamo che l’azienda abbia 5 siti produttivi ed ipotizziamo che gli acquisti siano suddivisi in:     diretti - materie prime e confezionamento, confluiscono nel prodotto finito indiretti - tutto ciò che invece non vi confluisce, ma che è necessario per la sua produzione CapEx - investimenti, spesa per acquistare beni durevoli OpEx - spese operative di gestione e categorizzati rispetto alla tipologia di merce acquistata (macrocategoria e sottocategoria). I dati di speso sono indicati nella valuta in cui è effettuato l’acquisto. Supponiamo inoltre che il database sia stato scaricato da un gestionale e che presenti delle imprecisioni da correggere. L’obiettivo è ottenere un database pulito, il più possibile aderente alla situazione reale, e prepararlo per la successiva presentazione dei dati. Nel corso del tutorial si affronteranno i problemi che si possono incontrare nello svolgimento di questa tipologia di analisi e si mostrerà come è possibile superarli. La preparazione del database ai fini dell’analisi dati e la creazione di report e grafici di sintesi dei risultati verranno affrontate nei tutorial successivi. ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  3. 3. CAMPI DATABASE ORIGINALE: DESCRIZIONE E VALORI Nome del campo Mese Sito Sito produttivo_ produttivo descr gen-12 feb-12 IT2 Milano mar-12 FR1 Parigi apr-12 FR2 Londra 1 0 giu-12 lug-12 Sulla destra sono riportate le intestazioni delle colonne del database, come sono in partenza, e i valori consentiti ago-12 set-12 I valori assunti da C12 sono riportati nella slide n.8 Valuta Numero ordine Capex Codice a 4 cifre identificativo dell'ordine Flag che vale 1 nel caso in cui l'acquisto sia contabilizzato come un Capex, 0 se Opex ott-12 nov-12 Fornitore Fornitore_desc dic-12 codice a 3 cifre identificativo del fornitore ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Flag che vale 1 per acquisti effettuati con ordine d'acquisto, 0 se effettuati fuori ordine Lione UK1 Ordine/NO Codice a 3 cifre associato alla categoria di merce acquistata Le prime 2 cifre corrispondono alla macrocategoria, l'ultima alla sottocategoria Roma mag-12 Valori ammessi e/o descrizione IT1 C12 Nome del fornitore E' la valuta utilizzata per l'acquisto 1 0 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL Spend in valuta E' il valore monetario dell‘uscita espresso nella valuta della transazione
  4. 4. IL DATABASE ORIGINALE: CARATTERISTICHE E STRUTTURA Mese Il database originale è costituito da 5.108 righe ed ogni riga corrisponde ad una riga di ordine o voce di uscita, nel caso di acquisti fuori ordine. Le colonne sono quelle già descritte. Come procediamo per la validazione? ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE nov-12 apr-12 feb-12 mar-12 giu-12 set-12 ott-12 apr-12 apr-12 apr-12 mar-12 mag-12 gen-12 ott-12 mar-12 feb-12 feb-12 nov-12 gen-12 mar-12 mar-12 apr-12 nov-12 apr-12 set-12 nov-12 apr-12 apr-12 apr-12 nov-12 apr-12 Sito Sito produttivo_des produttivo cr UK1 Londra UK1 Londra FR2 Lione FR1 Parigi FR1 Parigi IT2 Milano UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra IT1 Roma FR2 Lione UK1 Londra UK1 Londra FR2 Lione FR2 Lione IT2 Milano IT1 Roma UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra Numero ordine 7083 5995 2709 2852 2903 5350 6719 5994 5994 5994 5990 4829 2787 6509 5990 2685 2685 5695 4547 5990 5990 5993 7084 5994 6338 7087 5994 6028 6028 6994 5993 Fornitor Fornitore_de e sc 1869 690 1950 1728 1654 399 1143 690 690 690 690 261 1827 999 690 1986 1986 579 237 690 690 690 1869 690 837 1911 690 696 696 1512 690 fornitore545 fornitore152 fornitore572 fornitore498 fornitore472 fornitore55 fornitore303 fornitore152 fornitore152 fornitore152 fornitore152 fornitore9 fornitore531 fornitore255 fornitore152 fornitore584 fornitore584 fornitore115 fornitore1 fornitore152 fornitore152 fornitore152 fornitore545 fornitore152 fornitore201 fornitore559 fornitore152 fornitore154 fornitore154 fornitore426 fornitore152 C12 103 021 # 102 102 011 # 021 021 021 021 010 101 120 021 # # 063 010 021 021 021 011 021 063 121 021 010 010 063 021 Capex 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 Ordine/ Valuta NO 01 1 00 00 00 1 11 1 1 1 1 1 00 01 1 00 00 1 1 1 1 1 01 1 1 01 1 1 1 01 1 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL CHF EUR USD EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR USD EUR EUR EUR CHF EUR EUR USD EUR EUR EUR EUR EUR Spend in valuta 1141791,99 891.104,46 806884 546327,83 536998,11 496.000,00 427316 396.781,20 396.781,20 396.781,20 380.198,21 370.400,00 355145,53 335237,76 305.707,61 295182,48 269690,44 249.875,06 236.744,15 230.590,56 230.078,01 215.510,40 208128,33 198.390,60 187.124,00 185176,95 183.143,92 177.972,00 177.972,00 171862,74 169.329,60
  5. 5. A. LA PRIMA OSSERVAZIONE DEI DATI Già dalla prima osservazione può emergere la presenza di imprecisioni. In questo caso: 1) disallineamento dei mesi 2) in C12 sono presenti dei codici non assegnati (#) 3) nella colonna Capex ci sono dei numeri memorizzati come valori (in Excel sono allineati automaticamente a destra) ed altri come testo (allineati a sinistra) 4) nel campo Spend in valuta in alcune righe c’è il separatore, in altre no Correggiamo le imprecisioni. (clic per video) ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Sito Sito produttivo produttivo _descr nov-12 UK1 Londra apr-12 UK1 Londra feb-12 FR2 Lione mar-12 FR1 Parigi giu-12 FR1 Parigi set-12 IT2 Milano ott-12 UK1 Londra apr-12 UK1 Londra apr-12 UK1 Londra 1) apr-12 UK1 Londra mar-12 UK1 Londra mag-12 IT1 Roma gen-12 FR2 Lione ott-12 UK1 Londra mar-12 UK1 Londra feb-12 FR2 Lione feb-12 FR2 Lione nov-12 IT2 Milano gen-12 IT1 Roma mar-12 UK1 Londra mar-12 UK1 Londra apr-12 UK1 Londra nov-12 UK1 Londra apr-12 UK1 Londra set-12 UK1 Londra nov-12 UK1 Londra apr-12 UK1 Londra apr-12 UK1 Londra apr-12 UK1 Londra nov-12 UK1 Londra apr-12 UK1 Londra Mese Numero ordine Fornitore Fornitore_desc 7083 5995 2709 2852 2903 5350 6719 5994 5994 5994 5990 4829 2787 6509 5990 2685 2685 5695 4547 5990 5990 5993 7084 5994 6338 7087 5994 6028 6028 6994 5993 1869 690 1950 1728 1654 399 1143 690 690 690 690 261 1827 999 690 1986 1986 579 237 690 690 690 1869 690 837 1911 690 696 696 1512 690 C12 fornitore545 103 fornitore152 021 3) Testo fornitore572 # fornitore498 102 fornitore472 102 3) Valore fornitore55 011 fornitore303 # fornitore152 021 fornitore152 021 fornitore152 021 fornitore152 021 fornitore9 010 fornitore531 101 fornitore255 2) 120 fornitore152 021 fornitore584 # fornitore584 # fornitore115 063 fornitore1 010 fornitore152 021 fornitore152 021 fornitore152 021 fornitore545 011 fornitore152 021 fornitore201 063 fornitore559 121 fornitore152 021 fornitore154 010 fornitore154 010 fornitore426 063 fornitore152 021 Capex 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 Ordine/ Valuta NO 01 1 00 00 00 1 11 1 1 1 1 1 00 01 1 00 00 1 1 1 1 1 01 1 1 01 1 1 1 01 1 4) CONTROLLARE E VALIDARE UN DATABASE IN EXCEL Spend in valuta CHF 1141791,99 EUR 891.104,46 USD 806884 EUR 546327,83 EUR 536998,11 Con separatore EUR 496.000,00 EUR 427316 EUR 396.781,20 EUR 396.781,20 EUR 396.781,20 4) EUR Senza 380.198,21 separatore EUR 370.400,00 EUR 355145,53 EUR 335237,76 EUR 305.707,61 EUR 295182,48 EUR 269690,44 EUR 249.875,06 USD 236.744,15 EUR 230.590,56 EUR 230.078,01 EUR 215.510,40 CHF 208128,33 EUR 198.390,60 EUR 187.124,00 USD 185176,95 EUR 183.143,92 EUR 177.972,00 EUR 177.972,00 EUR 171862,74 EUR 169.329,60
  6. 6. B. LA VALIDAZIONE - INDIVIDUAZIONE DEI VALORI NON VALIDI O MANCANTI A questo punto possiamo procedere con la validazione dei dati. Il primo passo consiste nell’ individuare delle REGOLE DI VALIDAZIONE. Per identificare le regole:  verifichiamo quali sono i valori validi per ciascun campo del database  analizziamo le corrispondenze incrociate, cioè i valori che possono (e che non possono) essere assunti contemporaneamente da 2 o più campi sulla stessa riga Un metodo che funziona è quello di costruire uno specchietto per i valori ammissibili e le corrispondenze incrociate, a cui far riferimento nella fase di identificazione e correzione degli errori. Spesso si ha già a disposizione queste informazioni. In questo caso utilizzeremo la codifica delle variabili e la tabella delle categorie merceologiche.  si può fare riferimento alle informazioni che derivano dalla conoscenza della realtà analizzata ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  7. 7. Questi sono i valori validi per ciascun campo. Se troviamo dei valori diversi da questi, dobbiamo correggerli Per il controllo, se i valori validi sono pochi (meno di 20/25), si possono utilizzare agevolmente i filtri. In questo caso sfrutteremo questa tecnica per la verifica di mese e sito produttivo. Se troviamo dei valori non validi o mancanti li evidenziamo. (clic per video) ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE I filtri servono ad ordinare e filtrare i dati di una colonna. Si attivano selezionando [ordina e filtra -> filtro] nella barra multifunzione home. Sono dinamici, nel senso che se filtriamo una colonna Excel automaticamente filtrerà tutte le colonne adiacenti (riconosciute dal programma come appartenenti alla stessa tabella) e se clicchiamo sulla freccina mostrerà nella tendina tutti i valori presenti nella colonna in ordine crescente (sia per numeri che per stringhe di testo). Se c’è un filtro attivo, il numero di riga sulla destra è blu. Per visualizzare tutte le righe della tabella quando c’è un filtro attivo ma senza rimuovere il filtro selezionare [cancella] nel menù Ordina e filtra CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  8. 8. MACROCATEGORIA A destra la tabella riportante le categorie merceologiche d’acquisto. MACROCATEGORIA E’ la categoria di livello superiore SOTTOCATEGORIA E’ sempre associata alla macrocategoria a cui appartiene C12 E’ il codice completo, costituito dall’unione di macrocategoria e sottocategoria Es. per “Materie prime” è C1 01 C2 1 C12 011 D/I Classificazione in acquisti diretti, indiretti o non applicabile Ordine/NO 1 per merci acquistate con ordine d’acquisto, 0 per Spend fuori ordine ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE C1 01 01 02 02 02 03 04 04 05 05 05 05 06 06 06 07 07 07 08 08 08 08 08 09 09 09 10 10 10 11 11 11 12 98 98 98 99 99 SOTTOCATEGORIA C1_descrizione Materiali Materiali Confezionamento Confezionamento Confezionamento Acquisti diretti non categorizzati Servizi generali Servizi generali Utilities Utilities Utilities Utilities Strumenti e parti di ricambio Strumenti e parti di ricambio Strumenti e parti di ricambio Trasporti Trasporti Trasporti Informatica, telecomunicazioni e cancelleria Informatica, telecomunicazioni e cancelleria Informatica, telecomunicazioni e cancelleria Informatica, telecomunicazioni e cancelleria Informatica, telecomunicazioni e cancelleria Marketing Marketing Marketing Consulenze e outsourcing Consulenze e outsourcing Consulenze e outsourcing Viaggi di lavoro Viaggi di lavoro Viaggi di lavoro Acquisti indiretti non categorizzati Spese finanziarie Spese finanziarie Spese finanziarie Dipendenti e spese per il sociale Dipendenti e spese per il sociale C2 1 2 1 2 3 0 1 2 1 2 3 4 1 2 3 1 2 3 1 2 3 4 5 1 2 3 1 2 3 1 2 3 0 1 2 3 1 2 C2_descrizione Materie prime Semilavorati Imballaggio primario Imballaggio secondario Etichette Acquisti diretti non categorizzati Servizi Manutenzione Energia elettrica Gas Acqua Altre tipologie di energia Strumenti Manutenzione Parti di ricambio Costi consegna prodotti Trasporti a mezzo corriere Altri costi di trasporto Hardware IT Software Reti Telecomunicazione Cancelleria Merchandising Pubblicità Sponsorizzazioni Consulenti Servizi in outsourcing Traduzioni Alloggio Trasporto Rimborsi spese Acquisti indiretti non categorizzati Interessi Servizi bancari Imposte e tasse Costo del personale Donazioni C12 011 012 021 022 023 030 041 042 051 052 053 054 061 062 063 071 072 073 081 082 083 084 085 091 092 093 101 102 103 111 112 113 120 981 982 983 991 992 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL D/I Diretti Diretti Diretti Diretti Diretti Diretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti N/A N/A N/A N/A N/A Ordine/NO 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0
  9. 9. 1 Per verificare l’esistenza dei codici riportati in [C12], possiamo inserire una colonna nuova, che chiameremo [C12_check] e ricercare i codici nella tabella delle categorie (foglio “categorie”). La funzione più adatta per effettuare quest’operazione è senza dubbio il cerca verticale combinato con le funzioni se e val.errore 2 IL CERCA VERTICALE Il cerca verticale serve a ricercare un valore all’interno di un elenco di valori. Per un dato valore X restituisce un valore Y di una colonna della tabella di origine appartenente alla stessa riga di X La sintassi 1 2 3 4 =CERCA.VERT(VALORE;TABELLA;INDICE;INTERVALLO) 1) Cella in cui è contenuto il valore da ricercare 2) Il posto dove bisogna ricercare il valore specificato in VALORE 3) Indica il numero di colonne dalla prima della TABELLA, in cui è contenuto il valore da restituire. II valore da ricercare deve essere collocato per forza nella prima colonna 4) E’ 0 se si vuole che cerchi il valore esatto, 1 se si consente di ricercare per approssimazioni Un esempio pratico Se ricerchiamo il valore 030 nella tabella categorie, e impostiamo il Cerca vert chiedendogli di resituirci la seconda colonna a partire da C12 (vedi freccia nella tabella categorie in alto), il risultato sarà “Diretti”. Indice: il valore è nella colonna F La formula sarà: IL VALORE RESTITUITO E’ la cella in cui è contenuto il valore da ricercare ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Il foglio + l’intervallo in cui c’è la tabella dove cercare il valore in G18 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  10. 10. LA FUNZIONE SE – sintassi LA FUNZIONE VAL.ERRORE La funzione Val.errore serve ad identificare gli errori (#N/D, #RIF, etc.) in un database. Per verificare l’esistenza dei codici riportati in [C12], possiamo inserire una colonna nuova, che chiameremo [C12_check] e ricercare i codici nella tabella delle categorie (foglio “categorie”). La funzione più adatta per effettuare quest’operazione è senza dubbio il cerca verticale combinato con le funzioni se e val.errore Sintassi Val.errore(cella) Da come risultato VERO se il valore contenuto nella cella è un errore, FALSO altrimenti. E’ molto utlizzata in abbinamento a funzioni di ricerca 1 2 3 SE(CONDIZIONE; SE_VERO; SE_FALSO) 1) E’ un test (ad esempio A1<1; A2=A3) 2) E’ l’istruzione che viene applicata se il test dà come risultato VERO (ad esempio A1+A2) 2) E’ l’azione da fare se il risultato è FALSO (es. A1-A2) USO DEI BLOCCHI I blocchi $ servono a bloccare i riferimenti di una formula per far sì che questi non cambino se trasciniamo la formula in altre celle del foglio di lavoro. Per il cerca.vert di solito viene bloccata la tabella dove viene ricercato il valore (come si vedrà nel video). Esempi di blocchi: (clic per video) Intervallo Come attivarlo $A$1:$B$5 Righe e colonne Selezioniamo nella formula A1:B5 e premiamo sulla tastiera F4 A$1:B$5 Solo righe Selezioniamo A1:B5 e premiamo 2 volte F4 $A1:$B5 ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Oggetto del blocco Solo colonne Selezioniamo A1:B5 e premiamo 3 volte F4 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  11. 11. Per l’analisi delle corrispondenze incrociate, lo strumento migliore è senza dubbio la tabella pivot. Prima di effettuare l’analisi occorre fare un ragionamento su quali sono nel caso specifico le corrispondenze da verificare, considerando anche le informazioni che provengono dalla conoscenza del fenomeno studiato. 1) Ci sono delle categorie per cui gli acquisti vengono effettuati fuori ordine (Ordine/NO=0). Controlliamo se nel database viene rispettata questa regola (clic per video) MACROCATEGORIA C1 06 07 07 07 08 08 11 12 98 98 98 99 99 SOTTOCATEGORIA C1_descrizione Strumenti e parti di ricambio Trasporti Trasporti Trasporti Informatica, telecomunicazioni e cancelleria Informatica, telecomunicazioni e cancelleria Viaggi di lavoro Acquisti indiretti non categorizzati Spese finanziarie Spese finanziarie Spese finanziarie Dipendenti e spese per il sociale Dipendenti e spese per il sociale C2 3 1 2 3 1 2 3 0 1 2 3 1 2 C2_descrizione Parti di ricambio Costi consegna prodotti Trasporti a mezzo corriere Altri costi di trasporto Hardware IT Software Rimborsi spese Acquisti indiretti non categorizzati Interessi Servizi bancari Imposte e tasse Costo del personale Donazioni C12 063 071 072 073 081 082 113 120 981 982 983 991 992 D/I Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti N/A N/A N/A N/A N/A La tabella pivot è una tabella dinamica in cui possiamo inserire i campi appartenenti al database di origine e creare tabelle di frequenza o semplicemente rappresentare un fenomeno a 2 dimensioni. E’ simile al filtro, con la differenza che qui possiamo lavorare incrociando due o più dimensioni contemporaneamente ed ottenere degli indici di sintesi - conteggio, somma, minimo, massimo, media. Si compila trascinando i campi (in elenco campi tabella pivot) che ci interessano nello spazio dedicato. Gli spazi sono: • filtro rapporto – per filtrare le informazioni da visualizzare in base al valore/valori di uno o più campi (come i filtri normali) • etichette di riga e colonna • Somma valori – per decidere il campo dei valori da sommare/contare/etc. (ad esempio possiamo sommare i valori dello Spend o contare il numero di fornitori) ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE CONTROLLARE E VALIDARE UN DATABASE IN EXCEL Ordine/NO 1 1 0 1 1 1 1 1 0 0 0 0 0
  12. 12. 2) Un’informazione derivata dalla conoscenza della realtà analizzata è che gli acquisti diretti non possono essere investimenti (Capex), per cui controlliamo che ai codici C12 diretti sia sempre associato Capex=0 Per effettuare il controllo utilizziamo la stessa procedura mostrata per il punto 1), selezionando questa volta i codici C12 classificati come “acquisti diretti” nella tabella categorie. Verifichiamo nella pivot che non ci siano codici classificati come Capex (Capex=1), se li troviamo li evidenziamo di rosso C12 011 012 021 022 023 030 ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Acquisti Diretti Indiretti Diretti Diretti Diretti Diretti Diretti Diretti CONTROLLARE E VALIDARE UN DATABASE IN EXCEL Ci sono 12 righe con codice 030 classificate come Capex
  13. 13. C. LA VALIDAZIONE – CORREZIONE DEI VALORI NON VALIDI E IMPUTAZIONE DI QUELLI MANCANTI Per correggere i valori non validi e imputare i valori mancanti si possono utilizzare diverse tecniche:  Se riconosciamo errori di digitazione troviamo il valore valido più vicino e li correggiamo di conseguenza  I valori che non rispettano le regole di corrispondenza incrociata (vedi la tabella categoria) possono essere corretti sulla base di queste  Se esistono dei valori generici, (es. 030 - acquisti diretti non categorizzati, 120 - acquisti indiretti non categorizzati) possono essere assegnati ai valori mancanti  I valori mancanti possono essere imputati guardando le righe con valori degli altri campi simili a quelli della riga in cui è contenuto il mancante  Anche in questo caso si può fare affidamento alla conoscenza diretta del fenomeno  Si può recuperare il documento originario (es. ordine d’acquisto, bolla di consegna, fattura, etc.), compatibilmente con la sua disponibilità, e verificare il valore direttamente alla fonte La scelta delle tecniche da utilizzare dipende dal tempo a disposizione, dalla presenza di regole di validazione e dall’importanza del dato da correggere. Si può anche utilizzare più tecniche insieme ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  14. 14. Analizziamo con le tecniche descritte, uno alla volta, i campi in cui abbiamo riscontrato valori non validi. SITO PRODUTTIVO Sito produttivo Filtriamo per colore rosso ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f FR21 FR21 FR21 FR21 FR21 FR21 FR21 FR21 FR21 FR21 FR21 Sito produttivo_descr Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Lione Lione Lione Lione Lione Lione Lione Lione Lione Lione Lione E’ evidente che i due valori non validi sono errori di digitazione. Possiamo correggerli con il TROVA SOSTITUISCI  IT2f si sostituisce con IT2  FR21 con FR2 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  15. 15. C12 Bisogna correggere i valori per cui il check aveva dato come risultato “no”. Nella tabella seguente vengono elencati i valori da correggere, la procedura scelta per la correzione e il valore valido di sostituzione Valore Metodo di correzione Valore valido 98 Errore di digitazione: cerchiamo il valore valido più vicino (nella stessa macrocategoria) 981 120 E’ un problema di formati in quanto il valore esiste. Possiamo ignorarlo. # Scegliamo una regola per i valori mancanti: li assegnamo alle categorie generiche di acquisti diretti ed indiretti (assegniamo i Capex agli indiretti e gli Opex ai diretti) 030 per gli Opex, 120 per i Capex 010 Errore di digitazione: cerchiamo il valore valido più vicino (nella stessa macrocategoria) 011 027 Errore di digitazione: cerchiamo il valore valido più vicino (nella stessa macrocategoria) 023 Nella ricerca del valore sostitutivo possiamo anche considerare la tipologia di merce venduta dal fornitore associato al valore errato, utilizzando la nostra conoscenza della realtà analizzata ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Se mentre procediamo con la correzione sostituiamo ai valori errati i valori consentiti e lasciamo la formula in check attiva, questa si aggiornerà contemporaneamente alla correzione. A correzione ultimata i “no” dovrebbero essere sostituiti completamente dagli “ok” CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  16. 16. VALIDAZIONI INCROCIATE Sfruttando la tabella pivot e l’identificatore andiamo a correggere tutte le incompatibilità riscontrate nella verifica incrociata, con la quale avevamo evidenziato:  i conteggi delle righe che avevano ORDINE/NO=1 con un codice C12 per cui era consentito solo il valore ORDINE/NO=0  i conteggi delle posizioni di ordine classificate negli acquisti diretti e con flag Capex=1 (un acquisto diretto non può essere un investimento!!) Per la sostituzione si possono utilizzare 2 metodi differenti: a) Se le righe conteggiate sono poche, le correggiamo utilizzando il comando “mostra dettagli” (doppio clic sul conteggio dei valori non validi ed modificando il valore direttamente nel database b) Se le righe sono più di 5 utilizziamo il comando “mostra dettagli” per la tabella pivot e facciamo la correzione con il cerca.vert Nel prossimo video verranno applicate entrambe le metodologie (metodo a per Capex, metodo b per ORDINE/NO) (clic per video) ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE L’inserimento di un campo chiave primaria (ID) è molto utile quando si lavora con i database. In particolare lo è per le azioni di ricerca e selezione, in quanto è identificatore univoco di ciascuna riga. Nel nostro esempio avere l’ID significa poter automatizzare con una formula (metodo b) la ricerca dei valori non validi nel database invece che farlo riga per riga (metodo a) CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  17. 17. In conclusione, ripercorriamo gli step che abbiamo seguito in questa prima analisi e validazione dei dati:  Osservazione del database e delle codifiche, se presenti  Formattazione del database per uniformare gli allineamenti e formati  Individuazione delle regole di validazione  Ricerca dei valori non validi  Correzione dei valori non validi e imputazione di quelli mancanti Le funzionalità di Excel che abbiamo utilizzato sono:  Filtri  Trova-sostituisci  Tabelle pivot (formattazione, mostra dettagli)  Funzioni se(), val.errore() e cerca,vert() Questo tutorial ha per oggetto dati relativi agli acquisti, ma le metodologie descritte hanno un ambito di applicazione più generale (vendite, fatturato, spedizioni, etc.) che prescinde dalla natura del dato. Nel prossimo tutorial il database verrà preparato per la creazione dei report di sintesi ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE CONTROLLARE E VALIDARE UN DATABASE IN EXCEL

×