SlideShare a Scribd company logo

Database Design

Davide Mauri
Davide Mauri
Davide MauriSenior Software Engineer at Microsoft

Come modellare correttamente un database? Cosa sono e come si usano - nella pratica - le regole di normalizzazione? Che tipo di scelte dobbiamo fare quando andiamo a creare una tabella? Che impatto hanno sulle performance? In questa sessione andremo a capire come modellare correttamente un database, affrontando il problema dal punto di vista del modello logico (dove le performance sono un problema trascurabili) e riportandolo quindi sul modello fisico (dove invece le performance sono il problema principale).

Database Design

1 of 36
Download to read offline
Template designed by
Database Design
Davide Mauri
dmauri@solidq.com
www.davidemauri.it
brought to you by
Works with SQL Server from 6.5, on BI from 2003
Specialized in Data Solution Architecture, Database Design,
Performance Tuning, BI
Microsoft SQL Server MVP
President of UGISS (Italian SQL Server UG)
Mentor @ SolidQ
Regular Speaker @ SQL Server events
Consulting & Training
Davide Mauri
3
The relational model is simply the application of logic to
database management.
[…] databases are collections of predicates and DBMS are
essentially logic inference engines.[…] logic is what
guarantees correctness of the information recorded in
databases, and the answers obtained from them (with
correctness defined as consistency—internal, and with the
business rules in effect).
Fabian Pascal
Mi serve la teoria?
4
Performance Pyramid (Development POV)
5
Un database modellato male memorizza comunque i dati!
Perché dovrei spendere soldi nella modellazione?
Gli effetti negativi si vedono (e si amplificano) con il passare del
tempo
Impossibilità di ricavare informazioni utili dai dati
Difficoltà nella scrittura delle applicazioni
• Un DB ha un periodo di vita che è ALMENO il triplo di quello di un’applicazione
Enormi difficoltà nella creazione di soluzioni di Reportistica e BI
Difficolta di integrazione
Modellare costa! Qual è il ROI?
6
Ad

Recommended

Set Based Thinking
Set Based ThinkingSet Based Thinking
Set Based ThinkingDavide Mauri
 
Indici - Come, Quando, Perchè
Indici - Come, Quando, PerchèIndici - Come, Quando, Perchè
Indici - Come, Quando, PerchèDavide Mauri
 
SQL Server 2016 Temporal Tables
SQL Server 2016 Temporal TablesSQL Server 2016 Temporal Tables
SQL Server 2016 Temporal TablesDavide Mauri
 
Data modelling for Power BI
Data modelling for Power BIData modelling for Power BI
Data modelling for Power BIMarco Pozzan
 
Modello er (2)
Modello er (2)Modello er (2)
Modello er (2)enzosa007
 

More Related Content

Similar to Database Design

SlideModellingDataSat.pdf
SlideModellingDataSat.pdfSlideModellingDataSat.pdf
SlideModellingDataSat.pdfMarco Pozzan
 
Access parte prima
Access parte primaAccess parte prima
Access parte primaMatekanc
 
Il database di WordPress: Dodici tabelle che servono per fare di tutto e di più.
Il database di WordPress: Dodici tabelle che servono per fare di tutto e di più.Il database di WordPress: Dodici tabelle che servono per fare di tutto e di più.
Il database di WordPress: Dodici tabelle che servono per fare di tutto e di più.Mauricio Gelves
 
ML.Net - Machine Learning Framework for .NET
ML.Net - Machine Learning Framework for .NETML.Net - Machine Learning Framework for .NET
ML.Net - Machine Learning Framework for .NETMarco Zamana
 
Entity Framework 4.0 vs NHibernate
Entity Framework 4.0 vs NHibernateEntity Framework 4.0 vs NHibernate
Entity Framework 4.0 vs NHibernateManuel Scapolan
 
Dynamic Schema e Schemaless Tables
Dynamic Schema e Schemaless TablesDynamic Schema e Schemaless Tables
Dynamic Schema e Schemaless TablesDavide Mauri
 
Power B: Cleaning data
Power B: Cleaning dataPower B: Cleaning data
Power B: Cleaning dataMarco Pozzan
 
Java Programming Language
Java Programming LanguageJava Programming Language
Java Programming LanguagePasquale Paola
 
Linked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoLinked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoCELI
 
(Ebook ita - inform - access) guida al database access (doc)
(Ebook   ita - inform - access) guida al database access (doc)(Ebook   ita - inform - access) guida al database access (doc)
(Ebook ita - inform - access) guida al database access (doc)UltraUploader
 
Lezione 1 - Introduzione al VBA per Excel
Lezione 1 - Introduzione al VBA per ExcelLezione 1 - Introduzione al VBA per Excel
Lezione 1 - Introduzione al VBA per ExcelGiovanni Della Lunga
 
FMEWT17 Workshop (Corrado)
FMEWT17 Workshop (Corrado)FMEWT17 Workshop (Corrado)
FMEWT17 Workshop (Corrado)gespsrl
 
No sql introduzione. Corso Sistemi Informativi Politecnico di Milano 12-11-2013
No sql introduzione. Corso Sistemi Informativi Politecnico di Milano 12-11-2013No sql introduzione. Corso Sistemi Informativi Politecnico di Milano 12-11-2013
No sql introduzione. Corso Sistemi Informativi Politecnico di Milano 12-11-2013Myti S.r.l.
 
Digital 1nn0vation saturday pn 2019 - ML.NET
Digital 1nn0vation saturday pn 2019 - ML.NETDigital 1nn0vation saturday pn 2019 - ML.NET
Digital 1nn0vation saturday pn 2019 - ML.NETMarco Zamana
 
Hosting: gli indici SQL, cosa sono e come funzionano #TipOfTheDay
Hosting: gli indici SQL, cosa sono e come funzionano  #TipOfTheDayHosting: gli indici SQL, cosa sono e come funzionano  #TipOfTheDay
Hosting: gli indici SQL, cosa sono e come funzionano #TipOfTheDayAruba S.p.A.
 

Similar to Database Design (20)

SlideModellingDataSat.pdf
SlideModellingDataSat.pdfSlideModellingDataSat.pdf
SlideModellingDataSat.pdf
 
Access parte prima
Access parte primaAccess parte prima
Access parte prima
 
Excel development e sql 2.1
Excel development e sql   2.1Excel development e sql   2.1
Excel development e sql 2.1
 
A ciascuno il suo: archi, frecce e interfacce per servizi editoriali B2B e B2...
A ciascuno il suo: archi, frecce e interfacce per servizi editoriali B2B e B2...A ciascuno il suo: archi, frecce e interfacce per servizi editoriali B2B e B2...
A ciascuno il suo: archi, frecce e interfacce per servizi editoriali B2B e B2...
 
Intro to JavaScript
Intro to JavaScriptIntro to JavaScript
Intro to JavaScript
 
Il database di WordPress: Dodici tabelle che servono per fare di tutto e di più.
Il database di WordPress: Dodici tabelle che servono per fare di tutto e di più.Il database di WordPress: Dodici tabelle che servono per fare di tutto e di più.
Il database di WordPress: Dodici tabelle che servono per fare di tutto e di più.
 
ML.Net - Machine Learning Framework for .NET
ML.Net - Machine Learning Framework for .NETML.Net - Machine Learning Framework for .NET
ML.Net - Machine Learning Framework for .NET
 
Entity Framework 4.0 vs NHibernate
Entity Framework 4.0 vs NHibernateEntity Framework 4.0 vs NHibernate
Entity Framework 4.0 vs NHibernate
 
Dynamic Schema e Schemaless Tables
Dynamic Schema e Schemaless TablesDynamic Schema e Schemaless Tables
Dynamic Schema e Schemaless Tables
 
Power B: Cleaning data
Power B: Cleaning dataPower B: Cleaning data
Power B: Cleaning data
 
Java Programming Language
Java Programming LanguageJava Programming Language
Java Programming Language
 
Linked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoLinked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di Tomaso
 
(Ebook ita - inform - access) guida al database access (doc)
(Ebook   ita - inform - access) guida al database access (doc)(Ebook   ita - inform - access) guida al database access (doc)
(Ebook ita - inform - access) guida al database access (doc)
 
Database Entity
Database EntityDatabase Entity
Database Entity
 
Lezione 1
Lezione 1Lezione 1
Lezione 1
 
Lezione 1 - Introduzione al VBA per Excel
Lezione 1 - Introduzione al VBA per ExcelLezione 1 - Introduzione al VBA per Excel
Lezione 1 - Introduzione al VBA per Excel
 
FMEWT17 Workshop (Corrado)
FMEWT17 Workshop (Corrado)FMEWT17 Workshop (Corrado)
FMEWT17 Workshop (Corrado)
 
No sql introduzione. Corso Sistemi Informativi Politecnico di Milano 12-11-2013
No sql introduzione. Corso Sistemi Informativi Politecnico di Milano 12-11-2013No sql introduzione. Corso Sistemi Informativi Politecnico di Milano 12-11-2013
No sql introduzione. Corso Sistemi Informativi Politecnico di Milano 12-11-2013
 
Digital 1nn0vation saturday pn 2019 - ML.NET
Digital 1nn0vation saturday pn 2019 - ML.NETDigital 1nn0vation saturday pn 2019 - ML.NET
Digital 1nn0vation saturday pn 2019 - ML.NET
 
Hosting: gli indici SQL, cosa sono e come funzionano #TipOfTheDay
Hosting: gli indici SQL, cosa sono e come funzionano  #TipOfTheDayHosting: gli indici SQL, cosa sono e come funzionano  #TipOfTheDay
Hosting: gli indici SQL, cosa sono e come funzionano #TipOfTheDay
 

More from Davide Mauri

Azure serverless Full-Stack kickstart
Azure serverless Full-Stack kickstartAzure serverless Full-Stack kickstart
Azure serverless Full-Stack kickstartDavide Mauri
 
Agile Data Warehousing
Agile Data WarehousingAgile Data Warehousing
Agile Data WarehousingDavide Mauri
 
Dapper: the microORM that will change your life
Dapper: the microORM that will change your lifeDapper: the microORM that will change your life
Dapper: the microORM that will change your lifeDavide Mauri
 
When indexes are not enough
When indexes are not enoughWhen indexes are not enough
When indexes are not enoughDavide Mauri
 
Building a Real-Time IoT monitoring application with Azure
Building a Real-Time IoT monitoring application with AzureBuilding a Real-Time IoT monitoring application with Azure
Building a Real-Time IoT monitoring application with AzureDavide Mauri
 
SSIS Monitoring Deep Dive
SSIS Monitoring Deep DiveSSIS Monitoring Deep Dive
SSIS Monitoring Deep DiveDavide Mauri
 
Azure SQL & SQL Server 2016 JSON
Azure SQL & SQL Server 2016 JSONAzure SQL & SQL Server 2016 JSON
Azure SQL & SQL Server 2016 JSONDavide Mauri
 
SQL Server & SQL Azure Temporal Tables - V2
SQL Server & SQL Azure Temporal Tables - V2SQL Server & SQL Azure Temporal Tables - V2
SQL Server & SQL Azure Temporal Tables - V2Davide Mauri
 
SQL Server 2016 What's New For Developers
SQL Server 2016  What's New For DevelopersSQL Server 2016  What's New For Developers
SQL Server 2016 What's New For DevelopersDavide Mauri
 
Azure Stream Analytics
Azure Stream AnalyticsAzure Stream Analytics
Azure Stream AnalyticsDavide Mauri
 
Azure Machine Learning
Azure Machine LearningAzure Machine Learning
Azure Machine LearningDavide Mauri
 
Dashboarding with Microsoft: Datazen & Power BI
Dashboarding with Microsoft: Datazen & Power BIDashboarding with Microsoft: Datazen & Power BI
Dashboarding with Microsoft: Datazen & Power BIDavide Mauri
 
Azure ML: from basic to integration with custom applications
Azure ML: from basic to integration with custom applicationsAzure ML: from basic to integration with custom applications
Azure ML: from basic to integration with custom applicationsDavide Mauri
 
Event Hub & Azure Stream Analytics
Event Hub & Azure Stream AnalyticsEvent Hub & Azure Stream Analytics
Event Hub & Azure Stream AnalyticsDavide Mauri
 
SQL Server 2016 JSON
SQL Server 2016 JSONSQL Server 2016 JSON
SQL Server 2016 JSONDavide Mauri
 
SSIS Monitoring Deep Dive
SSIS Monitoring Deep DiveSSIS Monitoring Deep Dive
SSIS Monitoring Deep DiveDavide Mauri
 
Real Time Power BI
Real Time Power BIReal Time Power BI
Real Time Power BIDavide Mauri
 
AzureML - Creating and Using Machine Learning Solutions (Italian)
AzureML - Creating and Using Machine Learning Solutions (Italian)AzureML - Creating and Using Machine Learning Solutions (Italian)
AzureML - Creating and Using Machine Learning Solutions (Italian)Davide Mauri
 
Datarace: IoT e Big Data (Italian)
Datarace: IoT e Big Data (Italian)Datarace: IoT e Big Data (Italian)
Datarace: IoT e Big Data (Italian)Davide Mauri
 
Azure Machine Learning (Italian)
Azure Machine Learning (Italian)Azure Machine Learning (Italian)
Azure Machine Learning (Italian)Davide Mauri
 

More from Davide Mauri (20)

Azure serverless Full-Stack kickstart
Azure serverless Full-Stack kickstartAzure serverless Full-Stack kickstart
Azure serverless Full-Stack kickstart
 
Agile Data Warehousing
Agile Data WarehousingAgile Data Warehousing
Agile Data Warehousing
 
Dapper: the microORM that will change your life
Dapper: the microORM that will change your lifeDapper: the microORM that will change your life
Dapper: the microORM that will change your life
 
When indexes are not enough
When indexes are not enoughWhen indexes are not enough
When indexes are not enough
 
Building a Real-Time IoT monitoring application with Azure
Building a Real-Time IoT monitoring application with AzureBuilding a Real-Time IoT monitoring application with Azure
Building a Real-Time IoT monitoring application with Azure
 
SSIS Monitoring Deep Dive
SSIS Monitoring Deep DiveSSIS Monitoring Deep Dive
SSIS Monitoring Deep Dive
 
Azure SQL & SQL Server 2016 JSON
Azure SQL & SQL Server 2016 JSONAzure SQL & SQL Server 2016 JSON
Azure SQL & SQL Server 2016 JSON
 
SQL Server & SQL Azure Temporal Tables - V2
SQL Server & SQL Azure Temporal Tables - V2SQL Server & SQL Azure Temporal Tables - V2
SQL Server & SQL Azure Temporal Tables - V2
 
SQL Server 2016 What's New For Developers
SQL Server 2016  What's New For DevelopersSQL Server 2016  What's New For Developers
SQL Server 2016 What's New For Developers
 
Azure Stream Analytics
Azure Stream AnalyticsAzure Stream Analytics
Azure Stream Analytics
 
Azure Machine Learning
Azure Machine LearningAzure Machine Learning
Azure Machine Learning
 
Dashboarding with Microsoft: Datazen & Power BI
Dashboarding with Microsoft: Datazen & Power BIDashboarding with Microsoft: Datazen & Power BI
Dashboarding with Microsoft: Datazen & Power BI
 
Azure ML: from basic to integration with custom applications
Azure ML: from basic to integration with custom applicationsAzure ML: from basic to integration with custom applications
Azure ML: from basic to integration with custom applications
 
Event Hub & Azure Stream Analytics
Event Hub & Azure Stream AnalyticsEvent Hub & Azure Stream Analytics
Event Hub & Azure Stream Analytics
 
SQL Server 2016 JSON
SQL Server 2016 JSONSQL Server 2016 JSON
SQL Server 2016 JSON
 
SSIS Monitoring Deep Dive
SSIS Monitoring Deep DiveSSIS Monitoring Deep Dive
SSIS Monitoring Deep Dive
 
Real Time Power BI
Real Time Power BIReal Time Power BI
Real Time Power BI
 
AzureML - Creating and Using Machine Learning Solutions (Italian)
AzureML - Creating and Using Machine Learning Solutions (Italian)AzureML - Creating and Using Machine Learning Solutions (Italian)
AzureML - Creating and Using Machine Learning Solutions (Italian)
 
Datarace: IoT e Big Data (Italian)
Datarace: IoT e Big Data (Italian)Datarace: IoT e Big Data (Italian)
Datarace: IoT e Big Data (Italian)
 
Azure Machine Learning (Italian)
Azure Machine Learning (Italian)Azure Machine Learning (Italian)
Azure Machine Learning (Italian)
 

Database Design

  • 1. Template designed by Database Design Davide Mauri dmauri@solidq.com www.davidemauri.it
  • 3. Works with SQL Server from 6.5, on BI from 2003 Specialized in Data Solution Architecture, Database Design, Performance Tuning, BI Microsoft SQL Server MVP President of UGISS (Italian SQL Server UG) Mentor @ SolidQ Regular Speaker @ SQL Server events Consulting & Training Davide Mauri 3
  • 4. The relational model is simply the application of logic to database management. […] databases are collections of predicates and DBMS are essentially logic inference engines.[…] logic is what guarantees correctness of the information recorded in databases, and the answers obtained from them (with correctness defined as consistency—internal, and with the business rules in effect). Fabian Pascal Mi serve la teoria? 4
  • 6. Un database modellato male memorizza comunque i dati! Perché dovrei spendere soldi nella modellazione? Gli effetti negativi si vedono (e si amplificano) con il passare del tempo Impossibilità di ricavare informazioni utili dai dati Difficoltà nella scrittura delle applicazioni • Un DB ha un periodo di vita che è ALMENO il triplo di quello di un’applicazione Enormi difficoltà nella creazione di soluzioni di Reportistica e BI Difficolta di integrazione Modellare costa! Qual è il ROI? 6
  • 7. Relazioni (relations) – Le tabelle Attributi – Le colonne Tuple – Le righe Le tuple, gli attributi non sono nè ordinati nè numerati. Non possono esistere tuple o attributi duplicati Le tabelle definiscono la struttura dell’entità che rappresentano I dati sono i valori “concreti” delle entità (le “instanze”) I dati sono le informazioni di business Overview informale del modello relazionale 7
  • 8. Ogni riga è identificabile tramite la sua primary key I dati sono mantenuti consistenti tramite constraints (vincoli) Attraverso i vincoli assicuriamo la correttezza dell’implementazione delle nostre regole di business Ogni tabella deve contenere informazioni su una ed una sola entità Le tabelle sono ―collegate‖ tra di loro tramite relazioni (relationships) Overview informale del modello relazionale 8
  • 9. Due tipi di relazioni Binary • 1:1 • 1:N • N:M N-ary  • Coinvolgono più di due tabelle (entita) (Es: Speaker, Sessione, Sala, Orario) Le relazioni si ―creano‖ tramite (primary) key / foreign key Le forme normali aiutano ad arrivare ad un design corretto Overview informale del modello relazionale 9
  • 10. Il modello relazione E’ ―AGILE― Un DB modellato correttamente è in grado di rispondere velocemente ai cambiamenti • Es. Memorizzare dati MAI previsti in precedenza Codd rule #10: Integrity indipendence I database SONO LOSELY COUPLED con le applicazioni che li usano Codd rule #8: Physical data indipendence Codd rule #9: Logical data indipendence Precisazioni sul modello relazionale 10
  • 11. Un database è un motore di inferenza logica La logica è basata sul concetto di predicato Un predicato è una frase generica Es: “Il libro ‘Abissi d’Acciaio’ di Isaac Asimov, codice ISBN 12345, è stato preso in prestito da Davide Mauri in data 13 Aprile 2013 La generalizzazione di questa frase (PROPOSIZIONE) è “il libro <nomelibro> dell’autore <autore>, codice <codicelibro> è stato preso in prestito da <nomeutente> in data <dataprestito> La versione generica prende il nome di PREDICATO La Normalizzazione 11
  • 12. Definito e fissato un predicato posso memorizzare solo i valori: {Abissi d’Acciaio, Isaac Asimov, 12345, Davide Mauri, 13 Aprile 2013} • Rappresenta la PROPOSIZIONE definita in precedenza Quindi Una tabella, tramite la sua struttura, definisce il predicato Le righe di ogni tabella sono le “entità” i cui valori definiscono una proposizione Ogni riga in ogni tabella rappresenta un “fatto vero” • Ossia una Proposizione Vera La Normalizzazione 12
  • 13. Esiste un modo per capire se le tabelle che abbiamo creato sono ―corrette‖? Esiste un processo che ci permette di capire se dobbiamo creare altre tabelle? Esite una modo per validare ―formalmente‖ il lavoro che ho fatto? La risposta è ―La Normalizzazione‖  La Normalizzazione 13
  • 14. Supponiamo di dover implementare un’applicazione (e quindi un DB) che permetta la gestione di una semplice biblioteca Via alle idee! Quali entità creiamo? Perché? Interaction Time!  14
  • 15. Lo scopo comune è stato quello di Minimizzare la dimensione delle tabelle Fare una tabella per ogni entità Tutte le scelte sono state basate su ―sensazioni‖ Quindi esperienza Abbiamo appena dimostrato che la normalizzazione ci aiuta a formalizzare un processo mentale che GIA METTIAMO IN ATTO per una buona parte Esistono delle regole che permettono di far si che il processo sperimentato non sia SOLAMENTE basato sull’esperienza e le ―sensazioni‖ La Normalizzazione 15
  • 16. E’ un processo di ―nonloss decomposition‖ Permette di arrivare ad avere ―one-fact-per-table‖ Ossia: ci permette di decomporre il nostro data model in oggetti piccoli (quindi di facile manipolazione) assicurandoci che su richiesta potremo ricomporre la tabella originale, senza perdita di dati Riduzione delle problematiche legate a “update anomalies” Riduzione dei vincoli da dover imporre a posteriori per poter essicurare la veridicità delle nostre proposizioni La Normalizzazione 16
  • 17. Partiamo da ZERO, semplicemente mappando i placeholder del nostro predicato in una tabella La Normalizzazione ―Live‖  17
  • 18. Una tabella è in 1° FN se: Gli attributi di ogni entità hanno valori atomici Tutte le righe anno lo stesso numero di valori Non esistono righe duplicate “Gli attributi di ogni entità hanno valori atomici” Non dobbiamo inserire dati “multivalue” Es. dati separati da virgola “Tutte le righe anno lo stesso numero di valori” NON C’E’ POSTO PER I NULL Introducono una 3-Value Logic che NON E’ APPLICABILE NEL MODO REALE Prima forma normale 18
  • 19. ―Non esistono righe duplicate‖ Tutte le tabelle hanno una Primary Key • NON BASTA METTERE UN “ID”…dobbiamo ragionare a livello logico prima di tutto! Prima forma normale 19
  • 20. Candidate key: Una colonna o una serie di colonne che permettono l’identificazione univoca di una riga Ce ne possono essere più di una per tabella Primary key: Una particolare Candidate Key che è • Stabile • Minimale Keys: Candidate & Primary 20
  • 21. Ecco come si presenta la nostra tabella in 1FN: Prima forma normale 21
  • 22. Che problemi ci evita la 1FN? Abbassa la difficolta della scrittura della query Permette all’optimizer di un RDBMS di lavorare bene • A volte di lavorare in assoluto  Evita spiacevoli “update anomalies” • Aggiornamento parziale di dati Prima forma normale 22
  • 23. Che problemi ci sono ancora? Non posso rimuovere un utente dal mio database SENZA dover rimuovere anche l'informazione che il libro è stato preso in prestito Se voglio modificare il nome di un Autore devo aggiornare TUTTE le righe che interessano quell’autore Non posso tenere traccia dei libri a meno che non siano stati presi in prestito Non posso avere libri scritti da più autori • E non posso risolvere questo problema semplicemente aggiungendo “Autore2” perché altrimenti tornerei a violare la 1FN… Prima forma normale 23
  • 24. Tra due attributi X e Y esiste una dipendenza funzionale se Per ogni valore di X esiste uno ed un solo valore di Y • Non si applica il contrario Quindi Y ha una dipendenza funzionale da X X determina Y Es: Codice Fiscale e Nome Per per ogni valore del CF è associato uno ed un solo valore del Nome utente, mentre per uno stesso nome utente ci possono essere CF diversi Dipendenze Funzionali 24
  • 25. Una tabella è in 2FN se E’ in 1FN Tutti gli attributi descrivono un realtà legata alla chiave Più formalmente E’ in 1FN Ogni attributo non chiave dipende funzionalmente dalla chiave completa (e quindi non solo da un parte di essa, nel caso di chiavi composte) Seconda forma normale 25
  • 27. Che problemi rimangono ancora aperti? Non posso modificare i dati di un autore senza andare a toccare tutte le righe in cui l’autore è presente nella tabella “Libri” • Ancora una volta questo significa che dobbiamo scrivere query più complesse • Ancora una volta questo rappresenta una potenziale incongruenza nei dati…cosa succede se ho due libri dello stesso autore e solo in un caso aggiorno i dati? Come posso poi sapere quale delle due righe è corretta? Un libro non può essere scritto da più autori Seconda forma normale 27
  • 28. Una tabella è 3FN se È in 2FN Non esistono attributi che descrivono una realtà della chiave in modo indiretto (ossia riferendosi ad un attributo intermedio) Più formalmente E’ in 2FN Ogni attributo non chiave dipende direttamente dalla chiave completa Terza forma normale 28
  • 30. Che problemi ci sono ancora? Non siamo riusciti a modellare la necessità di avere più autori per ogni libro Perché è un problema legato alla prima forma normale!  Proviamo ad immaginare di aggiungere IdAutore1, IdAutore2, ecc. Rifacciamo il processo di normalizzaione su questa nuova condizione • A questo punto per la prima forma normale creiamo una nuova tabella “AutoriLibri” Terza forma normale 30
  • 32. Rispetto alla situazione di partenza posso: Catalogare libri anche se nessuno li prende in prestito Far iscrivere gli utenti anche se non prendono in prestito libri Ricercare tutti i libri fatti da un autore in modo efficiente • E modificare i dati dell’autore solo in un punto Ricercare tutti i libri prelevati da un utente in modo efficiente • E modificare i dati dell’utente in un solo punto • E modificare i dati del libri in un solo punto Scrivere query in modo MOLTO più semplice ed ottimizzabile Che cosa ho ottenuto? 32
  • 33. Ed in più: Ho “scoperto” l’entità AutoriLibri • Posso ampliarla per sapere che tipo di contributo ha dato un autore al libro (ad esempio) Seguendo le regole di normalizzazione possiamo quindi avere DB molto flessibile che permettono un facile aggiornamento del db per seguire nuove regole di business In una parola: siamo AGILI! • Ricordiamoci però di non legare in modo indivisibile le nostre applicazioni al db…ossia: usiamo viste e sp per garantirci un livello di astrazione dal db fisico, oltre che una semplificazione per l’utente che usa il db Che cosa ho ottenuto? 33
  • 34. Conoscendo abbastanza bene il problema da modellare, avremmo potuto bypassare la normalizzazione fatta ―step- by-step‖ perché il buon senso ci avrebbe portato a creare un modello corretto Ma quando non conosciamo COSI BENE il tema? E quando il buon senso non basta? Conclusioni 34
  • 35. La normalizzazione è un processo ITERATIVO Basato sulla “creazione” di nuove entità Permette di creare entità che all’inizio non erano “visibili” nelle nostre proposizioni Permette di CAPIRE MEGLIO il processo che stiamo modellando Conclusioni 35
  • 36. Grazie a tutti per la partecipazione Riceverete il link per il download a slide e demo via email nei prossimi giorni Per contattarmi dmauri@solidq.com Grazie

Editor's Notes

  1. Rule 0: The system must qualify as relational, as a database, and as a management system.For a system to qualify as a relational database management system (RDBMS), that system must use its relational facilities (exclusively) to manage the database. Rule 1: The information rule:All information in the database to be represented in one and only one way, namely by values in column positions within rows of tables. Rule 2 : The guaranteed access rule:All data must be accessible with no ambiguity. This rule is essentially a restatement of the fundamental requirement for primary keys. It says that every individual scalar value in the database must be logically addressable by specifying the name of the containing table, the name of the containing column and the primary key value of the containing row. Rule 3:Systematic treatment of null values:The DBMS must allow each field to remain null (or empty). Specifically, it must support a representation of &quot;missing information and inapplicable information&quot; that is systematic, distinct from all regular values (for example, &quot;distinct from zero or any other number,&quot; in the case of numeric values), and independent of data type. It is also implied that such representations must be manipulated by the DBMS in a systematic way. Rule 4:Active online catalog based on the relational model:The system must support an online, inline, relational catalog that is accessible to authorized users by means of their regular query language. That is, users must be able to access the database&apos;s structure (catalog) using the same query language that they use to access the database&apos;s data. Rule 5: The comprehensive data sublanguage rule:The system must support at least one relational language that (a) Has a linear syntax (b) Can be used both interactively and within application programs, (c) Supports data definition operations (including view definitions), data manipulation operations (update as well as retrieval), security and integrity constraints, and transaction management operations (begin, commit, and rollback). Rule 6: The view updating rule:All views that are theoretically updatable must be updatable by the system. Rule 7:High-level insert, update, and delete:The system must support set-at-a-time insert, update, and delete operators. This means that data can be retrieved from a relational database in sets constructed of data from multiple rows and/or multiple tables. This rule states that insert, update, and delete operations should be supported for any retrievable set rather than just for a single row in a single table. Rule 8:Physical data independence:Changes to the physical level (how the data is stored, whether in arrays or linked lists etc.) must not require a change to an application based on the structure. Rule 9:Logical data independence:Changes to the logical level (tables, columns, rows, and so on) must not require a change to an application based on the structure. Logical data independence is more difficult to achieve than physical data independence. Rule 10:Integrity independence:Integrity constraints must be specified separately from application programs and stored in the catalog. It must be possible to change such constraints as and when appropriate without unnecessarily affecting existing applications. Rule 11:Distribution independence:The distribution of portions of the database to various locations should be invisible to users of the database. Existing applications should continue to operate successfully : (a) when a distributed version of the DBMS is first introduced; and (b) when existing distributed data are redistributed around the system. Rule 12: The nonsubversion rule:If the system provides a low-level (record-at-a-time) interface, then that interface cannot be used to subvert the system, for example, bypassing a relational security or integrity constraint. Retrieved from &quot;http://en.wikipedia.org/wiki/Codd%27s_12_rules&quot;