Normalización Usando Dependencias Funcionales - Segunda Forma Normal

184
-1

Published on

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
184
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Normalización Usando Dependencias Funcionales - Segunda Forma Normal

  1. 1. Definiciones PreviasDependencia Funcional (DF): Dada una relación R se dice que el atributoY de R es funcionalmente dependiente del atributo X de R, si y sólo si,cada valor X en R tiene asociado a él, precisamente, un valor de Y en R encualquier momento del tiempo.Dependencia funcional parcial: Se dice que existe una dependenciafuncional parcial entre dos atributos A y B de la tabla si:•B es funcionalmente dependiente de A, y•A es sólo parte de la clave de la tabla
  2. 2. Dependencia funcional completa: El atributo Y es funcionalmentedependiente y completamente del atributo X, si es funcionalmentedependiente de X y no es funcionalmente dependiente de algúnsubconjunto de X.Se representa:X--->YLlave: Si R es una relación con atributos A1, A2, ....An y X es unsubconjunto de A1, A2, ...An, X es una llave de R si: 1. X---> A1, A2, ...An osea, todos los atributos de la relación dependen funcionalmente de X. 2. ∃Y ⊂ X| Y → A1, A2, ...An
  3. 3. Segunda Forma NormalUna relación R se dice que está en 2FN si y sólo sí:• Está en 1FN• Los atributos no llaves (secundarios) de R, si los hubiese, son funcionaly completamente dependientes de la llave primaria de R, o sea no existadependencia parcial de los atributos secundarios respecto a la llave.Esta regla significa que en una relación sólo se debe almacenarinformación sobre un tipo de entidad, y se traduce en que los atributosque no aporten información directa sobre la clave principal debenalmacenarse en una relación separada.
  4. 4. Segunda Forma NormalLas tablas en la Primera Forma Normal suelen presentarcaracterísticas que tienden a dificultar su uso. Estascaracterísticas son reconocibles, y suelen eliminarsesometiendo a las tablas a una o más transformaciones.
  5. 5. Segunda Forma NormalConsidere la tabla siguiente, que contiene información que describe a ungrupo de estudiantes y sus clases, y que se encuentra en la PrimeraForma Normal:NOMBRE(Clave)ID-ESTUDlANTEPROMEDIO (Clave)ID-CLASECALIFICACIONHuertas, J. 01234 5.4 FIS-1A AFerrero, A. 22346 5.1 FIS-1A BSoriano, P. 11349 4.8 QUIM-2B AHuertas, J. 01234 5.4 QUIM-2B AClemente,C.08349 5.9 MUS-5 BPérez, R. 03472 5.1 ARTE-3A -Ferrero, A. 22346 5.1 QUIM-1A CHuertas, J. 01234 5.4 MUS-5 BVázquez, H. 33461 4.9 ARTE-3A -Pérez, R 03472 5.1 MUS1 -
  6. 6. Problemas que se visualizan en latabla:Existe gran cantidad de informaciónque está siendo almacenada deforma redundante.NOMBRE(Clave)ID-ESTUDlANTEPROMEDIOHuertas, J. 01234 5.4Ferrero, A. 22346 5.1Soriano, P. 11349 4.8Huertas, J. 01234 5.4Clemente,C.08349 5.9Pérez, R. 03472 5.1Ferrero, A. 22346 5.1Huertas, J. 01234 5.4Vázquez, H. 33461 4.9Pérez, R 03472 5.1Siempre que sea posible, deberían evitarse las duplicaciones de datos,por diversas razones:Espacio de almacenamiento de datos. La información duplicadarequiere un espacio extra de almacenamiento, habitualmente en losdispositivos de disco magnético.Redundancia deDatos
  7. 7. Costes de introducción de datos. Una gran parte de la información de labase de datos debe ser introducida de forma manual, por personalespecífico. La existencia de datos redundantes suele implicar un tiempode introducción de datos extra, que en el análisis final se traduce encostes adicionales.Inconsistencias de la base de datos. Si se introduce informaciónredundante, las posibilidades de inconsistencias aumentan de formaproporcional. Por ejemplo, el PROMEDIO de "Huertas, J." se introducetres veces en la tabla ESTUDIANTES-CLASES, con lo cual se triplica laprobabilidad de introducción de un valor incorrecto para este dato.
  8. 8. La presencia de redundancia de datos viene casi siempreacompañada de varias dificultades predecibles. Estos problemas,conocidos colectivamente bajo el nombre de anomalías demodificación, aparecen durante la actualización, borrado e inserciónde datos.Anomalías de Modificación
  9. 9. •Anomalías de actualización. La alteración de un único hecho, en este casola modificación del valor de un PROMEDIO, requiere la modificación devarias entradas de la tabla, proceso que consume gran cantidad de tiempoy es propenso a los errores. Este tipo de situaciones es lo que se conocecomo anomalías de actualización, y su existencia sugiere que el diseño dela tabla podría mejorarse.NOMBRE(Clave)ID-ESTUDlANTEPROMEDIOHuertas, J. 01234 5.4Ferrero, A. 22346 5.1Soriano, P. 11349 4.8Huertas, J. 01234 5.4Clemente,C.08349 5.9Pérez, R. 03472 5.1Ferrero, A. 22346 5.1Huertas, J. 01234 5.4Vázquez, H. 33461 4.9Pérez, R 03472 5.1
  10. 10. Anomalías de borrado. Supongamos que un estudiante que acaba dematricularse deja de asistir a todas sus clases. pero sin abandonar la escuela.Todas las filas de dicho estudiante habrán de ser borradas de la tablaESTUDIANTES-CLASES. Sin embargo, cuando se ha hecho esto, la informaciónbásica relativa a dicho estudiante, como el nombre y el número de ID, se hanperdido de la tabla. En otras palabras, en lo que concierne a la base de datos, elestudiante ha dejado de existir, incluso aunque de hecho todavía estématriculado en la escuela. La información de la base de datos no secorresponde ya con los hechos del mundo real, y decimos que ha ocurrido unaanomalía de borrado.NOMBRE(Clave)ID-ESTUDlANTEPROMEDIO (Clave)ID-CLASECALIFICACIONFerrero, A. 22346 5.1 FIS-1A BSoriano, P. 11349 4.8 QUIM-2B AClemente,C.08349 5.9 MUS-5 BPérez, R. 03472 5.1 ARTE-3A -Ferrero, A. 22346 5.1 QUIM-1A CVázquez, H. 33461 4.9 ARTE-3A -Pérez, R 03472 5.1 MUS1 -
  11. 11. Anomalías de inserciónSupongamos que un nuevo alumno se matricula en la escuela.Por diversas razones, no se matricula de inmediato en ningunaclase concreta.La tabla ESTUDIANTES-CLASES, cada fila de estudiante ,debería contener un valor para ID-CLASE.La fila del nuevo estudiante puede ser introducida con un valorespecial para ID-CLASE.El estudiante se matricule en algún curso concreto, esta filaoriginal pasará a ser un estorbo en la base de datos.Tendrá que ser eliminada.
  12. 12. La fuente de las anomalías demodificaciónLos diversos tipos de anomalías de modificación descritos no sonproblemas imposibles de abordar, pero pueden complicar de forma seriael uso eficiente de una base de datos. Sería preferible si las anomalíaspudieran ser eliminadas, y de hecho, esto puede hacerse, mediante elestudio de la fuente original de las dificultades.El comportamiento anómalo está relacionado directamente con lapresencia de la redundancia de datos: ambos problemas surgen de laforma en que está estructurada la tabla ESTUDIANTES-CLASES, y ambospueden ser eliminados mediante una transformación adecuada de latabla.
  13. 13. La fuente de las anomalías demodificación¿cuáles son los hechos básicos representados por la tablaESTUDIANTES-CLASES?La respuesta es sencillamente que cada fila de la tabla representa a unestudiante concreto matriculado en una clase específica. Existe, portanto, un segundo hecho independiente contenido en cada fila: la propiaexistencia del estudiante. Es decir, cada fila contiene información que esespecífica del estudiante, tal como el PROMEDIO, y estos datos sonindependientes de las clases representadas en cada fila. Este es elnúcleo del problema: cuando hay varias filas que corresponden a unestudiante determinado, los datos específicos del estudiante se repitenen cada una de ellas.
  14. 14. Dependencia funcional parcialLa existencia de una dependencia funcional parcial dentro de unatabla implica que dentro de la tabla también está representado unconjunto de hechos, además de los representados por la claveprimaria.De este modo, la búsqueda de dependencias parciales dentro de unatabla equivale a la búsqueda de conjuntos de hechos secundarios.
  15. 15. Eliminación de las dependenciasparciales.• La eliminación de las dependencias parciales de la tablaESTUDIANTES-CLASES eliminará a su vez los problemas de laredundancia y las anomalías.
  16. 16. • Esto se consigue descomponiendo estas dependencias en una tablaseparada, creándose así las siguientes nuevas tablas:• ESTUDIANTE [NOMBRE, ID-ESTUDIANTE, PROMEDIO]• ESTUDIANTE-CLASE [ID-ESTUDIANTE, ID-CLASE, CALIFICACION]
  17. 17. Examinando las dos nuevas tablasESTUDIANTE y ESTUDIANTE-CLASE
  18. 18. Anomalías• Anomalías de actualización: Si es necesario cambiar el valor delPROMEDIO de un estudiante determinado, sólo es preciso alterar elvalor de una única fila de la tabla ESTUDIANTE. Recuerde que en latabla original había que modificar gran número de entradas para cadaestudiante.• Anomalías de borrado: Si un estudiante abandona todas susasignaturas, pero sigue aún matriculado en la escuela, puede existir aúnuna entrada en la tabla ESTUDIANTE, incluso aunque no existanentradas para ese estudiante en ESTUDIANTE-CLASE.• Anomalías de inserción: También han desaparecido las posibilidadesque existían de anomalías de inserción: es posible crear una entrada enla tabla ESTUDIANTE para un estudiante nuevo que aún no se hayamatriculado en ninguna clase. A medida que el estudiante se vayamatriculando en cursos nuevos, se pueden ir creando entradas nuevasen la tabla ESTUDIANTE-CLASE.

×