Your SlideShare is downloading. ×
0
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Introduction aux bases de données
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Introduction aux bases de données

549

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
549
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
25
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Bases de données : Introduction et Objectifs
  • 2. 2 1. Introduction• Les entreprises gèrent des volumes de données très grands – Giga, Terra, Péta –octets – Numériques, Textuelles, Multi-média (images, films,...)• Il faut pouvoir facilement – Archiver les données sur mémoires secondaires permanente – Retrouver les données pertinentes à un traitement – Mettre à jour les données variant dans le temps• Les données sont structurées et identifiées – Données élémentaires ex: Votre salaire, Votre note en BD – Données composées ex: Votre CV, vos résultats de lannée – Identifiant humain ex: NSS ou machine: P26215• Quest-ce quune BD ? – Collection de données structurées reliées par des relations – Interrogeable et modifiable par des langages de haut niveau
  • 3. 3 La hiérarchie des mémoiresCapacité Mémoire vs terciaireCoût & • Un accès disque est environVitesse 100,000 fois plus lent qu’un accès mémoire!5-10 ms Mémoire • ⇒ secondaire – Eviter les accès disques • grande mémoire principale80-200 ns Mémoire principale – Amortir les accès disques (RAM) • placement des données – Minimiser le nombre d’accès disques3-10 ns Cache (SRAM) • méthodes d’accès2-5 ns Registres
  • 4. 4 Un peu dhistoire• Années 60: – Récipients logique de données  fichiers sur dique – Accès séquentiel puis sur clé • Lire (Nomf, Article), Ecrire (Nomf, Article) • Lire (Nomf, Article, Clé), Ecrire (Nomf, article, Clé)• Années 70: – Avènement des Bases de Données Réseaux (BD) – Ensemble de fichiers reliés par des pointeurs – Langage dinterrogation par navigation• Années 80: – Avènement des Bases de Données Relationnelles (BDR) – Relations entre ensemble de données – Langage dinterrogation par assertion logique
  • 5. Systèmes de fichiers Caractéristiques 5Comptabilité Chirurgie ProblèmesConsultations Psychiatrie
  • 6. Format des fichiers Caractéristiques 6 Plusieurs applications  plusieurs formats Dupont Dupond Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Problèmes  Difficultés de gestion Duhpon Duipont Turlututu : sq Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 7. Redondance (données) Caractéristiques 7 Plusieurs applications  plusieurs formats Dupont Dupond Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Problèmes  Difficultés de gestion  Incohérence des données Duhpon Duipont Turlututu : sq Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 8. Interrogations Caractéristiques 8 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoftConsultSoft Duhpon Duipont Turlututu : sq Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 9. Pannes ??? Caractéristiques 9 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Redondance de code Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoftConsultSoft Duhpon Duipont Turlututu : sq  Gestion de pannes ??? Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 10. Partage de données Caractéristiques 10 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Redondance de code Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoft ConsultSoft Duhpon Duipont Turlututu : sq  Gestion de pannes ??? Symptomes : yy Analyses : xxxx Symptomyyyy Analysesxxxx  Partage des données ??? Symptomes : yy Turlututudhjsd
  • 11. Confidentialité Caractéristiques 11 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Redondance de code Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoftConsultSoft Duhpon Duipont Turlututu : sq  Gestion de pannes ??? Symptomes : yy Analyses : xxxx Symptomyyyy Analysesxxxx  Partage des données ??? Symptomes : yy Turlututudhjsd  Confidentialité ???
  • 12. 12 L’approche ‘‘Bases de données’’• Modélisation des données  Eliminer la redondance de données  Centraliser et organiser correctement les données  Plusieurs niveaux de modélisation  Outils de conception• Logiciel «Système de Gestion de Bases de Données» Factorisation des modules de contrôle des applications - Interrogation, cohérence, partage, gestion de pannes, etc… Administration facilitées des données
  • 13. 13 Modélisation du réelRéel • Indépendant duModèle modèle de donnéesconceptuel • Indépendant du SGBD Médecin effectue Visite • Dépendant duModèle modèle de données Codasyl Relationnel Objet XMLlogique • Indépendant du SGBDModèle • Dépendant du modèle de données • Organisation physique des données • Structures de stockage des donnéesPhysique • Dépendant du SGBD • Structures accélératrices (index)
  • 14. 14 Modélisation Relationnelle (1) Champs, attributs,Relation ou table colonnes Id-D Nom Prénom 1 Dupont Pierre 2 Durand Paul 3 Masse Jean …. …….. …… Tuples, lignes ou n-uplets
  • 15. 15 Modélisation Relationnelle (2) Docteurs PrescriptionsId-D Nom Prénom Id-V Ligne Id-M Posologie 1 Dupont Pierre Visites 1 1 12 1 par jour 2 Durand Paul 1 2 5 10 gouttes Id-D Id-P Id-V Date Prix 3 Masse Jean 2 1 8 2 par jour 1 2 1 15 juin 250…. …….. …… 2 2 12 1 par jour 1 1 2 12 août 180 2 2 3 13 juillet 350 2 3 3 2 gouttes 2 3 4 1 mars 250 …. …. …. ………… PatientsId-P Nom Prénom Ville Médicaments 1 Lebeau Jacques Paris Id-M Nom Description 2 Troger Zoe Evry 1 Aspegic 1000 …………………………….. 3 Doe John Paris 2 Fluisédal …………………………….. 4 Perry Paule Valenton 3 Mucomyst …………………………….. …. ……. ……. ……. …. …….. ……………………………..
  • 16. 2. Objectifs des SGBD 16 I- Indépendance Physique X - Standards II- Indépendance LogiqueIX - Gestion de la III – Langage de confidentialité manipulationVIII - Concurrence BD IV - Gestion des d’accès vues VII - Gestion des V - Optimisation des pannes questions VI - Gestion de la cohérence
  • 17. 17 I - Indépendance Physique• Indépendance des programmes dapplications vis à vis du modèle physique : – Possibilité de modifier les structures de stockage (fichiers, index, chemins daccès, …) sans modifier les programmes; – Ecriture des applications par des non-spécialistes des fichiers et des structures de stockage; – Meilleure portabilité des applications et indépendance vis à vis du matériel.
  • 18. 18 II - Indépendance LogiqueLes applications peuvent définir des vues logiques de la BD Gestion des médicaments Cabinet du Dr. Masse Nombre_Médicaments Prescription Id - V Ligne Id - M Posologie Id-M Nom Description Nombre Visites 1 1 12 1 par jour Id - D Id - P Id - V Date Prix 1 2 5 10 gouttes 1 Aspegic 1000 …………………………….. 30 1 2 1 15 juin 250 …. …. …. ………… 2 3 4 1 mars 250 2 Fluisédal …………………………….. 20 Patients 3 Mucomyst …………………………….. 230 Id - P Nom Prénom Médicament 1 Lebeau Jacques Id - M Nom Description …. …….. …………………………….. ….. 2 Troger Zoe 1 Aspegic 1000 …………………………….. …. ……. ……. 2 Fluisédal …………………………….. 3 Mucomyst …………………………….. …. …….. ……………………………..
  • 19. 19Avantages de l’indépendance logique• Possibilité pour chaque application dignorer les besoins des autres (bien que partageant la même BD).• Possibilité dévolution de la base de données sans réécriture des applications : – ajout de champs, ajout de relation, renommage de champs.• Possibilité dintégrer des applications existantes sans modifier les autres.• Possibilité de limiter les conséquences du partage : Données confidentielles.
  • 20. 20 III - Manipulation aisée• La manipulation se fait via un langage déclaratif – La question déclare l’objectif sans décrire la méthode – Le langage suit une norme commune à tous les SGBD – SQL : Structured Query Langage• Sémantique – Logique du 1er ordre ++• Syntaxe (aperçu !) – SELECT <structure des résultats> – FROM <relations> – WHERE <conditions>
  • 21. 21IV – Des vues multiples des données• Les vues permettent d’implémenter l’indépendance logique en permettant de créer des relations virtuelles• Vue = Question stockée• Le SGBD stocke la définition et non le résultat• Exemple : – la vue des patients parisiens – la vue des docteurs avec leurs patients – La vue des services statistiques – ...
  • 22. 22 V –Exécution et Optimisation• Traduction automatique des questions déclaratives en programmes procéduraux :  Utilisation de l’algèbre relationnelle• Optimisation automatique des questions  Utilisation de l’aspect déclaratif de SQL  Gestion centralisée des chemins daccès (index, hachages, …)  Techniques d’optimisation poussées• Economie de lastuce des programmeurs – milliers dheures décriture et de maintenance de logiciels.
  • 23. 23 VI - Intégrité Logique• Objectif : Détecter les mises à jour erronées• Contrôle sur les données élémentaires – Contrôle de types: ex: Nom alphabétique – Contrôle de valeurs: ex: Salaire mensuel entre 5 et 50kf• Contrôle sur les relations entre les données – Relations entre données élémentaires: • Prix de vente > Prix dachat – Relations entre objets: • Un électeur doit être inscrit sur une seule liste électorale
  • 24. 24 Contraintes d’intégrité• Avantages : – simplification du code des applications – sécurité renforcée par lautomatisation – mise en commun des contraintes• Nécessite : – un langage de définition de contraintes dintégrité – la vérification automatique de ces contraintes
  • 25. 25 VII - Intégrité Physique• Motivations : Tolérance aux fautes – Transaction Failure : Contraintes dintégrité, Annulation – System Failure : Panne de courant, Crash serveur ... – Media Failure : Perte du disque – Communication Failure : Défaillance du réseau• Objectifs : – Assurer latomicité des transactions – Garantir la durabilité des effets des transactions commises• Moyens : – Journalisation : Mémorisation des états successifs des données – Mécanismes de reprise
  • 26. 26 Transaction Incohérence possible... Etat cohérent Etat cohérentBegin Commit Transaction Begin CEpargne = CEpargne - 3000 CCourant = CCourant + 3000 Commit T1
  • 27. 27 Atomicité et Durabilité ATOMICITE DURABILITE PanneBegin Begin CEpargne = CEpargne - 3000 CEpargne = CEpargne - 3000 CCourant = CCourant + 3000 CCourant = CCourant + 3000Commit T1 Commit T1 Crash disque Annuler le débit !!  S’assurer que le virement a été fait !
  • 28. 28 VIII - Partage des données BD• Accès concurrent aux mêmes donnéesConflits d’accès !!
  • 29. 29 Isolation et Cohérence BD• Le SGBD gère les accès concurrents Chacun à l’impression d’être seul (Isolation) Cohérence conservée (Pas de maj conflictuelles)
  • 30. 30 IX – Confidentialité• Objectif : Protéger les données de la BD contre des accès non autorisés• Deux niveaux : – Connexion restreinte aux usagers répertoriés (mot de passe) – Privilèges daccès aux objets de la base• Usagers : Usager ou groupe d’usagers• Objets : Relation, Vue, autres objets (procédures, etc.)
  • 31. 31 X - Standardisation• L’approche bases de données est basée sur plusieurs standards – Langage SQL (SQL1, SQL2, SQL3) – Communication SQL CLI (ODBC / JDBC) – Transactions (X/Open DTP, OSI-TP)• Force des standards – Portabilité – Interopérabilté – Applications multisources…
  • 32. 3. Architecture des SGBD sont très liées au mode deLes architectures physiques de SGBDrépartition.— BD centralisée— BD client/serveur— BD client/multi-serveurs— BD répartie— BD hétérogène— BD mobileLe challenge se déplace des Péta-bases aux Pico-bases.— Péta-bases => parallélisme et grandes mémoires— Pico-bases => faible empreinte et forte sécurité
  • 33. 33Architecture centralisée Terminaux passifs réseau MainframeAppli 1 Appli 2 Appli n SGBD données
  • 34. Architecture client- serveur Clients intelligentsAppli 1 Appli 2 Appli n réseau serveur SGBD code données
  • 35. 35 Architecture Client- Multiserveurs Appli 1 SQL SQL ODBC ODBC SQL SQL SGBD 1 SGBD 2code données code données
  • 36. Architecture répartie Appli 1 Appli 2 Appli n SGBD 1 SGBD 2code données code données
  • 37. Architecture mobile Clients intelligents mobiles Données répliquées et/ou personnelles Réseau sans fil serveur SGBDcode données
  • 38. 38 4. Applications traditionnelles des SGBD• OLTP (On Line Transaction Processing) – Cible des SGBD depuis leur existence – Banques, réservation en ligne ... – Très grand nombre de transactions en parallèle – Transactions simples• OLAP (On Line Analytical Processing) – Entrepôts de données, DataCube, Data Mining … – Faible nombre de transactions – Transactions très complexes
  • 39. 39 Evolution des BD BD BD BD ‘light’ PicoDBMS d’entreprise personnelles (PDA / Tél.) carte à puceCapacité PrixNombre

×