Modèles de données et langages de description ouverts 6 - 2021-2022

Modèles de données et langages
de description ouverts - 6
Licence DIST
2021-2022

Rappel programme global
• Comprendre la notion de métadonnée,
approche des langages à balises (s1)
• Comprendre le XML et ses applications (s2-4)
• Données ouvertes, traitements et
matérialisations informatiques (s5-6)

Programme de ce cours
1. Evaluation finale
2. Rappel : le web de données
3. Modèles de données et infrastructure
4. Questions-réponses dossiers
5. Bilan du cours

1) Evaluation finale
• 1h15 - sur 40 points
4

2) Rappel : le web de données
• Les bases en web de données sont
constituées d’un ensemble de déclarations
sujet - relation - prédicat, des triplets
• D’une logique de tables de données avec des
relations binaires clé / valeur, on passe alors à
un système de graphe de données (la
structure des liens tissés par les triplets)
5

Le web de données
Exemple issu du RDF 1.1 Primer
<Bob> <is a> <person>.
<Bob> <is a friend of> <Alice>.
<Bob> <is born on> <the 4th of July 1990>.
<Bob> <is interested in> <the Mona Lisa>.
<the Mona Lisa> <was created by> <Leonardo da Vinci>.
<the video 'La Joconde à Washington'> <is about> <the Mona Lisa>

Le web de données
• Un modèle de données fondamentalement
ouvert
–Des points d’accès stables (via les URI)
–Une logique de réutilisation permettant les
enrichissements à l’infini
–Une conception partagée sans limitation, un
“commun”

Le web de données
Photo par Michael Dziedzic sur Unsplash
Photo par DevVrat Jadon sur Unsplash
https://commons.wikimedia.org/wiki/File:Super_glue.jpg
Ce modèle de données, si puissant soit-il, est UNE option technique parmi
d’autres, avec ses utilisations privilégiées. Est-ce qu’on imaginerait:
- Clouer une Tour Eiffel en allumettes ?
- Coller les rails des lignes du TGV ?

Le web de données
Après la phase de “hype” puis la frustration des pionniers, montée en
usage progressive
Hype Cycle du Gartner, Jérémy Kemp, CC-BY-SA

Le web de données
Sur des plans très différents, situation du XML (format de métadonnées),
du Web de données (modèle de données, donc de métadonnées) et de
JSON (JavaScript Object Notation - encodage de données)
Hype Cycle du Gartner, Jérémy Kemp, CC-BY-SA
JSON
Web3
XML

3) Modèle de données et
infrastructure
Les modèles de données reposent sur une
infrastructure technique à ne pas négliger
(issu de https://medium.com/sogetiblogsnl/the-role-of-the-dba-on-modern-data-platforms-da40f5ad8f78)
S’appuyer sur des modèles de données
ouverts facilite la portabilité et
l’interopérabilité des services /
applications
Le stockage et le traitement informatique
de bas niveau sont plus ou moins adaptés
à (=optimisés pour) ces modèles de
données

Modèle de données et
infrastructure
• Les services permis
par un modèle de
données ne
fonctionnent que
si l’infrastructure
technique les rend
aussi possibles /
réalisables

infrastructure
• La typologie des bases de données n’est pas
très figée, en voici une en guise d’exemple.
(OLTP)
Dans https://iaobs.com/blog/bases-de-donnees-relationnelles-et-nosql-dans-gcp/
XML ? Web
de données ?

infrastructure
• La plupart du temps, une infrastructure peut
gérer tous les modèles de données mais pas
avec les mêmes performances (ici du RDF)
Dans https://www.sciencedirect.com/science/article/pii/S0268401219306097

infrastructure
• Les performances varient surtout selon les
opérations lancées sur les données (1/2)
Dans https://medium.com/profil-software-blog/database-compare-sql-vs-nosql-mysql-vs-postgresql-vs-redis-vs-mongodb-3da5f41c31b5

infrastructure
• Les performances varient surtout selon les
opérations lancées sur les données (2/2)
Dans https://medium.com/profil-software-blog/database-compare-sql-vs-nosql-mysql-vs-postgresql-vs-redis-vs-mongodb-3da5f41c31b5

infrastructure
Base de données
relationnelles
Base de données
document
Base de données
graphes
Moteur de
recherche
• Beaucoup de lecture/écriture
• Données très structurées
• Garantie de la transaction
• Peu ou pas de mise à jour
• Données semi structurées
• Montée en charge sécurisée en
volume de données
• Données très structurées
• Inférences sur les données
• Respect de la logique des données
• Requête plein texte
• Rapidité des réponses
• Montée en charge pour le
nombre d’utilisateurs
Forces et faiblesses des différents systèmes de bases de données.
Il n’existe pas une base de données idéale, chacune présente ses forces et ses faiblesses.
CC-BY Gautier Poupeau - 2019

infrastructure
• Logique “data-centrée”-> de + en + des
réservoirs différents pour services multiples
Extrait de Data Lake for Enterprises - Tomcy John et Pankaj Misra - Pakt - ISBN 9781787281349

infrastructure
• La destruction du format unique 💍
(le destin sans doute…)
• Pourquoi se préoccuper
de choisir des formats
ouverts de stockage ou d’expression des
métadonnées (XML, RDF, JSON…) ?

infrastructure
• Choisir des formats ouverts de stockage ou
d’expression des métadonnées ?
–Reprendre la maîtrise
sur les données publiques
(ou en tirer profit!)
–Ouvrir sur l’inconnu

4) Questions-réponses dossiers
20 à 30 min
22

Et pour la suite...
Bon courage !
Entraînez-vous à repérer le XML ou équivalent, et
vous savez maintenant que ça peut être maîtrisé
avec des connaissances et du bon sens.
Merci enfin pour vos efforts pour gérer cet aspect
technique du métier...

Modèles de données et langages de description ouverts 6 - 2021-2022

Recommended

Recommended

More Related Content

What's hot

What's hot (6)

Similar to Modèles de données et langages de description ouverts 6 - 2021-2022

Similar to Modèles de données et langages de description ouverts 6 - 2021-2022 (20)

More from François-Xavier Boffy

More from François-Xavier Boffy (8)

Recently uploaded

Recently uploaded (20)

Modèles de données et langages de description ouverts 6 - 2021-2022