Initiation à X M L Extraits - Presentation Transcript
Initiation à XML (extrait) Antonin Benoît DIOUF eXtensible Markup Language
Composants d’un document XML
Le prologue : ligne d’introduction d’un document XML (obligatoire). Il permet d'indiquer la version XML utilisée, le jeu de caractères (format d’encodage de caractères) utilisé et l'autonomie du document.
L’élément racine : Créé par soi-même il est unique dans le document XML et encadre son contenu (obligatoire aussi)
Le contenu : succession d’éléments et de sous-éléments contenus par l’élément racine.
Il est impératif de respecter la casse dans un document XML, par exemple < l ivre> et < L ivre> ne signifient pas l a même chose.
L’élément XML
un élément comporte une balise ouvrante et une balise fermante
il peut contenir
une chaîne de caractères <element> texte </element>
un ou plusieurs autres éléments <element> <sous_element> texte </sous_element> </element>
une chaîne de caractères et un ou plusieurs éléments <element> texte1 <sous_element> texte2 </sous_element> </element>
la chaîne de caractères ne doit pas comporter les signes < , > , & , " , et ’ qui ont une signification particulière en XML ; pour les afficher, on utilise des appels d’entités caractères (voir plus loin)
Exemple de document XML
Titre : Œuvre poétique
Auteur : Senghor, Léopold Sedar (1906-2001) Publication : Paris : Ed. du Seuil, 1990 Description matérielle : 429 p. ; 22 cm ISBN : 2-02-012106-9
Les attributs d'éléments doivent toujours être entre guillemets
Il y a seulement cinq entités définies par défaut (<, >, &, ", et ') => si un document respecte l’ensemble de ces règles, il est « bien formé » et peut être analysé par un parser XML
Document XML bien formé
Pour s’en assurer visuellement, il faut utiliser un
Parser : analyseur syntaxique (parseur en français)
Comment le faire ? Exemple : copier le texte ci-dessous dans un éditeur de texte (bloc-notes de Ms Office),
< edition > Paris : Ed. du Seuil, 1990 </ edition >
< description > 429 p. ; 22 cm </ description >
< ISBN > 2-02-012106-9 </ ISBN >
< prix > 38,11 EUR </ prix >
</ livre >
NB : ISO-8859-1 est le jeu de caractères Latin 1 pour les langues d’Europe occidentale et d’Amérique latine
Un document XML c’est aussi et surtout,
des DTD et Schémas : sont une « grammaire commune » par laquelle on s’assure que les éléments sont utilisés de la même manière dans plusieurs documents XML du même type. (DTD = Document type définition). Un document XML conforme à une DTD ou un schéma est dit « valide ». Les schémas, contrairement aux DTD, sont écrits en XML et sont leurs « remplaçants ».
des Feuilles de style : permettent de définir la présentation graphique des données contenues dans un ou plusieurs document(s) XML. (Affichage dans un navigateur : Internet explorer, Mozilla,…). Deux feuilles de style : CSS et XSL-T
des Entités : servent à afficher des caractères « interdits » ou spéciaux et à utiliser des abréviations pour des éléments récurrents.
Entités prédéfinies : entités XML et entités caractères
Entités définis par soi-même : entités générales et entités paramètres (qui peuvent être internes ou externes)
des Espaces de noms (namespaces) : permettent d’éviter de confondre des éléments identiques (par ex. titre ) mais utilisés dans des contextes différents. Matérialisés par l’abréviation : xmlns
Conclusion : XML est une « Galaxie » où on retrouve un ensemble des ressources gravitant autour. Par exemple : XPath , XLink , XPointer , XQuery , etc..
Liens et conclusion
Pour en savoir plus :
http://www.w3.org/ : site du Consortium du Web (W3C)
http://xmlfr.org/ (en français)
http://www.commentcamarche.net/xml/xmlintro.php3
Etc.
Ce document est publié sous licence creative commons.
0 comments
Post a comment