De la caractérisation des   données à leur transformation                    Ecole Technique du pôle Technologies         ...
De la caractérisation desdonnées à leur transformation1ère partie1- Objet, information, donnée, …2- Caractériser3- Exemple...
1- Objet, information, donnéeQu’est ce qu’une donnée ?“The term data refers to qualitative or quantitative attributes of a...
1- Un objet
1- Un ensemble dinformation
2- CaractériserCaractériser un objet, c’est décrirel’objet avec des propriétés, desattributs, des caractéristiques quiform...
2- Caractériser un objet               Les polyamines sont des composés organiques               possédant au moins deux f...
2-Caractériser une information           Une bibliothèque est un lieu (-thèque)           qui regroupe des livres (biblio-...
2- Prendre en compte le contexte et l’objectif         Cet objet se caractérise par :         • un assemblage de légo     ...
2-Caractériser : pour quoi,   pour qui, comment ?            •Retrouver l’informationPour quoi   •Définir l’information   ...
3- Exemple             Objectif :             je voudrais             que mon             article soit             lu par ...
3- ExempleJe le publieJe le stocke
3- ExempleJe le décris ------   manuellement
3- ExempleIl est décrit ------   informatiquement                        On parle du format de                        donn...
3- Exemple                Application                   BDDDe l’alimentation à la restitution des données
4- TransformerTout est transformation de donnéesBDD XML
4- Transformer  Tout est transformation de donnéesSGBD relationnel
1ère partie       Conclusion 1/4Caractériser un objet, un document               doit se fairedans un contexte (implicite)...
1ère partie     Conclusion 2/4Concevoir un système dinformationdocumentaire, cest expliciter                 • le contexte...
1ère partie      Conclusion 3/4La transformation des données estpartout,mais elle est cachée à lutilisateur
1ère partie      Conclusion 4/4Chaque transformation a un coûthumain et financier.L’avenir est dans les systèmes économes(...
De la caractérisation desdonnées à leur transformation2ème partie1.   Du document à lencodage2.   Concevoir une applicatio...
1- Du document à l’encodage               Je caractérise :               Type : Article -> Editorial               Titre :...
1- Du document à l’encodageJe caractérise :                                          J’encode :Type : Article -> Editorial...
2- Concevoir une application          documentaireQuel type de     • Relationnelle                 • Native XML  BDD ?    ...
2- Un exemple de diagramme de classe
3- L’exposition des données en OAI                   Métadonnées au format                   de l’archive ouverte      Tra...
4- La réutilisation des donnéesExemple avec les projets IraLis, Exit, E-LIS portéspar CIEPI, the International Centre of R...
4- La réutilisation des données         Ma signature telle qu’encodée en RDF dans IraLIS<rdf:RDF><foaf:Person rdf:about="F...
4- La réutilisation des donnéesJe m’enregistredans EXIT ensignalant monIraLISMes publicationsdéposées dans ELISsont mentio...
2ème partie   Conclusion 1/2On ne caractérise pas des donnéesmais un objet, un document, uneinformation…
2ème partie    Conclusion 2/2On ne transforme pas des donnéesmais l’encodage de l’objet (formatde données)
Conclusion généraleLe titre de cette présentation est incorrect (CQFD)Vous devriez maintenant savoir pourquoi !
Upcoming SlideShare
Loading in...5
×

De la caractérisation des données à leur transformation

1,289
-1

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,289
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
13
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

De la caractérisation des données à leur transformation

  1. 1. De la caractérisation des données à leur transformation Ecole Technique du pôle Technologies 14-15-16 mars à PoitiersDiane Le Hénaff, Ingénieur Systèmes d’information Documentaires (DV-IST)
  2. 2. De la caractérisation desdonnées à leur transformation1ère partie1- Objet, information, donnée, …2- Caractériser3- Exemple4- Transformer
  3. 3. 1- Objet, information, donnéeQu’est ce qu’une donnée ?“The term data refers to qualitative or quantitative attributes of avariable or set of variables. Data are typically the results ofmeasurements and can be the basis of graphs, images, or observationsof a set of variables”Source : http://en.wikipedia.org/wiki/Data • Une donnée est un attribut, une propriété d’un objet • Une donnée est une unité d’information
  4. 4. 1- Un objet
  5. 5. 1- Un ensemble dinformation
  6. 6. 2- CaractériserCaractériser un objet, c’est décrirel’objet avec des propriétés, desattributs, des caractéristiques quiforment alors un ensemble dedonnées.Caractériser une donnée est impropresauf si l’on vise à décrire encore plusfinement une unité d’information.
  7. 7. 2- Caractériser un objet Les polyamines sont des composés organiques possédant au moins deux fonctions amine Une amine est un composé organique dérivé de lammoniac dont certains hydrogènes ont été remplacés par un groupement carboné Un polyamine se caractérise par : • une suite de copolymères (-CH2-CHOH-CH2-N+(CH3)2- ) de dimethylamine et d’epichlorohydrin • présence d’ammoniac •…
  8. 8. 2-Caractériser une information Une bibliothèque est un lieu (-thèque) qui regroupe des livres (biblio-) Ce livre se caractérise par : • un éditeur : Gallimard • un auteur : Lane Smith • un titre : « C’est un livre » • un nombre de pages • une langue d’écriture •…
  9. 9. 2- Prendre en compte le contexte et l’objectif Cet objet se caractérise par : • un assemblage de légo • des couleurs noir, bleu, gris • une belle harmonie avec les couleurs de la chambre de mon fils… Ce livre se caractérise par : • une très bonne critique • son classement en livre jeunesse • son sujet original sur les mérites du livre imprimé
  10. 10. 2-Caractériser : pour quoi, pour qui, comment ? •Retrouver l’informationPour quoi •Définir l’information •Récupérer l’informationPour qui •L’utilisateur humain •La machine •En stockant les propriétés-données (avec ou sansComment l’objet) •En les publiant sous différents formats et média
  11. 11. 3- Exemple Objectif : je voudrais que mon article soit lu par mes pairs
  12. 12. 3- ExempleJe le publieJe le stocke
  13. 13. 3- ExempleJe le décris ------ manuellement
  14. 14. 3- ExempleIl est décrit ------ informatiquement On parle du format de données de l’application (ici ProdInra). Il est issu d’une modélisation intellectuelle puis informatique (en UML)
  15. 15. 3- Exemple Application BDDDe l’alimentation à la restitution des données
  16. 16. 4- TransformerTout est transformation de donnéesBDD XML
  17. 17. 4- Transformer Tout est transformation de donnéesSGBD relationnel
  18. 18. 1ère partie Conclusion 1/4Caractériser un objet, un document doit se fairedans un contexte (implicite)pour un objectif (implicite)
  19. 19. 1ère partie Conclusion 2/4Concevoir un système dinformationdocumentaire, cest expliciter • le contexte, • lobjectifet modéliser (décrire) les objets,les informations, les documents.
  20. 20. 1ère partie Conclusion 3/4La transformation des données estpartout,mais elle est cachée à lutilisateur
  21. 21. 1ère partie Conclusion 4/4Chaque transformation a un coûthumain et financier.L’avenir est dans les systèmes économes(ie : optimisation/réduction du nbre detransformations pour un objectif donné)
  22. 22. De la caractérisation desdonnées à leur transformation2ème partie1. Du document à lencodage2. Concevoir une application documentaire3. Lexposition des données en OAI4. La réutilisation des données
  23. 23. 1- Du document à l’encodage Je caractérise : Type : Article -> Editorial Titre : des bibliothèques aux archives ouvertes Auteur : Jean-Michel Rauzier Revue : Documentaliste – SI Corps du texte : Voici, comme chaque année à pareille époque, un numéro dans lequel les bibliothèques occupent une place plus visible que d’ordinaire – parce qu’il paraît après le congrès de l’IFLA que précéda de peu celui de l’ABF. Les bibliothèques, moteurs de la diffusion des connaissances et de la construction de la société de l’information : c’est vers l’avenir que l’IFLA avait clairement tourné sa soixante- douzième conférence, moins que jamais repliée sur la bibliothéconomie d’antan et s’affirmant désormais résolument comme « le congrès mondial des bibliothèques et de l’information ». La bibliothèque demain… : loin de s’appesantir avec narcissisme sur un siècle d’existence, l’Association des bibliothécaires français consacrait le congrès de son centenaire à scruter le futur des bibliothèques et du métier dans la société de l’information.
  24. 24. 1- Du document à l’encodageJe caractérise : J’encode :Type : Article -> Editorial (le choix du schéma est important –Titre : des bibliothèques aux voici ce qu’il ne faut pas faire)archives ouvertes </type production=« Article »Auteur : Jean-Michel Rauzier genre=« Editorial »> <description>Revue : Documentaliste – SI <titre langue=« FRA » role="original">Corps du texte :Voici, comme chaque année à pareille époque, un Des bibliothèques aux archives ouvertesnuméro dans lequel les bibliothèques occupent uneplace plus visible que d’ordinaire – parce qu’il paraît </titre>après lecongrès de l’IFLA que précéda de peu celui de l’ABF.Les bibliothèques, moteurs de la diffusion des <auteur>connaissances et de la construction de la société del’information : c’est <prenom>Jean-Michel</prenom>vers l’avenir que l’IFLA avait clairement tourné sasoixante-douzième conférence, moins que jamaisrepliée sur la bibliothéconomie d’antan et <nom>Rauzier</nom>s’affirmant désormais résolument comme « lecongrès mondial des bibliothèques et de </auteur>l’information ». La bibliothèque demain… …
  25. 25. 2- Concevoir une application documentaireQuel type de • Relationnelle • Native XML BDD ? • Objet, graphe, no-sql… Quelle •MCDmodélisation ? •UML •SpécifiqueQuel format ? •Standard (MODS…)
  26. 26. 2- Un exemple de diagramme de classe
  27. 27. 3- L’exposition des données en OAI Métadonnées au format de l’archive ouverte Transformation Record (Métadata) Format demenadé I n Méta données t Set n°1 e Record (Métadata) r format OA Fichiers texte intégral p r Set n°2 é t Set e Requête OAI (http) n°3 u Archive ouverte r • Le verbe (ici GetRecord) Entrepôt OAI • Le set de données (optionnel) • Le format de données (obligatoire)
  28. 28. 4- La réutilisation des donnéesExemple avec les projets IraLis, Exit, E-LIS portéspar CIEPI, the International Centre of Research forInformation Strategy and Development Je m’enregistre dans IraLis
  29. 29. 4- La réutilisation des données Ma signature telle qu’encodée en RDF dans IraLIS<rdf:RDF><foaf:Person rdf:about="FRLIS2192"><foaf:familyName>Le Hénaff</foaf:familyName><foaf:firstName>Diane</foaf:firstName><foaf:mbox rdf:resource="mailto:diane.lehenaff@gmail.com"/><iralis:anep_classification>LIS</iralis:anep_classification><iralis:jcr_classification>INFORMATION SCIENCE </iralis:jcr_classification><skos:Collection/><skos:prefLabel>Diane Le-Hénaff</skos:prefLabel><foaf:mbox rdf:resource="mailto:"/></foaf:Person></rdf:RDF>
  30. 30. 4- La réutilisation des donnéesJe m’enregistredans EXIT ensignalant monIraLISMes publicationsdéposées dans ELISsont mentionnées
  31. 31. 2ème partie Conclusion 1/2On ne caractérise pas des donnéesmais un objet, un document, uneinformation…
  32. 32. 2ème partie Conclusion 2/2On ne transforme pas des donnéesmais l’encodage de l’objet (formatde données)
  33. 33. Conclusion généraleLe titre de cette présentation est incorrect (CQFD)Vous devriez maintenant savoir pourquoi !
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×