Pôle TechnologiesEcole Technique « Tranformation des données documentaires »                  Poitiers, 14-16 mars 2011   ...
IntroductionLes questions :- Comment récupérer des informations disponibles sur  le Web (outil peu structuré a priori)?- C...
Structure des données du Web
Le langage HTML     Html : langage à balises standardisé (W3C) permettant le formatage du texte des     pages Web et leur ...
Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
Html : les métadonnées•     Le titre : encadré par les balises <title>…</title>. Obligatoire•     Les « balises méta » :  ...
Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
Récupérer des donnés bibliographiques
Avec ZoteroEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier,...
Avec Mendeley• Un espace en ligne (connexion !)• Un Mendeley Desktop sur son ordinateur• http://www.mendeley.com/blog/rese...
Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
En ligne                                                                                                Sur le PC (Desktop...
COINS                                                    Context Objects in Span       Les logiciels tels que Zotero ou Me...
Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
COINS GENERATORhttp://generator.ocoins.info/   Ecole technique "Transformation des données documentaires". Poitiers, 14-16...
Les métadonnées des fichiers pdf
Les métadonnées des fichiers PDF• 1993-2001 Document Info         – 6 champs textuels (Titre, Auteur, Sujet, Mots-clés, Pr...
Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
Dans AcrobatFichier>propriétés   Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.   ...
DublinCore                                                                                            Prism** Publishing R...
Avec Endnote                                                                                                   Référence  ...
Add folder (choisir le dossier contenant les PDF)Ecole technique "Transformation des données documentaires". Poitiers, 14-...
Créer un flux Rss à partir d’une page                Web
Un outil simple : Page2rss                                                              En ligne ou comme extension de Goo...
Flux récupéré dans un agrégateur (ex :                                                                      Google Reader ...
Voir aussi…                                                                                         http://www.ponyfish.co...
Extraire et réorganiser du contenu Web
Quelques termes• Web scraping : « extraire du contenu dun site Web, via un script ou un  programme, dans le but de le tran...
Mashup (côté serveur)• Web service         – programme informatique         – communication et léchange de données entre a...
Un exemple de MashupIllustration de Mashup des statistiques de naissances, reconnaissances,mariages et décès à Paris (2004...
Open Dapper : http://open.dapper.net/Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011...
Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
Sélection des types de contenu à conserver et attribution de noms  de « champ »Ecole technique "Transformation des données...
Choix des « champs » à                                                                                         afficher da...
Transformer, fusionner, filtrer,      échanger des flux
Les agrégateurs de flux : Netvibes, Google Reader, FeedReader,      logiciels de veille.          Usage : lire tous les fl...
Echanger des flux : le format OPML                                  Outline Processor Markup Languagehttp://www.opml.org/ ...
X-Fruits                               Recevoir les flux par mail                               Envoyer des informations s...
FeedRinse                                                                                         Filtrage de fluxEcole te...
Un outil avancé : Yahoo Pipes                                                  Principales fonctionnalités :              ...
Après avoir sauvegardé le « pipe », les formats de sortie              sont accessibles                         Exemple ré...
Exemple : à partir des pages « agenda / événements »                                                                de l’I...
Microformats et web sémantique
Linked Data – web de données   • L’objectif des données liées est de permettre aux gens de partager des     données struct...
Extraire des données sémantiques de wikipedia     EXTRAIRE DES DONNÉES SÉMANTIQUES DE WIKIPEDIAEcole technique "Transforma...
• Wikipedia est de facto LE vocabulaire contrôlé du  web                définition pour l’ensemble des sites• DBPEDIA est ...
Link Open DATASETS 2007Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P....
LOD DATASETS 2008Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Avent...
LOD DATASETS 2010Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Avent...
Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
Voir page suivanteEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aven...
Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
infobox    Table préformatée de données dynamiques     qui présente sommairement des informations    importantes sur un su...
infobox              infoboxEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier ...
Taxobox                                                                   TaxoboxEcole technique "Transformation des donné...
Les microformats                                                                   microformats.org•     Ensemble de donné...
Source : Travis Isaacs - microformats @ CE University 8/22/07Ecole technique "Transformation des données documentaires". P...
RDFa     • syntaxe qui vise à inclure des triples RDF dans le       code des pages Web en XHTML. (=microformats)     • Uti...
RDFa – exemple de codeExemple 1 (en utilisant le Dublin Core)<div xmlns:dc="http://purl.org/dc/elements/1.1/"about="http:/...
RDFa – exemple de codeExemple 2 RDFa peut aussi sinscrire naturellement dans le flotdu contenu :<p xmlns:dc="http://purl.o...
Rdf-a pour les moteurs de recherche       Si dans une page web ont écrit le code       <span id="sartre" about="#sartre" r...
Visualiser le web Sémantique                                                  DBPEDIA – RELFINDER                         ...
On peut ajouter des ressources « RDF »Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 201...
1- Recherche entre plusieurs termes2- les différents objets                                                               ...
http://sindice.com/Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Ave...
RechercheclassiqueRechercheSur tripletRecherchePlus précise                                                               ...
Recherche Oryza sativa sur tous les formatsEcole technique "Transformation des données documentaires". Poitiers, 14-16 mar...
L’article dans MendeleyEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P....
Recherche Oryza sativa sur le                                                                                         form...
Upcoming SlideShare
Loading in...5
×

Traiter des données peu structurées : pages Web, fichiers pdf ...

2,494

Published on

- Comment récupérer des informations disponibles sur le Web (outil peu structuré a priori) ?
- Comment les outils que l’on utilise couramment en IST traitent ces données ?
- Comment manipuler des flux Rss ?
- Qu’est-ce que le Web de données et comment y accéder ?

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
2,494
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
53
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Traiter des données peu structurées : pages Web, fichiers pdf ...

  1. 1. Pôle TechnologiesEcole Technique « Tranformation des données documentaires » Poitiers, 14-16 mars 2011 Atelier 4 Traiter des données peu structurées : pages Web, fichiers pdf
  2. 2. IntroductionLes questions :- Comment récupérer des informations disponibles sur le Web (outil peu structuré a priori)?- Comment les outils que l’on utilise couramment en IST traitent ces données?- Comment manipuler des flux Rss?- Qu’est-ce que le Web de données et comment y accéder?Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  3. 3. Structure des données du Web
  4. 4. Le langage HTML Html : langage à balises standardisé (W3C) permettant le formatage du texte des pages Web et leur affichage au sein d’un navigateur (protocole http). Origines : 1989-1992 - Html 1.0 : 1993 – html 2.0 : 1995 – html 3.2 : 1997 – html 4.0 : 1997 – html 4.01 : 1999 2000-2007 : le XHTML. Passerelle entre Html et Xml. Précise la syntaxe Html. Améliore l’interpopérabilité. 2011 2014-- : Html 5 (ou simplement Html) Les CSS (Cascading Style Sheets) : indépendantes de la page web elle-même. Définissent l’ensemble des éléments de mise en forme séparation contenant- contenu. Langages associés aux pages Web Langages serveur Langages client PHP, ASP, ColdFusion, JSP, XSP,... Javascript,VB Script, Flash, VRML, SMIL, Le plus courant : PHP SVG, XLTS,... Le plus courant : JavascriptEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  5. 5. Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  6. 6. Html : les métadonnées• Le titre : encadré par les balises <title>…</title>. Obligatoire• Les « balises méta » : – Les méta NAME=« »…CONTENT=« » : (ex : <META NAME="Description" CONTENT="Rôle et description des balises Meta"> ). Elles précisent par exemple le résumé, les mots-clés, la langue, le propriétaire de la page… – Les méta HTTP-EQUIV=« »…CONTENT=« » : (ex : <META http- equiv="Content-Type" content="text/html; charset=iso-8859-1"> ). Elles précisent des règles techniques destinées aux moteurs. – Les balises sutout utilisées pour le référencement et l’affichage par les moteurs sont : title et description. – Les méta Dublin Core : Elles sont décrites dans l’article Expressing Dublin Core in HTML/XHTML meta and link elements. (http://dublincore.org/documents/dcq-html/)Toutes ces balises figurent dans la partie « en-tête » (<head>) de la page Html.Elles ne sont pas affichées sur la page Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  7. 7. Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  8. 8. Récupérer des donnés bibliographiques
  9. 9. Avec ZoteroEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  10. 10. Avec Mendeley• Un espace en ligne (connexion !)• Un Mendeley Desktop sur son ordinateur• http://www.mendeley.com/blog/research- tutorials/mendeleys-one-click-web-importer/Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  11. 11. Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  12. 12. Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  13. 13. En ligne Sur le PC (Desktop)Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  14. 14. COINS Context Objects in Span Les logiciels tels que Zotero ou Mendeley (mais aussi WordPress, CiteULike…) s’appuient sur la méthode COinS pour récupérer les données bibliographiques Coins est une méthode pour incorporer des citations bibliographiques non visibles dans une page web en HTML, utilisant la norme OpenURL. Ensuite les métadonnées sont récupérables par des outils Mendeley / Zotero / Endnote ou peuvent être étendues par des possibilités de l’OpenURL Voir les extensions de Coins http://www.figoblog.org/document1131.php, voir aussi http://vlib.mpg.de/sfx-coins.htmlEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  15. 15. Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  16. 16. COINS GENERATORhttp://generator.ocoins.info/ Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  17. 17. Les métadonnées des fichiers pdf
  18. 18. Les métadonnées des fichiers PDF• 1993-2001 Document Info – 6 champs textuels (Titre, Auteur, Sujet, Mots-clés, Producteur du PDF, Application) – 2 champs date (création, modification)• Depuis 2001 (Acrobat 5.0) XMP Extensible Metadata Platform – Format type XML – Se trouve aussi dans les photos• Nature publie des articles contenant des métadonnées XMP voir exemple Source : P Pecatte : http://blog.tuquoque.com/post/2010/01/05/metadata-PDFEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  19. 19. Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  20. 20. Dans AcrobatFichier>propriétés Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  21. 21. DublinCore Prism** Publishing Requirements for Industry Standard Metadata (PRISM) http://www.prismstandard.org/about/ Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  22. 22. Avec Endnote Référence Endnote importéeEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  23. 23. Add folder (choisir le dossier contenant les PDF)Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  24. 24. Créer un flux Rss à partir d’une page Web
  25. 25. Un outil simple : Page2rss En ligne ou comme extension de Google Chrome http://page2rss.com/ S’appuie sur le cache Google. Attention aux dates de mises à jourEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  26. 26. Flux récupéré dans un agrégateur (ex : Google Reader URL du flux : http://page2rss.com/rss/81b5348182061d6ac0d4a56673e06142Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  27. 27. Voir aussi… http://www.ponyfish.com/ Recherche les flux existants ou propose la création http://www.feedreader.com/ Ne crée pas de flux, mais détecte les flux existants même s’il ne sont pas affichés en tant que telsEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  28. 28. Extraire et réorganiser du contenu Web
  29. 29. Quelques termes• Web scraping : « extraire du contenu dun site Web, via un script ou un programme, dans le but de le transformer ou de changer son format pour permettre son utilisation dans un autre contexte. » (http://fr.wikipedia.org/wiki/Web_scraping)• Le mashup : – Une application composite – combine du contenu ou du service provenant de plusieurs applications plus ou moins hétérogènes. – Exemples : • superposition de données visuelles et sonores différentes • Agréger du contenu provenant dautres sites, afin de créer un site web nouveau. Si certains éditeurs autorisent et encouragent le développement de nouvelles applications utilisant leurs données (Amazon, Google…), c’est sur la base d’accords économiques. La republication « sauvage » peut contrevenir au droit d’auteur. De plus en plus de producteurs de contenus s’en protègent en plaçant à la racine de leur site un fichier « robots.txt » spécifiant les robots autorisés à parcourir leur site.Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  30. 30. Mashup (côté serveur)• Web service – programme informatique – communication et léchange de données entre applications et systèmes hétérogènes – dans des environnements distribués. en temps réel• API (Application Programming Interface ou API) est une interface fournie par un programme informatique. Elle permet linteraction des programmes les uns avec les autres.Mashup (côté client)• XMLHttpRequest• AJAX du côté client, les RSSEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  31. 31. Un exemple de MashupIllustration de Mashup des statistiques de naissances, reconnaissances,mariages et décès à Paris (2004 à 2009)À partir du site Parisdata avec GoogleMap http://paris.mapize.com/ Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  32. 32. Open Dapper : http://open.dapper.net/Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  33. 33. Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  34. 34. Sélection des types de contenu à conserver et attribution de noms de « champ »Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  35. 35. Choix des « champs » à afficher dans le nouveau fluxEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  36. 36. Transformer, fusionner, filtrer, échanger des flux
  37. 37. Les agrégateurs de flux : Netvibes, Google Reader, FeedReader, logiciels de veille. Usage : lire tous les flux en 1 seul point. Veille. + de Netvibes : présentation agréable (outil de diffusion) avec possibilité de lecture globale (vue « lecteur) + de Google Reader : moteur de recherche interneEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  38. 38. Echanger des flux : le format OPML Outline Processor Markup Languagehttp://www.opml.org/ • C’est un fichier au format XML • Adopté pour l’échange de listes de flux (et aussi de podcasts, etc) • Répond à des spécifications • La plupart des agrégateurs de flux proposent l’export OPML Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  39. 39. X-Fruits Recevoir les flux par mail Envoyer des informations sur une boîte mail Xfruits collaborative avec création d’un flux unique en sortie Créer un pdf à partir d’un fluxEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  40. 40. FeedRinse Filtrage de fluxEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  41. 41. Un outil avancé : Yahoo Pipes Principales fonctionnalités : • fusionner des flux, les trier, les traduire, ajouter des filtres • extraire et combiner des contenus, introduire des éléments de géolocalisation • rediffuser sous différents, formats, widgetsEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  42. 42. Après avoir sauvegardé le « pipe », les formats de sortie sont accessibles Exemple réalisé avec l’aide (précieuse) de Marie-Colette Fauré)Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  43. 43. Exemple : à partir des pages « agenda / événements » de l’Inra et du Cirad flux créé avec Page2Rss + ajout du flux Ifremer « dernières actualités » Prévisualisation du flux actualisé lors de sa créationEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  44. 44. Microformats et web sémantique
  45. 45. Linked Data – web de données • L’objectif des données liées est de permettre aux gens de partager des données structurées sur le Web aussi facilement qu’ils peuvent partager des documents d’aujourd’hui. Modèle de données RDF Liens RDF • Deux principes • Modèle de données pour publier des données structurées sur le Web • utiliser des liens de ce modèle pour interconnecter les données provenant de sources différentes Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Source : Traduction : How to Publish Linked Data on the Web? « Blogabriel: http://bit.ly/igfKua Atelier 4. P. Aventurier, MH. Cathala
  46. 46. Extraire des données sémantiques de wikipedia EXTRAIRE DES DONNÉES SÉMANTIQUES DE WIKIPEDIAEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  47. 47. • Wikipedia est de facto LE vocabulaire contrôlé du web définition pour l’ensemble des sites• DBPEDIA est devenu l’ensemble des ressources D’URI partagée pour les concepts pour le web sémantique• DBPEDIA est une brique importante pour lier entre eux différentes données sémantiquesEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  48. 48. Link Open DATASETS 2007Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  49. 49. LOD DATASETS 2008Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  50. 50. LOD DATASETS 2010Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  51. 51. Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  52. 52. Voir page suivanteEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  53. 53. Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  54. 54. infobox Table préformatée de données dynamiques qui présente sommairement des informations importantes sur un sujet dans un cartouche placé en général à droite de l‘article Différents modèles par domaines http://fr.wikipedia.org/wiki/Aide:InfoboxEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  55. 55. infobox infoboxEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  56. 56. Taxobox TaxoboxEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  57. 57. Les microformats microformats.org• Ensemble de données très simples, ouvertes• Construit avec les standards existants• Permet de s’intégrer à l’existant (le web actuel)• S’appuie sur des modèles simplesEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  58. 58. Source : Travis Isaacs - microformats @ CE University 8/22/07Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  59. 59. RDFa • syntaxe qui vise à inclure des triples RDF dans le code des pages Web en XHTML. (=microformats) • Utilise la syntaxe de RDF • Utilise les attributs du XHTML href, content, rel, rev, and datatype ( XHTML 1) about, role and property ( XHTML 2)Source : http://www.lespetitescases.net/et-si-on-semantisait-un-peu-le-webhttp://www.xml.com/pub/a/2007/02/14/introducing-rdfa.html?CMP=OTC-TY3388567169&ATT=Introducing+RDFa Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  60. 60. RDFa – exemple de codeExemple 1 (en utilisant le Dublin Core)<div xmlns:dc="http://purl.org/dc/elements/1.1/"about="http://www.example.com/books/wikinomics"><span property="dc:title">Wikinomics</span> <span property="dc:creator">Don Tapscott</span><span property="dc:date">2006-10-01</span> </div>Source : http://www.lespetitescases.net/et-si-on-semantisait-un-peu-le-webhttp://www.xml.com/pub/a/2007/02/14/introducing-rdfa.html?CMP=OTC-TY3388567169&ATT=Introducing+RDFa Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  61. 61. RDFa – exemple de codeExemple 2 RDFa peut aussi sinscrire naturellement dans le flotdu contenu :<p xmlns:dc="http://purl.org/dc/elements/1.1/"about="http://www.example.com/books/wikinomics"> Dans son dernier livre<em property="dc:title"> Wikinomics</em>, <span property="dc:creator">Don Tapscott</span>explique les profonds changements technologiques,démographiques et économiques. Ce livre a été publiéen <span property="dc:date" content="2006-10-01">octobre 2006</span>. </p>Source : http://www.lespetitescases.net/et-si-on-semantisait-un-peu-le-webhttp://www.xml.com/pub/a/2007/02/14/introducing-rdfa.html?CMP=OTC-TY3388567169&ATT=Introducing+RDFa Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  62. 62. Rdf-a pour les moteurs de recherche Si dans une page web ont écrit le code <span id="sartre" about="#sartre" rel="owl:sameAs" href="http://dbpedia.org/page/Jean-Paul_Sartre"> Jean-Paul Sartre </span> Le moteur de recherche : indexe la page Web, mais aussi la notice de Jean-Paul Sartre en RDF dans DBpediaSource : http://www.lespetitescases.net/et-si-on-semantisait-un-peu-le-webhttp://radar.oreilly.com/2009/05/google-announces-support-for-m.html Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  63. 63. Visualiser le web Sémantique DBPEDIA – RELFINDER SINDICEEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  64. 64. On peut ajouter des ressources « RDF »Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  65. 65. 1- Recherche entre plusieurs termes2- les différents objets 2- le graphe de relation Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  66. 66. http://sindice.com/Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  67. 67. RechercheclassiqueRechercheSur tripletRecherchePlus précise Formats Ecole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011. Atelier 4. P. Aventurier, MH. Cathala
  68. 68. Recherche Oryza sativa sur tous les formatsEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  69. 69. L’article dans MendeleyEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  70. 70. Recherche Oryza sativa sur le format RDF uniquementEcole technique "Transformation des données documentaires". Poitiers, 14-16 mars 2011.Atelier 4. P. Aventurier, MH. Cathala
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×