Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Antidot
Diaporama de la présentation faite à l'occasion du Co-lab Semantique organisé par le consortium Scribo. L'enjeu était de présenter en 45-60min les enjeux du Web sémantique.
BigData_TP2: Design Patterns dans HadoopLilia Sfaxi
Pour accéder aux fichiers nécessaires pour faire ce TP, visitez: https://drive.google.com/folderview?id=0Bz7DokLRQvx7M2JWZEt1VHdwSE0&usp=sharing
Pour plus de contenu, Visitez http://liliasfaxi.wix.com/liliasfaxi !
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Antidot
Diaporama de la présentation faite à l'occasion du Co-lab Semantique organisé par le consortium Scribo. L'enjeu était de présenter en 45-60min les enjeux du Web sémantique.
BigData_TP2: Design Patterns dans HadoopLilia Sfaxi
Pour accéder aux fichiers nécessaires pour faire ce TP, visitez: https://drive.google.com/folderview?id=0Bz7DokLRQvx7M2JWZEt1VHdwSE0&usp=sharing
Pour plus de contenu, Visitez http://liliasfaxi.wix.com/liliasfaxi !
Pour accéder aux fichiers nécessaires pour faire ce TP, visitez: https://drive.google.com/folderview?id=0Bz7DokLRQvx7M2JWZEt1VHdwSE0&usp=sharing
Pour plus de contenu, Visitez http://liliasfaxi.wix.com/liliasfaxi !
Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...Hatim CHAHDI
Ce cours introduit les bases de données orientées colonnes et leurs spécificités. Il détaille par la suite l'architecture d'HBase et explique les moyens nécessaires à sa mise en place et à son exploitation.
Dans cette session, vous apprendrez:
Les différences entre modéliser pour MongoDB versus une base de données relationnelle.
Une méthodologie pour modéliser pour MongoDB qui est adaptable aux projets simples, agiles ou plus complexes.
Quelques patrons de conception (design patterns) courants dans le développement d'applications avec MongoDB, dans le but de maximiser la performance.
Les concepts de base de l'analyse de réseaux, réseaux sociaux réels, problématiques de l'analyse de grands graphes réels, pistes d'application au emarketing
Nous présentons les modèles N-grammes qui constituent l'une des approches basiques du traitement automatique du langage naturel (TLN ou NLP en anglais). Leur compréhension permet de mieux aborder les méthodes plus performantes, notamment celles qui utilisent les architectures de réseaux de neurones. Seront détaillés ici les fondements mathématiques, les techniques pratiques à travers des exemples illustratifs ainsi que des implémentations informatiques de ces méthodes.
YOUTUBE : https://youtube.com/playlist?list=PLzjg2z2kYUrh_RIcPUN2J7UyFBvZu2z_L
Introduction au web des données (Linked Data)BorderCloud
L'Open Data, le Big Data, le Web des données, le Web sémantique, les ontologies, le NoSql et le SPARQL sont autant de notions qu'il faut comprendre pour ne pas rater la prochaine rupture technologique du Web.
Cette présentation est l'introduction de la formation sur le Web sémantique que donne la société BorderCloud pour prendre un peu de recule sur les buzzwords du moment et savoir si vous avez besoin de faire du Big Data ou bien du Linked Data.
Objectif général : Concevoir une base de données
Objectifs opérationnels :
- Comprendre les différents concepts entourant les BD
- Comprendre les concepts associés aux BD relationnelles
- Établir un dictionnaire de données (DD)
- Structurer les données du DD
- Construire un Modèle Conceptuel des Données (MCD)
- Transformer un MCD en Modèle logique de données (MLD)
- Normaliser un MLD
ATED 2015 - Données numériques et Mémoire par Nicolas Larrousse (Huma-Num)Phonothèque MMSH
Cette conférence de Nicolas Larrousse (Huma-Num) s'inscrit dans le cadre de l'atelier doctoral (ATED) soutenu par le LabexMed qui se positionne comme acteur de la recherche internationale, des pratiques interdisciplinaires et de la promotion des Digital Humanities dans le champ des études méditerranéennes. il est organisé en collaboration avec les laboratoires TELEMME , IREMAM, LAMES,IRMC et le Pôle Images/Sons, pratiques du numérique de la MMSH. L’atelier a l’ambition de constituer un réseau d’études doctorales et de créer les conditions d’une communauté collaborative dynamique autour des Digital Humanities sur l’aire méditerranéenne.
Voir http://imageson.hypotheses.org/2054
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
Diaporama pour une communication donnée dans le cadre de la journée d'études ADBS-EDB, "Quel Web demain ?", 7 avril 2009, http://www.adbs.fr/quel-web-demain--57415.htm
Pour accéder aux fichiers nécessaires pour faire ce TP, visitez: https://drive.google.com/folderview?id=0Bz7DokLRQvx7M2JWZEt1VHdwSE0&usp=sharing
Pour plus de contenu, Visitez http://liliasfaxi.wix.com/liliasfaxi !
Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...Hatim CHAHDI
Ce cours introduit les bases de données orientées colonnes et leurs spécificités. Il détaille par la suite l'architecture d'HBase et explique les moyens nécessaires à sa mise en place et à son exploitation.
Dans cette session, vous apprendrez:
Les différences entre modéliser pour MongoDB versus une base de données relationnelle.
Une méthodologie pour modéliser pour MongoDB qui est adaptable aux projets simples, agiles ou plus complexes.
Quelques patrons de conception (design patterns) courants dans le développement d'applications avec MongoDB, dans le but de maximiser la performance.
Les concepts de base de l'analyse de réseaux, réseaux sociaux réels, problématiques de l'analyse de grands graphes réels, pistes d'application au emarketing
Nous présentons les modèles N-grammes qui constituent l'une des approches basiques du traitement automatique du langage naturel (TLN ou NLP en anglais). Leur compréhension permet de mieux aborder les méthodes plus performantes, notamment celles qui utilisent les architectures de réseaux de neurones. Seront détaillés ici les fondements mathématiques, les techniques pratiques à travers des exemples illustratifs ainsi que des implémentations informatiques de ces méthodes.
YOUTUBE : https://youtube.com/playlist?list=PLzjg2z2kYUrh_RIcPUN2J7UyFBvZu2z_L
Introduction au web des données (Linked Data)BorderCloud
L'Open Data, le Big Data, le Web des données, le Web sémantique, les ontologies, le NoSql et le SPARQL sont autant de notions qu'il faut comprendre pour ne pas rater la prochaine rupture technologique du Web.
Cette présentation est l'introduction de la formation sur le Web sémantique que donne la société BorderCloud pour prendre un peu de recule sur les buzzwords du moment et savoir si vous avez besoin de faire du Big Data ou bien du Linked Data.
Objectif général : Concevoir une base de données
Objectifs opérationnels :
- Comprendre les différents concepts entourant les BD
- Comprendre les concepts associés aux BD relationnelles
- Établir un dictionnaire de données (DD)
- Structurer les données du DD
- Construire un Modèle Conceptuel des Données (MCD)
- Transformer un MCD en Modèle logique de données (MLD)
- Normaliser un MLD
ATED 2015 - Données numériques et Mémoire par Nicolas Larrousse (Huma-Num)Phonothèque MMSH
Cette conférence de Nicolas Larrousse (Huma-Num) s'inscrit dans le cadre de l'atelier doctoral (ATED) soutenu par le LabexMed qui se positionne comme acteur de la recherche internationale, des pratiques interdisciplinaires et de la promotion des Digital Humanities dans le champ des études méditerranéennes. il est organisé en collaboration avec les laboratoires TELEMME , IREMAM, LAMES,IRMC et le Pôle Images/Sons, pratiques du numérique de la MMSH. L’atelier a l’ambition de constituer un réseau d’études doctorales et de créer les conditions d’une communauté collaborative dynamique autour des Digital Humanities sur l’aire méditerranéenne.
Voir http://imageson.hypotheses.org/2054
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
Diaporama pour une communication donnée dans le cadre de la journée d'études ADBS-EDB, "Quel Web demain ?", 7 avril 2009, http://www.adbs.fr/quel-web-demain--57415.htm
Mettre nos données en réseau (données de l'IST en France)Y. Nicolas
Intervention lors de la journée d'étude 2009 de l'ADBU : Quelle économie de l’IST en France ? et pour quelle politique ?
Je fais une intro ultra light au Web des données pour un public de décideurs des bibliothèques universitaires françaises.
J'annonce les futurs services de l'ABES autour des autorités Sudoc.
Support 4 (web de données) des journées de formation sur l'évolution des catalogues organisées par MédiaLille et le groupe technique sur l'adoption de RDA en France.
L’émergence de larges répertoires de données sémantiques et interconnectées crée de nouvelles opportunités quant à l’utilisation et au partage d’informations au sein d’applications intelligentes. Cette nouvelle façon de publier des données aide à la découverte d’informations structurées et contextuelles ainsi qu’à la réutilisation de données existantes. Dans ce contexte, il est important pour un individu ou une organisation de distribuer ces informations selon le même principe afin d’assurer la pérennité et le partage de ces données sémantiques.
Pour l’instant, la plupart des publications sur le Web de Données sont le plus souvent soit complètement ouvertes (Open Linked Data), soit complètement fermées (intranets). De plus, la publication de ces données reste restreinte à la publication de larges ensembles de données approuvées et éditées par de larges organisations limitant ainsi la création de base de données individuelles nécessaires au développement d’un Sémantique Web centré autour de ses utilisateurs plutôt que sur ses données (Social Semantic Web).
Avant de mettre à disposition ses informations, un individu ou une organisation a besoin d’être sûr que ses informations sont uniquement accessibles et modifiables par des personnes autorisées. Dans ce contexte, il est impératif d’identifier l’entité qui publie une information particulière ainsi que la personne qui essaie d’y accéder ou de la modifier. Il requiert d’organiser le Web de Données autour de répertoires personnels et décentralisés combinant à la fois la représentation d’un individu, son identification (et authentification) ainsi que ses informations tout en gérant leur accès.
Bien que le web sémantique contienne ses propres modèles identitaires (FOAF and WebID) et protocoles chargés d’identifier et autoriser des communications entre différentes parties (FOAF+SSL), il n’existe pour l’instant aucune plateforme combinant ces différentes technologies.
Asterid est un serveur de données sémantiques qui permet d’organiser et de partager des informations structurées autour de répertoires de données privées et personnelles tout en supportant l’identification et authentification de leur créateur et utilisateur.
Notre présentation sera l’occasion de montrer les différents modèles nécessaires au développement d’une telle architecture : le Web de données, l’ontologie FOAF, le protocole d’identification FOAF+SSL ainsi que la gestion de contrôle d’accès sur le Web Sémantique. Notre présentation alternera entre l’introduction de ces modèles théoriques et leur effective application dans la plateforme Asterid.
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
Support de l'intervention effectuée au cours de la séance dédiée aux lacs de données du séminaire "Nouveaux paradigmes de l'Archive" organisée par le DICEN-CNAM et les Archives nationales
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueGautier Poupeau
Ce diaporama est le 3ème d'une série qui vise à donner un panorama de la gestion des données à l'ère du big data et de l'intelligence artificielle. Cette partie s'attache à présenter comment on passe de la modélisation des données jusqu'à leur stockage. Elle dresse un panorama des différentes solutions de stockage de données, en présente les particularités, les forces et les faiblesses.
Visite guidée au pays de la donnée - Traitement automatique des donnéesGautier Poupeau
Ce diaporama est le 2ème d'une série qui vise à donner un panorama de la gestion des données à l'ère du big data et de l'intelligence artificielle. Cette 2ème partie présente le traitement automatique des données : intelligence artificielle, fouille de textes et de données, Traitement automarique de la langue ou des images. Après avoir défini ces différents domaines, cette présentation s'attache à faire le tour des différents outils disponibles pour analyser les contenus audiovisuels.
Visite guidée au pays de la donnée - Introduction et tour d'horizonGautier Poupeau
Ce diaporama est le 1er d'une série qui vise à donner un panorama de la gestion des données à l'ère du big data et de l'intelligence artificielle. Cette 1ère partie revient sur les raisons qui font de la donnée un actif indépendant de notre SI et propose une représentation de la gestion des données
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?Gautier Poupeau
Support de l'intervention effectuée lors des lundis du numérique de l'INHA le 11 février 2019 sur le projet à l'institut national de l'audiovisuel d'une stratégie orientée données pour la refonte de notre système d'information basée sur la mise au point d'une infrastructure centralisée de stockage et de traitement des données et un modèle de données unique pour mettre en cohérence toutes les données de l'Ina
Big data, Intelligence artificielle, quelles conséquences pour les profession...Gautier Poupeau
Support du Webinaire organisé le 21 février par Ina Expert sur l'évolution du positionnement des professionnels de l'information dans les organisations face aux changements en cours que sont la montée en puissance des données au détriment du document, le big data et l'intelligence artificielle
Aligner vos données avec Wikidata grâce à l'outil Open RefineGautier Poupeau
Tutoriel sous la forme d'un pas à pas pour aligner des données avec Wikidata grâce à l'outil Open Refine. Dans ce tutoriel, les données alignées proviennent de la plateforme HAL récupérées via le Sparql endpoint.
Tutoriel sous forme d'exercices pour découvrir le sparql endpoint mis à disposition par la plateforme HAL, archive ouverte d'article scientifiques de toutes disciplines des institutions de recherches françaises. Attention ! Ce tutoriel a pour pré-requis la connaissance du langage de requêtes SPARQL.
Réalisation d'un mashup de données avec DSS de Dataiku et visualisation avec ...Gautier Poupeau
cf. la première partie : https://www.slideshare.net/lespetitescases/ralisation-dun-mashup-de-donnes-avec-dss-de-dataiku-premire-partie
Tutoriel pour réaliser un mashup à partir de jeux de données libres téléchargés sur data.gouv.fr et Wikidata entre autres avec le logiciel DSS de Dataiku. Cette deuxième partie permet d'aborder le requêtage de Wikidata avec une requête SPARQL puis montre comment relier les jeux de données de data.gouv.fr et les données issues de Wikidata. Enfin, il aborde la visualisation des données via l'application en ligne Palladio.
Ce tutoriel a servi de support de cours au Master 2 "Technologies numériques appliqués à l'histoire" de l'Ecole nationale des chartes lors de l'année universitaire 2016-2017.
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieGautier Poupeau
Cf la seconde partie https://www.slideshare.net/lespetitescases/ralisation-dun-mashup-de-donnes-avec-dss-de-dataiku-et-visualisation-avec-palladio-deuxime-partie
Tutoriel pour réaliser un mashup à partir de jeux de données libres téléchargés sur data.gouv.fr et Wikidata entre autres avec le logiciel DSS de Dataiku. Après une introduction sur la notion de mashup et des exemples, cette première partie s'intéresse à la préparation de deux jeux de données issues de data.gouv.fr et provenant du Centre national du cinéma.
Ce tutoriel a servi de support de cours au Master 2 "Technologies numériques appliqués à l'histoire" de l'Ecole nationale des chartes lors de l'année universitaire 2016-2017.
Diaporama de la présentation faite lors du Talend Connect 2016 sur la stratégie orientée données déployée à l'Institut national de l'audiovisuel (Ina). Pour en savoir plus, vous pouvez lire ce billet de blog : http://www.lespetitescases.net/comment-mettre-la-donnee-au-coeur-du-si
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Gautier Poupeau
Diaporama de la présentation effectuée au séminaire INRIA IST "Le document à l'heure du Web de données" (Carnac 1er-5 octobre 2012) en compagnie d'Emmanuelle Bermès (aka figoblog)
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Gautier Poupeau
Diaporama de la présentation effectuée au séminaire INRIA IST "Le document à l'heure du Web de données" (Carnac 1er-5 octobre 2012) en compagnie d'Emmanuelle Bermès (aka figoblog)
How to use index to highlight social networks
in historical digital corpora ?
Présentation à Digital Humanities, 6 juillet 2006 (Paris).
Attention, c\'est un peu vieilli...
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Laurent Speyser
(Conférence dessinée)
Vous êtes certainement à l’origine, ou impliqué, dans un changement au sein de votre organisation. Et peut être que cela ne se passe pas aussi bien qu’attendu…
Depuis plusieurs années, je fais régulièrement le constat de l’échec de l’adoption de l’Agilité, et plus globalement de grands changements, dans les organisations. Je vais tenter de vous expliquer pourquoi ils suscitent peu d'adhésion, peu d’engagement, et ils ne tiennent pas dans le temps.
Heureusement, il existe un autre chemin. Pour l'emprunter il s'agira de cultiver l'invitation, l'intelligence collective , la mécanique des jeux, les rites de passages, .... afin que l'agilité prenne racine.
Vous repartirez de cette conférence en ayant pris du recul sur le changement tel qu‘il est généralement opéré aujourd’hui, et en ayant découvert (ou redécouvert) le seul guide valable à suivre, à mon sens, pour un changement authentique, durable, et respectueux des individus! Et en bonus, 2 ou 3 trucs pratiques!
L'IA connaît une croissance rapide et son intégration dans le domaine éducatif soulève de nombreuses questions. Aujourd'hui, nous explorerons comment les étudiants utilisent l'IA, les perceptions des enseignants à ce sujet, et les mesures possibles pour encadrer ces usages.
Constat Actuel
L'IA est de plus en plus présente dans notre quotidien, y compris dans l'éducation. Certaines universités, comme Science Po en janvier 2023, ont interdit l'utilisation de l'IA, tandis que d'autres, comme l'Université de Prague, la considèrent comme du plagiat. Cette diversité de positions souligne la nécessité urgente d'une réponse institutionnelle pour encadrer ces usages et prévenir les risques de triche et de plagiat.
Enquête Nationale
Pour mieux comprendre ces dynamiques, une enquête nationale intitulée "L'IA dans l'enseignement" a été réalisée. Les auteurs de cette enquête sont Le Sphynx (sondage) et Compilatio (fraude académique). Elle a été diffusée dans les universités de Lyon et d'Aix-Marseille entre le 21 juin et le 15 août 2023, touchant 1242 enseignants et 4443 étudiants. Les questionnaires, conçus pour étudier les usages de l'IA et les représentations de ces usages, abordaient des thèmes comme les craintes, les opportunités et l'acceptabilité.
Résultats de l'Enquête
Les résultats montrent que 55 % des étudiants utilisent l'IA de manière occasionnelle ou fréquente, contre 34 % des enseignants. Cependant, 88 % des enseignants pensent que leurs étudiants utilisent l'IA, ce qui pourrait indiquer une surestimation des usages. Les usages identifiés incluent la recherche d'informations et la rédaction de textes, bien que ces réponses ne puissent pas être cumulées dans les choix proposés.
Analyse Critique
Une analyse plus approfondie révèle que les enseignants peinent à percevoir les bénéfices de l'IA pour l'apprentissage, contrairement aux étudiants. La question de savoir si l'IA améliore les notes sans développer les compétences reste débattue. Est-ce un dopage académique ou une opportunité pour un apprentissage plus efficace ?
Acceptabilité et Éthique
L'enquête révèle que beaucoup d'étudiants jugent acceptable d'utiliser l'IA pour rédiger leurs devoirs, et même un quart des enseignants partagent cet avis. Cela pose des questions éthiques cruciales : copier-coller est-il tricher ? Utiliser l'IA sous supervision ou pour des traductions est-il acceptable ? La réponse n'est pas simple et nécessite un débat ouvert.
Propositions et Solutions
Pour encadrer ces usages, plusieurs solutions sont proposées. Plutôt que d'interdire l'IA, il est suggéré de fixer des règles pour une utilisation responsable. Des innovations pédagogiques peuvent également être explorées, comme la création de situations de concurrence professionnelle ou l'utilisation de détecteurs d'IA.
Conclusion
En conclusion, bien que l'étude présente des limites, elle souligne un besoin urgent de régulation. Une charte institutionnelle pourrait fournir un cadre pour une utilisation éthique.
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...OCTO Technology
Par Nicolas Bordier (Consultant numérique responsable @OCTO Technology) et Alaric Rougnon-Glasson (Sustainable Tech Consultant @OCTO Technology)
Sur un exemple très concret d’audit d’éco-conception de l’outil de bilan carbone C’Bilan développé par ICDC (Caisse des dépôts et consignations) nous allons expliquer en quoi l’ACV (analyse de cycle de vie) a été déterminante pour identifier les pistes d’actions pour réduire jusqu'à 82% de l’empreinte environnementale du service.
Vidéo Youtube : https://www.youtube.com/watch?v=7R8oL2P_DkU
Compte-rendu :
OCTO TALKS : 4 Tech Trends du Software Engineering.pdfOCTO Technology
En cette année 2024 qui s’annonce sous le signe de la complexité, avec :
- L’explosion de la Gen AI
-Un contexte socio-économique sous tensions
- De forts enjeux sur le Sustainable et la régulation IT
- Une archipélisation des lieux de travail post-Covid
Découvrez les Tech trends incontournables pour délivrer vos produits stratégiques.
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...OCTO Technology
par Claude Camus (Coach agile d'organisation @OCTO Technology) et Gilles Masy (Organizational Coach @OCTO Technology)
Les équipes infrastructure, sécurité, production, ou cloud, doivent consacrer du temps à la modernisation de leurs outils (automatisation, cloud, etc) et de leurs pratiques (DevOps, SRE, etc). Dans le même temps, elles doivent répondre à une avalanche croissante de demandes, tout en maintenant un niveau de qualité de service optimal.
Habitué des environnements développeurs, les transformations agiles négligent les particularités des équipes OPS. Lors de ce comptoir, nous vous partagerons notre proposition de valeur de l'agilité@OPS, qui embarquera vos équipes OPS en Classe Business (Agility), et leur fera dire : "nous ne reviendrons pas en arrière".
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
A la découverte du Web sémantique
1. A la découverte de la planète Web sémantique Gautier Poupeau <http://www.lespetitescases.net/foaf_got.rdf#GP> gautier.poupeau@lespetitescases.net
2. A la rencontre de cette mystérieuse planète et de quelques autochtones…
3. Le Web sémantique Le Web L’intelligence artificielle Les moteurs de recherche La constellation du Web sémantique XML La linguistique Les BDR La théorie des graphes Métadonnées
4. Quelques caractéristiques de la planète Web sémantique Certains pensent que la prochaine évolution du Web passera par les technologies du Web sémantique. Rapport avec le Web 3.0 Presque aucun… Rapport avec la « sémantique » Article de Tim Berners-Lee, Ora Lassila et James Hendler dans la revue Scientific American en 2001 Acte de naissance officielle Tim Berners-Lee Gourou du Web sémantique Concept Activité du W3C Ensemble de technologies Nature du Web sémantique 2 octobre 1997 Premières « working draft » au W3C
5. « The Semantic Web is a web of data, in some ways like a global database » « The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation. » « Il existe un énorme gisement de données enfouies dans tous les ordinateurs de la planète : en les reliant, le Web sémantique permettra d'exploiter cette mine pour améliorer nos connaissances dans de nombreux domaines.» Tim Berners-Lee, père fondateur du Web et du Web sémantique, W3C
6. « But the second big trend then is to decouple the data from the application or the application services, so that in that sense what you can do is write your application or create services independent of the data sources they have to deal with, which comes full circle back to having a virtual layer between application services and data. The application can go out and find whatever data sources are best to use for that particular question. That’s what semantic technology provides for enterprise information management. » Robert Shimp, Vice-président division « Global technology business », Oracle
7. « The reason I got involved with the Semantic Web was...I wanted control of my data. » David Beckett, Software architect, Yahoo!
8. « As I mentioned above, hyperdata is to data what hypertext is to text. Hyperdata is a great word -- it is so simple and yet makes a big point. It's about data that links to other data. It does for data what hypertext does for text. That's what RDF and the Semantic Web are really all about. » Nova Spivack, CEO, Radar Networks et créateur de la première application Web 3.0, Twine
9. Christian Fauré, Senior manager, Atos Origin « Avec les normes du web sémantique, il n’y a plus d’APIs. La qualité des données passe par l’environnement de description des ressources que sont ces données. Les données sont mises à nu, plus besoin d’APIs. C’est là que l’intérêt du jeu est décuplé : quand on n’a plus de contraintes dans la manière dont on peut utiliser les données elles-mêmes, il y toujours plus de plaisir. »
10. Pour résumer, les technologies du Web sémantique introduisent un nouveau paradigme Avant Après Les usages L’application Les données Les données Les usages L’application API Les données L’application Les usages Les usages L’application Les données API
34. SP AR QL Interroger, accéder, transporter les données en RDF
35. Un langage de requêtes Un format pour les résultats Un protocole d’accès SP AR QL S PARQL P rotocol a nd R DF Q uery L anguage
36. SP AR QL : un langage de requêtes Tim Berners-Lee connaît des personnes . Ces personnes s’appellent ??? . Je veux connaître l’URI et les noms des personnes que connaît Tim Berners-Lee à partir de son fichier FOAF
37. Opérateurs : FILTER, OPTIONAL, UNION, ORDER BY, LIMIT, OFFSET <http://www.w3.org/People/Berners-Lee/card#i> foaf:knows ?personnes . ?personnes foaf:name ?nom . SELECT ?personnes ?nom FROM <http://www.w3.org/People/Berners-Lee/card> WHERE { } PREFIX foaf: <http://xmlns.com/foaf/0.1/> SP AR QL : un langage de requêtes Types de requêtes : ASK, CONSTRUCT, DESCRIBE LOAD, INSERT, DELETE (en cours de normalisation)
38.
39. SP AR QL : un format de résultats Un Web service normalisé selon l’architecture REST et SOAP SPARQL : une API universelle d’accès aux données ? Data Data Data Application API spécifique API spécifique API spécifique Appli Data RDF + SPARQL endpoint Data RDF + SPARQL endpoint Data RDF + SPARQL endpoint Sans RDF et SPARQL Avec RDF et SPARQL SPARQL
46. Web sémantique et data management Entreprise A Application Usages A Usages B Base de données Entreprise B Application Usages A Base de données Situation actuelle Base de données Usages C Application API API API Usages A Application Usages B Usages C Données en RDF + sparql endpoint Application Données en RDF + sparql endpoint Données en RDF + sparql endpoint Application Application SPARQL SPARQL Liens Alignement Usages A Avec les technologies du Web sémantique
47. Exemple : Linking Open data But : publier et relier des entrepôts de données en RDF sur le Web
48. Exemple : Dbpedia, http://www.dbpedia.org Interroger Wikipedia comme une base de données grâce à RDF Je voudrais tous les personnages de Star Trek avec leurs noms, éventuellement une image, une description en français et leur planète d’origine. SELECT ?nom ?nomplanet ?abstract ?image WHERE { ?character skos:subject <http://dbpedia.org/resource/Category:Star_Trek_film_characters>. ?character rdfs:label ?nom. OPTIONAL { ?character <http://xmlns.com/foaf/0.1/depiction> ?image. } OPTIONAL { ?character <http://dbpedia.org/property/abstract> ?abstract. FILTER (lang(?abstract)="fr") } OPTIONAL { ?character <http://dbpedia.org/property/planet> ?planet. ?planet rdfs:label ?nomplanet. FILTER (lang(?nomplanet)="en") } FILTER (lang(?nom)="en") }
50. Exemple d’utilisation de Dbpedia Mashup Dbpedia – Google Maps http://www.lespetitescases.net/dbpedia/
51. Le voyage est terminé pour aujourd’hui… Mais le prochain vol est prévu demain ! Qui est prêt à embarquer à bord ? Si vous voulez en savoir plus, RV sur Les petites cases Gautier Poupeau <http://www.lespetitescases.net/foaf_got.rdf#GP> gautier.poupeau@lespetitescases.net