Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
Cette étude vise à présenter les concepts clés d’une base de données orientée graphe. La modélisation et la mise en œuvre des cas d’utilisation seront réalisées avec la base de données NEO4J, version 3.1.
Slides de l'atelier JDEV2017 : SPARQL, avancé
Vous saurez après cet atelier : lire un document RDF écrit en Turtle, découvrir une ontologie au travers d’un service SPARQL et lire la documentation officielle de SPARQL.
Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
Cette étude vise à présenter les concepts clés d’une base de données orientée graphe. La modélisation et la mise en œuvre des cas d’utilisation seront réalisées avec la base de données NEO4J, version 3.1.
Slides de l'atelier JDEV2017 : SPARQL, avancé
Vous saurez après cet atelier : lire un document RDF écrit en Turtle, découvrir une ontologie au travers d’un service SPARQL et lire la documentation officielle de SPARQL.
Concevoir un outil d'analyse de réseau en ligneNahid Oulmi
Voici une restitution d'un projet que nous avons réalisé au cours de l'année. Sous l'impulsion de collègues économistes qui avaient pour objectif de pouvoir analyser un grand réseau d'auteurs (le REPEC), nous avons crée une base de données sémantique permettant d'analyser de ce réseau. Nous avons posé les premières briques (mining et structuration des données, intégration dans une base sémantique) de ce projet qui continue de prospérer.
Support 5 de la journée d'études du 09 déc. 2013 sur l'évolution des catalogues et du catalogage organisée par le CRFCB de Marseille avec les formateurs du groupe technique sur l'adoption de RDA en France.
A Brief History of Database Management (SQL, NoSQL, NewSQL)Abdelkader OUARED
What's the Difference Between SQL, NoSQL, and NewSQL
SQL is a relational database management system (RDBMS) based on ... NewSQL tries to bring some of the features and scalability of NoSQL to SQL.
Les éléments d'indexation dans la DTD-EADDanis Habib
Une présentation élaborée par un groupe de travail sur la DTD-EAD que j'avais récupéré pour une formation sur l'indexation : quels sont les éléments d'indexation utilisés dans la DTD-EAD?
La solution GDI (Global Data Inquirer) est une solution de data science développée par Assystem.
Elle permet d’extraire une description exhaustive des installations (ontologies) et d’alimenter :
- des bases de données propriétaires
- des modèles de simulations ou MBSE (ingénierie système basée sur les modèles)
- un moteur de recherche sémantique
Les informations pertinentes accumulées sur toute la durée vie d’une installation, sont ainsi rapidement accessibles malgré la masse de documents.
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
Diaporama pour une communication donnée dans le cadre de la journée d'études ADBS-EDB, "Quel Web demain ?", 7 avril 2009, http://www.adbs.fr/quel-web-demain--57415.htm
Ce étude vise à présenter la platforme Spark et les opérations (Transformation et Action) d'une RDD. Les points abordés sont Spark motivation, Positionnement de Spark dans l'écosystème BigData, Composants de Spark, Drivers et Workers, RDD & caractéristiques, vue logique de spark, vue globale sur les APIs Spark (dépendance et interaction), les différentes opérations de spark. Chaque opération est sur une fiche (objectif, signature, "à retenir" et exemple de code).
Présentation sur la démarche de l'Open Data (quelles données ? Quels acteurs ?) et sur les technologies gravitant autour du Linked Data (le modèle RDF, RDFS, OWL, les ontologies, les triplestores, etc).
JABES 2016 - DALLOZ et le SCD de l’Université de StrasbourgABES
L'analyse qualitative des métadonnées et les traitements, sans collaboration de l’éditeur.
Catherine Storne
SCD Université de Strasbourg
JABES 2016 – 10/05/2016 – Session 1
Objectif général : Concevoir une base de données
Objectifs opérationnels :
- Comprendre les différents concepts entourant les BD
- Comprendre les concepts associés aux BD relationnelles
- Établir un dictionnaire de données (DD)
- Structurer les données du DD
- Construire un Modèle Conceptuel des Données (MCD)
- Transformer un MCD en Modèle logique de données (MLD)
- Normaliser un MLD
Le Web sémantique est-il un n-ième standard de représentation des données ou une nouvelle façon d’aborder la recherche d’information ?
L'utilisation du terme « Sémantique » a souvent été porteur de confusions donnant à penser que le Web sémantique visait la compréhension du langage naturel par les machines. Même si les objectifs réels du Web sémantique semblent en réalité éloignées des techniques du traitement automatique de la langue, les technologies du Web sémantique n'en restent pas moins intéressantes pour les solutions d'accès et de recherche d'information. En effet, celles-ci sont déployée dans des contextes de plus en plus complexes mêlant données structurées et données non structurées et, dans ce cadre, les technologies du Web sémantique permettent de résoudre de nombreux problèmes de par le cadre d'interopérabilité et l'écosystème de standards et d'outils qu'elles offrent.
Impliqués depuis plusieurs années dans le domaine, nous montrerons comment les technologies du Web sémantique aide les équipes Antidot à mieux gérer, traiter et valoriser les données de leurs clients. Dans cette présentation, nous parcourrons une palette assez large de manipulations des objets sémantiques pratiquées couramment dans nos réalisations et basées sur les technologies du Web sémantique.
Nous illustrerons notre exposé par des réalisations concrètes et nous montrerons en quoi l’utilisation du Web sémantique nous a épargné des heures de développements spécifiques et nous a permis d’adresser des problématiques de plus en plus complexes.
Nous aborderons notamment l’extension sémantique, la navigation par facette, la mise en relation de silos d’informations hétérogènes, l’alignement des données sur des référentiels, l’utilisation du Web des données et d’autres techniques originales que nous avons développées pour la nouvelle version d’AFS.
Concevoir un outil d'analyse de réseau en ligneNahid Oulmi
Voici une restitution d'un projet que nous avons réalisé au cours de l'année. Sous l'impulsion de collègues économistes qui avaient pour objectif de pouvoir analyser un grand réseau d'auteurs (le REPEC), nous avons crée une base de données sémantique permettant d'analyser de ce réseau. Nous avons posé les premières briques (mining et structuration des données, intégration dans une base sémantique) de ce projet qui continue de prospérer.
Support 5 de la journée d'études du 09 déc. 2013 sur l'évolution des catalogues et du catalogage organisée par le CRFCB de Marseille avec les formateurs du groupe technique sur l'adoption de RDA en France.
A Brief History of Database Management (SQL, NoSQL, NewSQL)Abdelkader OUARED
What's the Difference Between SQL, NoSQL, and NewSQL
SQL is a relational database management system (RDBMS) based on ... NewSQL tries to bring some of the features and scalability of NoSQL to SQL.
Les éléments d'indexation dans la DTD-EADDanis Habib
Une présentation élaborée par un groupe de travail sur la DTD-EAD que j'avais récupéré pour une formation sur l'indexation : quels sont les éléments d'indexation utilisés dans la DTD-EAD?
La solution GDI (Global Data Inquirer) est une solution de data science développée par Assystem.
Elle permet d’extraire une description exhaustive des installations (ontologies) et d’alimenter :
- des bases de données propriétaires
- des modèles de simulations ou MBSE (ingénierie système basée sur les modèles)
- un moteur de recherche sémantique
Les informations pertinentes accumulées sur toute la durée vie d’une installation, sont ainsi rapidement accessibles malgré la masse de documents.
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
Diaporama pour une communication donnée dans le cadre de la journée d'études ADBS-EDB, "Quel Web demain ?", 7 avril 2009, http://www.adbs.fr/quel-web-demain--57415.htm
Ce étude vise à présenter la platforme Spark et les opérations (Transformation et Action) d'une RDD. Les points abordés sont Spark motivation, Positionnement de Spark dans l'écosystème BigData, Composants de Spark, Drivers et Workers, RDD & caractéristiques, vue logique de spark, vue globale sur les APIs Spark (dépendance et interaction), les différentes opérations de spark. Chaque opération est sur une fiche (objectif, signature, "à retenir" et exemple de code).
Présentation sur la démarche de l'Open Data (quelles données ? Quels acteurs ?) et sur les technologies gravitant autour du Linked Data (le modèle RDF, RDFS, OWL, les ontologies, les triplestores, etc).
JABES 2016 - DALLOZ et le SCD de l’Université de StrasbourgABES
L'analyse qualitative des métadonnées et les traitements, sans collaboration de l’éditeur.
Catherine Storne
SCD Université de Strasbourg
JABES 2016 – 10/05/2016 – Session 1
Objectif général : Concevoir une base de données
Objectifs opérationnels :
- Comprendre les différents concepts entourant les BD
- Comprendre les concepts associés aux BD relationnelles
- Établir un dictionnaire de données (DD)
- Structurer les données du DD
- Construire un Modèle Conceptuel des Données (MCD)
- Transformer un MCD en Modèle logique de données (MLD)
- Normaliser un MLD
Le Web sémantique est-il un n-ième standard de représentation des données ou une nouvelle façon d’aborder la recherche d’information ?
L'utilisation du terme « Sémantique » a souvent été porteur de confusions donnant à penser que le Web sémantique visait la compréhension du langage naturel par les machines. Même si les objectifs réels du Web sémantique semblent en réalité éloignées des techniques du traitement automatique de la langue, les technologies du Web sémantique n'en restent pas moins intéressantes pour les solutions d'accès et de recherche d'information. En effet, celles-ci sont déployée dans des contextes de plus en plus complexes mêlant données structurées et données non structurées et, dans ce cadre, les technologies du Web sémantique permettent de résoudre de nombreux problèmes de par le cadre d'interopérabilité et l'écosystème de standards et d'outils qu'elles offrent.
Impliqués depuis plusieurs années dans le domaine, nous montrerons comment les technologies du Web sémantique aide les équipes Antidot à mieux gérer, traiter et valoriser les données de leurs clients. Dans cette présentation, nous parcourrons une palette assez large de manipulations des objets sémantiques pratiquées couramment dans nos réalisations et basées sur les technologies du Web sémantique.
Nous illustrerons notre exposé par des réalisations concrètes et nous montrerons en quoi l’utilisation du Web sémantique nous a épargné des heures de développements spécifiques et nous a permis d’adresser des problématiques de plus en plus complexes.
Nous aborderons notamment l’extension sémantique, la navigation par facette, la mise en relation de silos d’informations hétérogènes, l’alignement des données sur des référentiels, l’utilisation du Web des données et d’autres techniques originales que nous avons développées pour la nouvelle version d’AFS.
Similar to Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques (unicas & presse locale) (20)
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...M2i Formation
Suite à l'entrée en vigueur de la « Participation Financière Obligatoire » le 2 mai dernier, les règles du jeu ont changé !
Pour les entreprises, cette révolution du dispositif est l'occasion de revoir sa stratégie de formation pour co-construire avec ses salariés un plan de formation alliant performance de l'organisation et engagement des équipes.
Au cours de ce webinar de 20 minutes, co-animé avec la Caisse des Dépôts et Consignations, découvrez tous les détails actualisés sur les dotations et les exonérations, les meilleures pratiques, et comment maximiser les avantages pour les entreprises et leurs salariés.
Au programme :
- Principe et détails de la « Participation Financière Obligatoire » entrée en vigueur
- La dotation : une opportunité à saisir pour co-construire sa stratégie de formation
- Mise en pratique : comment doter ?
- Quelles incidences pour les titulaires ?
Webinar exclusif animé à distance en coanimation avec la CDC
Newsletter SPW Agriculture en province du Luxembourg du 03-06-24BenotGeorges3
Les informations et évènements agricoles en province du Luxembourg et en Wallonie susceptibles de vous intéresser et diffusés par le SPW Agriculture, Direction de la Recherche et du Développement, Service extérieur de Libramont.
https://agriculture.wallonie.be/home/recherche-developpement/acteurs-du-developpement-et-de-la-vulgarisation/les-services-exterieurs-de-la-direction-de-la-recherche-et-du-developpement/newsletters-des-services-exterieurs-de-la-vulgarisation/newsletters-du-se-de-libramont.html
Bonne lecture et bienvenue aux activités proposées.
#Agriculture #Wallonie #Newsletter #Recherche #Développement #Vulgarisation #Evènement #Information #Formation #Innovation #Législation #PAC #SPW #ServicepublicdeWallonie
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques (unicas & presse locale)
1. Unicas & presse locale ancienne
sont dans une interface…
POUR UNE APPLICATION DE VISUALISATION ET D’EXPLORATION DES
DONNÉES.
2. Le contexte
Point de départ : valorisation de 2 corpus spécifiques de périodiques :
Unicas et presse locale ancienne
Axe « Valorisation des collections » dans notre convention sur objectifs :
- Évaluer nos collections
- améliorer leur visibilité
- Qualité des données et signalement
Moyen :
- Création et mise en ligne d’un outil de visualisation des données du CR basé sur
les web services du Sudoc
4. Traduction en Excel
Fichier des unicas Sudoc Fichier des titres de presse locale BnF
5. Traduction en langage graphe (my name is Graph, Property Graph)
Node 2
Node 4
Node 1
Node 5
Node 3
Etapes
- On modélise le graphe (quelles sont les ressources – les nœuds – et quelles sont
leurs relations – connues et à construire - ?)
- On fait un chargement initial de données à minima dans la BDD et on automatise
les enrichissements par des requêtes directement dans le graphe
- On développe l’application au-dessus de la BDD
• pour exposer les données (exports Excel et API)
• pour proposer une interface web de visualisation
6. Pour bien commencer : déterminer les entités que l’on veut étudier = les nœuds
génériques du graphe
Bibliothèques
Titres unicas
Titres presse
loc. anc.
Titres presse
loc. anc.
numérisés
{Nom,rcr,lat,lon}
{titre,ppn,issn,309}
{titre,ark,issn}
{url,étab}
OWNED_BY
{etatd_de_coll}
HAS_VERSION
Départements
{Nom,numéro}
L
O
C
A
T
E
D
IS_ABOUT
S
A
M
E
_
A
S
7. Petit aparté : la souplesse d’une modélisation de type Property Graph est aussi sa
principale difficulté
On aurait pu faire complètement différemment… d’ailleurs il n’est pas certain du tout que ce soit
meilleure manière de modéliser.
La question essentielle qui doit guider la structuration interne du graphe est : quelles sont les
questions auxquelles je veux pouvoir répondre ?
Unicas
ppn
issnHAS_ID
Presselocale
HAS_ID
ark
Sudoc
BELONGS_TO
BnFBELONGS_TO
MATCH
8. Petite mise au point : quand on parle de graphe, on pense web de données et
RDF…
Mais il n’y a pas que le RDF dans la vie !
RDF
Triplets sujet-prédicat-objet
S’appuie sur des uri pour identifier les
ressources, et des ontologies pour
qualifier les ressources et les
prédicats
A pour objectif de modéliser et
formaliser les données et leurs
connexions selon un standard
Qui permette leur intégration dans le
web (indexation moteurs de
recherche, accès web, navigation,
échange)
Un stockage en triple store accessible
par un Endpoint
Un langage de requête SPARQL
Propriété de graphe (Graph
Property)
Des nœuds liés par des relations
Nœuds et liens peuvent être qualifiés
par des propriétés (formalisées
comme des objets clé-valeur), sans
schéma posé à priori.
Structuration optimisée pour le
stockage et le parcours de graphe (le
requêtage et la navigation dans les
données)
Des langages de requêtes selon la
bdd choisie (Neo4j, ArangoDB…)
10. Les sources de données
Bibs de l’ILN 230
https://www.idref.fr/services/iln2rcr/230
Ppn des unicas
Self Sudoc
Site BnF presse loc.
anc.
http://presselocaleancienne.bnf.fr/accueil
11. Peut mieux faire…
Sudoc web service multiwhere
https://www.sudoc.fr/services/multiwher
e/<ppn>
Sudoc web service
UNIMARC/MARCXML
http://www.sudoc.fr/<ppn>.xml
BnF : SRU
http://catalogue.bnf.fr/api/SRU?version=
1.2&operation=searchRetrieve&query=b
ib.persistentid%20adj%20%22<ark>%22
&recordSchema=unimarcxchange
Sudoc web service issn2ppn
http://www.sudoc.fr/services/issn2ppn/<i
ssn>
12. Interface web
Client Side
(librairies
JS)
Connexion à
la BDD
Graphe
Distribution des données
Server side
(Express) :
API
Données
Json + doc
SWagger
BDD/ETL Neo4j
node
1
node
5
node
2
node
3
node
4
Client side :
Exploitation
API
Tableaux
Widgets
13.
14.
15.
16.
17.
18. Pour en savoir plus
Liens vers les billets de blogs (passés et à venir)
http://bibliotheque-blogs.unice.fr/sudoc-ps/
http://bibliotheque-blogs.unice.fr/sudoc-ps/tag/valorisation-des-collections/
Code source
Le code de l’application sera disponible en open source dès que l’application sera finalisée (à
la rentrée universitaire 2019).
En attendant :
- https://github.com/gegedenice/angular-sudocps-unicas : pour créer une page web listant
vos unicas (voir par exemple l’adaptation du code par le CR Rhône-Alpes https://bu.univ-
grenoble-alpes.fr/CR69/index.html).
- https://gist.github.com/gegedenice/c7e53cc4c3d65b8bc1639d4b55a90be6 : un gist avec
les requêtes en langage Cypher utilisées pour charger et enrichir les données dans Neo4j.
Nous contacter
Sudocps-scd@unice.fr
geoffroy@unice.fr