Solr + Hadoop - Fouillez facilement dans votre système Big Datafrancelabs
Un système Hadoop a pour but de facilement gérer le Big Data, que ce soit en termes de stockage comme en termes de calculs. Il ne se focalise pas sur l’exploration des données qu’il héberge. Le moteur de recherche Apache Solr devient l’outil de recherche de référence dans l’écosystème Hadoop, adopté par Cloudera et HortonWorks. Dans cette intervention, ils présentent d’abord un historique des 2 projets, pour bien comprendre leurs liens. Ils expliquent ensuite les différents niveaux d’intégrations possibles, et ils terminent par une démonstration d’intégration, afin de comprendre les avantages d’utiliser Solr pour explorer le big data d’un Hadoop.
Solr, c'est simple et Big Data ready - prez au Lyon jug Fév 2014francelabs
Découvrez les outils open source de Search qui ont déjà convaincu de nombreuses entreprises, et qui est proposé par la fondation Apache: Lucene / Solr. Dans la première partie, histoire de savoir de quoi on parle, Aurélien vous présentera les projets Lucene et Solr, leurs composants, leur architecture, leurs features, et on saupoudrera tout ça de scalabilité avec SolrCloud.
En deuxième partie, Aurélien vous présentera l'écosystème (ou du moins une partie) qui gravite autour de Lucene /Solr: ManifoldCF qui permet de gérer les connexions aux sources de données (avec démo d'indexation de contenu et recherche en live), Hadoop, car il faut bien parler de Big Data, et parce que Solr devient un des outils de référence pour faire du search sur Hadoop (avec là encore une démo d'interaction Hadoop et Solr). Avec tout ça vous aurez dans vos bagages de quoi gérer des Big projets avec du Big search dedans.
Actuellement, on parle beaucoup de traitement en lots (batch) dans le monde du Big Data. Mais qu’en est-il du Streaming et du temps réel ? Beaucoup de frameworks Big Data tentent de répondre à cette problématique. En tête de liste figure Spark : grâce à son composant Spark Streaming, il permet un traitement en continu des flux de données et une disponibilité 24/7.
Au programme :
- Streaming et Architecture Big Data
- Hello world Spark Streaming
- Intégration de Flume à Spark Streaming
- Use case “métriques sur des logs applicatifs”
- Architecture physique : driver / workers / receivers
- Monitoring de Spark Streaming
- Fail over : reliable / unreliable sources, checkpoint, recover
- Tuning et performance.
Speakers :
- Nadhem LAMTI, Architecte Technique chez PALO IT
Depuis 10 ans, Nadhem intervient principalement sur des projets JAVA JEE de grande envergure dans différents secteurs (Télécommunication, Banque, Finance, Transports, Tourisme, etc.), développant ainsi une expertise polyvalente en abordant multiples technologies et architectures. Fort d’une expérience concluante en tant qu’Ingénieur Performance & Support, Nadhem est capable d’intervenir sur des problématiques de production liées à des systèmes d’informations complexes. Actuellement en mission chez Voyages SNCF, il contribue à un grand chantier Big Data de centralisation de logs et s’intéresse tout particulièrement au nouveau produit phare de traitement de données Apache Spark.
- Saâd-Eddine MALTI, Expert BDD chez Voyages SNCF
En poste depuis 10 ans chez Voyages SNCF, Saâd-Eddine intervient en tant qu’Expert BDD sur toutes les applications de manière transverse. L’orientation affichée de Voyages SNCF vers le Big Data pousse Saâd-Eddine à s’investir pleinement dans ce domaine, également sur le nouveau produit phare de traitement de données Apache Spark.
Soirée Search Lucene/Solr
Découvrez les outils open source de Search qui ont déjà convaincu de nombreuses entreprises, et qui est proposé par la fondation Apache: Lucene / Solr.
Dans la première partie de soirée, histoire de savoir de quoi on parle, Olivier vous présentera les projets Lucene et Solr, leurs composants, leur architecture, leurs features, et on saupoudrera tout ça de scalabilité avec SolrCloud (avec démo).
En deuxième partie de soirée, Olivier vous présentera l’écosystème (ou du moins une partie) qui gravite autour de Lucene /Solr: ManifoldCF qui permet de gérer les connexions aux sources de données (avec démo d’indexation de contenu et recherche en live grâce à Datafari) et Hadoop, car il faut bien parler de Big Data, et parce que Solr devient un des outils de référence pour faire du search sur Hadoop.
Avec tout ça vous aurez dans vos bagages de quoi gérer des Big projets avec du Big search dedans.
www.francelabs.com
www.datafari.com
Ce étude vise à présenter la platforme Spark et les opérations (Transformation et Action) d'une RDD. Les points abordés sont Spark motivation, Positionnement de Spark dans l'écosystème BigData, Composants de Spark, Drivers et Workers, RDD & caractéristiques, vue logique de spark, vue globale sur les APIs Spark (dépendance et interaction), les différentes opérations de spark. Chaque opération est sur une fiche (objectif, signature, "à retenir" et exemple de code).
Besoin de rien Envie de Search - Presentation Lucene Solr ElasticSearchfrancelabs
Cette présentation donne un comparatif sur les technologie de recherche open source que sont Apache Solr et ElasticSearch. Après avoir introduit brièvement les notions de moteur de recherche open source pour entreprise, Lucene, Solr et ElasticSearch seront expliqués.
Solr + Hadoop - Fouillez facilement dans votre système Big Datafrancelabs
Un système Hadoop a pour but de facilement gérer le Big Data, que ce soit en termes de stockage comme en termes de calculs. Il ne se focalise pas sur l’exploration des données qu’il héberge. Le moteur de recherche Apache Solr devient l’outil de recherche de référence dans l’écosystème Hadoop, adopté par Cloudera et HortonWorks. Dans cette intervention, ils présentent d’abord un historique des 2 projets, pour bien comprendre leurs liens. Ils expliquent ensuite les différents niveaux d’intégrations possibles, et ils terminent par une démonstration d’intégration, afin de comprendre les avantages d’utiliser Solr pour explorer le big data d’un Hadoop.
Solr, c'est simple et Big Data ready - prez au Lyon jug Fév 2014francelabs
Découvrez les outils open source de Search qui ont déjà convaincu de nombreuses entreprises, et qui est proposé par la fondation Apache: Lucene / Solr. Dans la première partie, histoire de savoir de quoi on parle, Aurélien vous présentera les projets Lucene et Solr, leurs composants, leur architecture, leurs features, et on saupoudrera tout ça de scalabilité avec SolrCloud.
En deuxième partie, Aurélien vous présentera l'écosystème (ou du moins une partie) qui gravite autour de Lucene /Solr: ManifoldCF qui permet de gérer les connexions aux sources de données (avec démo d'indexation de contenu et recherche en live), Hadoop, car il faut bien parler de Big Data, et parce que Solr devient un des outils de référence pour faire du search sur Hadoop (avec là encore une démo d'interaction Hadoop et Solr). Avec tout ça vous aurez dans vos bagages de quoi gérer des Big projets avec du Big search dedans.
Actuellement, on parle beaucoup de traitement en lots (batch) dans le monde du Big Data. Mais qu’en est-il du Streaming et du temps réel ? Beaucoup de frameworks Big Data tentent de répondre à cette problématique. En tête de liste figure Spark : grâce à son composant Spark Streaming, il permet un traitement en continu des flux de données et une disponibilité 24/7.
Au programme :
- Streaming et Architecture Big Data
- Hello world Spark Streaming
- Intégration de Flume à Spark Streaming
- Use case “métriques sur des logs applicatifs”
- Architecture physique : driver / workers / receivers
- Monitoring de Spark Streaming
- Fail over : reliable / unreliable sources, checkpoint, recover
- Tuning et performance.
Speakers :
- Nadhem LAMTI, Architecte Technique chez PALO IT
Depuis 10 ans, Nadhem intervient principalement sur des projets JAVA JEE de grande envergure dans différents secteurs (Télécommunication, Banque, Finance, Transports, Tourisme, etc.), développant ainsi une expertise polyvalente en abordant multiples technologies et architectures. Fort d’une expérience concluante en tant qu’Ingénieur Performance & Support, Nadhem est capable d’intervenir sur des problématiques de production liées à des systèmes d’informations complexes. Actuellement en mission chez Voyages SNCF, il contribue à un grand chantier Big Data de centralisation de logs et s’intéresse tout particulièrement au nouveau produit phare de traitement de données Apache Spark.
- Saâd-Eddine MALTI, Expert BDD chez Voyages SNCF
En poste depuis 10 ans chez Voyages SNCF, Saâd-Eddine intervient en tant qu’Expert BDD sur toutes les applications de manière transverse. L’orientation affichée de Voyages SNCF vers le Big Data pousse Saâd-Eddine à s’investir pleinement dans ce domaine, également sur le nouveau produit phare de traitement de données Apache Spark.
Soirée Search Lucene/Solr
Découvrez les outils open source de Search qui ont déjà convaincu de nombreuses entreprises, et qui est proposé par la fondation Apache: Lucene / Solr.
Dans la première partie de soirée, histoire de savoir de quoi on parle, Olivier vous présentera les projets Lucene et Solr, leurs composants, leur architecture, leurs features, et on saupoudrera tout ça de scalabilité avec SolrCloud (avec démo).
En deuxième partie de soirée, Olivier vous présentera l’écosystème (ou du moins une partie) qui gravite autour de Lucene /Solr: ManifoldCF qui permet de gérer les connexions aux sources de données (avec démo d’indexation de contenu et recherche en live grâce à Datafari) et Hadoop, car il faut bien parler de Big Data, et parce que Solr devient un des outils de référence pour faire du search sur Hadoop.
Avec tout ça vous aurez dans vos bagages de quoi gérer des Big projets avec du Big search dedans.
www.francelabs.com
www.datafari.com
Ce étude vise à présenter la platforme Spark et les opérations (Transformation et Action) d'une RDD. Les points abordés sont Spark motivation, Positionnement de Spark dans l'écosystème BigData, Composants de Spark, Drivers et Workers, RDD & caractéristiques, vue logique de spark, vue globale sur les APIs Spark (dépendance et interaction), les différentes opérations de spark. Chaque opération est sur une fiche (objectif, signature, "à retenir" et exemple de code).
Besoin de rien Envie de Search - Presentation Lucene Solr ElasticSearchfrancelabs
Cette présentation donne un comparatif sur les technologie de recherche open source que sont Apache Solr et ElasticSearch. Après avoir introduit brièvement les notions de moteur de recherche open source pour entreprise, Lucene, Solr et ElasticSearch seront expliqués.
Spark, ou comment traiter des données à la vitesse de l'éclairAlexis Seigneurin
Spark fait partie de la nouvelle génération de frameworks de manipulation de données basés sur Hadoop. L’outil utilise agressivement la mémoire pour offrir des temps de traitement jusqu’à 100 fois plus rapides qu'Hadoop. Dans cette session, nous découvrirons les principes de traitement de données (notamment MapReduce) et les options mises à disposition pour monter un cluster (Zookeper, Mesos…). Nous ferons un point sur les différents modules proposés par le framework, et notamment sur Spark Streaming pour le traitement de données en flux continu.
Présentation jouée chez Ippon le 11 décembre 2014.
A short introduction on Apache Solr :
- what is the project
- base features (document indexing, querying)
- advanced features (faceting, highlighting...)
(french presentation)
These escp-s carrau-un mkg responsable est-il un levier de retour a la confianceSCarrau
L’objet de cette thèse est de traiter de la baisse de confiance des consommateurs pour en clarifier les sources et de repenser l’approche marketing sous un angle plus responsable comme voie susceptible de restaurer cette confiance. Une analyse du concept de confiance, et plus particulièrement dans le domaine alimentaire, associée à l’observation des évolutions du consommateur post-moderne nous permet de faire un bilan de la situation et d’y déceler la nécessité d’un renouveau en marketing. Une étude qualitative exploratoire sur un produit controversé, l’aspartame, permet d’appréhender des leviers de retour à la confiance auprès de l’ensemble des acteurs concernés.
The document describes the process of transcription in eukaryotic cells. It shows RNA polymerase binding to the promoter region of DNA and creating a messenger RNA (mRNA) copy that matches the coding region of the DNA strand. The mRNA copy is created base by base until the polymerase reaches the termination sequence, at which point transcription ends and the mRNA is released.
El documento contiene una colección de proverbios y citas sobre temas como la paciencia, la sabiduría, la juventud, el tiempo y las consecuencias de nuestras acciones. Los proverbios ofrecen consejos breves y reflexiones sobre cómo vivir de manera positiva y aprender de los errores.
John Lennon nació en 1940 en Liverpool y fundó la banda The Beatles junto a Paul McCartney, George Harrison y Ringo Starr. Lennon se casó con Yoko Ono y tuvo un hijo, además de otro hijo de un matrimonio anterior. En 1980, cuando regresaba de una fiesta con Yoko, Mark Chapman disparó y mató a Lennon.
Este documento resume los resultados más recientes del ensayo clínico RV144 sobre una vacuna contra el VIH. Los investigadores identificaron dos tipos de anticuerpos que se correlacionaron con el riesgo de infección por VIH entre los voluntarios vacunados: anticuerpos IgG específicos contra la proteína Env que se asociaron con un menor riesgo, y anticuerpos IgA específicos contra Env que se asociaron con un mayor riesgo. Estos hallazgos proporcionan pistas sobre cómo la vacuna pudo haber funcionado y ayudan a
Spark, ou comment traiter des données à la vitesse de l'éclairAlexis Seigneurin
Spark fait partie de la nouvelle génération de frameworks de manipulation de données basés sur Hadoop. L’outil utilise agressivement la mémoire pour offrir des temps de traitement jusqu’à 100 fois plus rapides qu'Hadoop. Dans cette session, nous découvrirons les principes de traitement de données (notamment MapReduce) et les options mises à disposition pour monter un cluster (Zookeper, Mesos…). Nous ferons un point sur les différents modules proposés par le framework, et notamment sur Spark Streaming pour le traitement de données en flux continu.
Présentation jouée chez Ippon le 11 décembre 2014.
A short introduction on Apache Solr :
- what is the project
- base features (document indexing, querying)
- advanced features (faceting, highlighting...)
(french presentation)
These escp-s carrau-un mkg responsable est-il un levier de retour a la confianceSCarrau
L’objet de cette thèse est de traiter de la baisse de confiance des consommateurs pour en clarifier les sources et de repenser l’approche marketing sous un angle plus responsable comme voie susceptible de restaurer cette confiance. Une analyse du concept de confiance, et plus particulièrement dans le domaine alimentaire, associée à l’observation des évolutions du consommateur post-moderne nous permet de faire un bilan de la situation et d’y déceler la nécessité d’un renouveau en marketing. Une étude qualitative exploratoire sur un produit controversé, l’aspartame, permet d’appréhender des leviers de retour à la confiance auprès de l’ensemble des acteurs concernés.
The document describes the process of transcription in eukaryotic cells. It shows RNA polymerase binding to the promoter region of DNA and creating a messenger RNA (mRNA) copy that matches the coding region of the DNA strand. The mRNA copy is created base by base until the polymerase reaches the termination sequence, at which point transcription ends and the mRNA is released.
El documento contiene una colección de proverbios y citas sobre temas como la paciencia, la sabiduría, la juventud, el tiempo y las consecuencias de nuestras acciones. Los proverbios ofrecen consejos breves y reflexiones sobre cómo vivir de manera positiva y aprender de los errores.
John Lennon nació en 1940 en Liverpool y fundó la banda The Beatles junto a Paul McCartney, George Harrison y Ringo Starr. Lennon se casó con Yoko Ono y tuvo un hijo, además de otro hijo de un matrimonio anterior. En 1980, cuando regresaba de una fiesta con Yoko, Mark Chapman disparó y mató a Lennon.
Este documento resume los resultados más recientes del ensayo clínico RV144 sobre una vacuna contra el VIH. Los investigadores identificaron dos tipos de anticuerpos que se correlacionaron con el riesgo de infección por VIH entre los voluntarios vacunados: anticuerpos IgG específicos contra la proteína Env que se asociaron con un menor riesgo, y anticuerpos IgA específicos contra Env que se asociaron con un mayor riesgo. Estos hallazgos proporcionan pistas sobre cómo la vacuna pudo haber funcionado y ayudan a
Presentation oral télémédecine et télésanté à destination des seniors - Loire...Clémence Charon
Rapport entier disponible : http://goo.gl/vaw8F
Support de présentation oral : La télémédecine à destination des seniors - Département du Loiret (45) et la communauté de commune de la Beauce de Janville (28) - Région Centre
Mémoire de fin d'étude Master 2 - Economie et Gestion des télécommunications et nouveaux médias - Paris Dauphine.
Clémence Charon sous la direction de Monsieur Laurent Bister
(c) Tout droit réservé
Evaluation nationale de la formation "Pré-requis à l'évolution des catalogues...ABES
Résultats et analyse des réponses aux formulaire d'évaluation nationale (stagiaires ayant suivi une formation à l'évolution des catalogues et au modèle FRBR entre janvier et juin 2014). Analyse à destination des formateurs.
JavaScript aussi sur le serveur et jusque dans le cloud?Microsoft
JavaScript prend de plus en plus d'importance et Microsoft rend son exécution très efficace. Nous verrons dans cette session les cas d'utilisation de ce langage sur la plateforme Microsoft au niveau du serveur que ce soit par exemple avec Node.js ou Map/Reduce sur Windows Server et Windows Azure.
JavaScript aussi sur le serveur et jusque dans le cloud?benjguin
JavaScript prend de plus en plus d'importance et Microsoft rend son exécution très efficace. Nous verrons dans cette session les cas d'utilisation de ce langage sur la plateforme Microsoft au niveau du serveur que ce soit par exemple avec Node.js ou Map/Reduce sur Windows Server et Windows Azure.
La vidéo est disponible à http://www.microsoft.com/france/mstechdays/programmes/parcours.aspx#SessionID=965a01d5-bd2f-4b60-847f-6d28900fe1e5
Session performed at Microsoft Techdays 2012 in Paris.
Talked about Node.JS, MongoDB and Hadoop on Windows Azure.
Available NodeJS demos here :
- https://github.com/fasterize/DemoTechdays2012Chat
- https://github.com/fasterize/DemoTechdays2012Proxy
- https://github.com/fasterize/techdays
Rapide introduction à Hadoop lors du lancement du Casablanca Hadoop & Big Data Meetup.
En partenariat avec Hortonworks
http://www.meetup.com/Casablanca-Hadoop-et-Big-Data-Meetup
Publication des données publiques (Open Data), WCF Data Services, ODataMicrosoft Ideas
Les institutions publiques, dans un soucis de décloisonnement, de lisibilité et de transparence de l’action publique, cherchent à rendre leurs données accessibles aux citoyens. Le mouvement Open Data à la base d’innovations sociales et économiques dans la réutilisation des données ainsi libérées se combine bien avec une approche RESTful qui a largement pris le pas sur SOAP en termes de services Web. Dans ce cadre, le protocole ouvert de données OData se fonde sur les standards du Web pour rendre accessible une source de données depuis une très large variété de langages, d’environnements, d’applications, de services et de places de marché. OData précise certains points laissés à la discrétion du développeur de façon à ce qu'on ait une encore meilleure cohérence au moins sur la plateforme Microsoft. Cette session montre, dans le cadre du mouvement Open Data, comment OData peut être concrètement mis en œuvre, entre autres sur la plateforme Windows Azure.
Les micro orm, alternatives à entity frameworkMSDEVMTL
L'arrivée il y 10 ans d'Entity Framework a permis de manipuler une base de données sans écrire une seule ligne de SQL.Entity Framework a apporté son lot d'avantages mais aussi d'inconvénients.
Aujourd'hui il existe différentes alternatives à ce dernier, les micro ORM.Nous allons voir en quoi ils sont intéressants : leur compatibilité avec les différentes bases de données, leur simplicité, leur performance, la communauté autour de ces derniers.
Lors du PostgreSQL Lyon User Group, j'ai présenté Play SQL. C'est un outil de gestion de données présenté comme un tableur, basé sur PostgreSQL, et vendu en tant que plugin d'Atlassian Confluence. Pas besoin de s'y connaître en CREATE TABLE, à destination des gens qui n'ont pas le temps d'être DBA.
Similar to code4lib 2011 : choses vues et entendues par l'ABES (20)
Jabes 2021 - Poster "Initiation aux études historiques"ABES
MANUEL NUMÉRIQUE EN ACCÈS LIBRE
POUR L’ENSEIGNEMENT SUPÉRIEUR EN HISTOIRE
• Favorise l’apprentissage des modes
de réflexion propres à l’historien
• Familiarise l’étudiant à la maîtrise
des sources et outils de l’historien
• Ouvre l’étudiant aux disciplines qui
environnent et nourrissent la science
historique
• Donne à l’étudiant les repères
historiographiques
Poster présenté par COUPERIN
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"ABES
This document discusses the status of requests in Cidemis, the French ISSN database. It provides statistics on the percentage of requests (corrections, creations, numeration) that were completed in 2015-2020 for ISSN France and other centers. Completion rates were higher for ISSN France than other centers. It also discusses how to track numeration requests that were accepted in the Sudoc database to then close the corresponding requests in Cidemis.
This document provides an overview of the Cidemis application and circuit for requesting ISSN numbers. It begins with a brief introduction to Cidemis and the upstream Sudoc networks. It then discusses the digitization of the request circuit and how technology illuminates the complexity of communication. The rest of the document provides reminders and best practices for users of the application, including the importance of clear communication and documentation. It also references additional resources for learning about and using Cidemis.
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"ABES
Session coordonnée par Marianne Giloux (Abes).
Cette session aborde les points suivants :
- Un renouvellement conceptuel international
- Un renouvellement technologique nécessaire
- La transition bibliographique de l’Abes : l’expérimentation SudocFRBR, le FNE, le projet Sudoc21 et lme projet "Vers la LRMisation des données"
Jabes 2021 - 26 ans après la création de l'AbesABES
Présentation de David Aymonin, directeur de l'Abes
Intervention qui brosse un tableau synthétique de ce que fait l’Abes aujourd’hui : à quoi sert-elle ? dans quel contexte ? pour qui travaille-t-elle ? de quelle manière et avec qui ?
Présentation des Actus de l'Abes 2021, partie 1.
Cette partie est consacré aux actions de l'Abes au service de l'IST, de la Science Ouverte et des grands projets nationaux.
Poster présenté par l'Abes (hors concours).
Depuis 2019, l’Abes teste un nouvel algorithme développé par OCLC pour créer automatiquement des pré-notices d’œuvres, à partir de regroupements de notices bibliographiques. Ce premier pas dans la FRBRisation (aujourd'hui on parle de LRMisation) des données du catalogue Sudoc s’est accompagné d’un contrôle très strict des performances et des résultats de ce "robot". L’expérimentation aujourd’hui terminée, il est temps d’en dresser le bilan, pour vérifier dans quelle mesure, à l’avenir, les algorithmes et l’intelligence artificielle seront d’un précieux recours pour modéliser des millions de données.
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...ABES
Poster présenté par le SCD de l'Université de Toulouse 2 Jean Jaurès.
Le Service Commun de la Documentation de l’Université Toulouse - Jean Jaurès a mis en place un service d'accompagnement à la gestion des données qui s'articule autour :
- d'une offre de formation à destination des doctorants
- d'un accompagnement des chercheurs
La mise en œuvre de cet appui en collaboration avec l'ensemble des acteurs impliqués au niveau de l'établissement a permis un reconnaissance du SCD comme un acteur primordial sur ces questions. Ainsi, dans le cadre de la formalisation des acteurs de la Science Ouverte au sein de l’établissement, la vice-présidence recherche a chargé le SCD d'assurer les fonctions d'administrateur.rice des données, des algorithmes et des codes sources de la recherche et de co-piloter le comité opérationnel des données de la recherche.
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...ABES
Poster présenté par l'association KohaLa.
Ce poster présente le plugin Koha qui permet d’insérer des identifiants pérennes trouvés par Bibliostratus dans des notices bibliographiques (ark ou PPN) et autorités (ark, isni, Idref).
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...ABES
Poster présenté par le SCD de l'Université Toulouse 2 Jean Jaurès.
L’objet de ce poster est de présenter la démarche qui a conduit à un projet d’expositions participatives autour de la collection cartographique patrimoniale de l’Université Toulouse Jean Jaurès, conservée au Centre de Ressources Olympe de Gouges. Après avoir découvert en 2007 cette collection sans usages, alors que j'étais responsable de la bibliothèque de Géographie, j'ai décidé de mener à partir de 2010 des recherches en Sciences de l’Information et de la Communication sur le document carte. Après l'obtention de mon doctorat en 2015, j'ai poursuivi des travaux scientifiques sur une méthode favorisant l’appropriation des valeurs informatives de ce document singulier dans l'idée de développer des médiations. Depuis deux ans, j'expérimente ainsi des ateliers avec des usagers placés en situation d’enquêter sur des cartes, en vue de réaliser des posters documentaires. Les objectifs de l'application professionnelle de mes réflexions sont multiples : créer du lien entre des documents patrimoniaux sans usages et des potentiels récepteurs, les inviter à découvrir et à utiliser des documents dans une démarche de réactivation, les inciter à avoir des lectures plurielles d'un même document, et enfin proposer un autre modèle d’expositions afin de vivifier des collections en dormance documentaire.
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...ABES
Poster présenté par l'INISTCNRS et le CCSD.
Lancé au printemps 2021 et soutenu par le MESRI, corHAL proposera ses services à la fin de l’année. Porté par l’Inist et le CCSD, ce projet permet de collecter des métadonnées de publications scientifiques françaises issues de plusieurs réservoirs. Ces données sont homogénéisées et enrichies à l’aide d’alignements. Un repérage de doublons assure la création de notices unifiées combinant les informations des différentes sources. Grâce à un système d’alertes (mode push ou pull), le service propose au chercheur ses publications absentes de HAL. Ce dernier choisit d’importer automatiquement aucun, un, plusieurs ou tous les textes intégraux de ses publications dans l’archive ouverte nationale.
CorHAL, un outil au service du chercheur et de la science ouverte.
cours-LasergrammetrieLe « LiDAR», de l’anglais « Light.pptxAbdessamadAmimi1
Le « LiDAR», de l’anglais « Light Detection And Ranging » est un capteur actif qui, par la mesure du temps de propagation aller-et-retour d'un rayonnement lumineux émis par un laser, permet de déterminer la position et la distance d'une cible par rapport à l'émetteur.
Lidar est utilisé pour la mesure des distances, la détection et éventuellement la localisation de constituants des milieux rencontrés. Le terme LiDAR se traduit en français par détection et télémétrie par la lumière.
Le principe du LiDAR est une transposition, dans le domaine lumineux, de la technique du RADAR (Radio Detection And Ranging), qui s'applique au domaine radio. Néanmoins, ces deux domaines sont distincts puisque les ondes électromagnétiques que ces deux dispositifs exploitent sont de nature différente.
Les utilisations civiles des UAS sont très diversifiées : le relevé et la cartographie 3D, le relevé architecturale, l’archéologie, l’agriculture de précision, la surveillance côtière, le suivi de l’environnement, des feux ou des zones à risques, etc. Quelques exemples des dernières utilisations des UAS dans le domaine de la géomatique peuvent être consultés dans les proceedings de la conférence internationale UAV-g2013 (Unmanned Aerial Vehicle in Geomatics) tenue les 4, 5 et 6 Septembre 2013, à Rostock en Allemagne.
Dans les domaines de la cartographie et du cadastre, un intérêt croissant à l’échelle internationale est ressenti (Haarbrink, 2011, Eisenbeiss, 2011). L’étude d’une possible intégration des UAS dans la chaîne de production de certaines agences nationales de la cartographie en est un exemple (Cramer et al., 2013). En effet, depuis 2004, et dans le cadre de l’EuroSDR (the European Spatial Data Research) plusieurs agences nationales de cartographie se sont intéressées à l’utilisation des UAS pour une éventuelle couverture à l’échelle nationale, ainsi que pour des applications locales comme le remembrement, le suivi des catastrophes et les applications cadastrales. Pour cette dernière application, plusieurs recherches ont été menées pour étudier le potentiel des UAS pour le cadastre (Manyoky et al., 2011; Cunningham et al., 2011). Les études ont consisté en une comparaison d’un levé par un UAS avec celui réalisé par une méthode conventionnelle (par exemple tachéomètre, GNSS). Les résultats ont montré que le niveau de précision exigé par les normes cadastrales en vigueur a été atteint par cette nouvelle technologie. En plus, cette dernière a permis de réaliser d’autres produits tels que des orthoimages et des modèles numériques.
La technologie UAS présente plusieurs avantages et promet des utilisations intéressantes. Toutefois, pour des mesures 3D de précision, le système UAS doit être stable, avec une masse maximale de la charge utile permet d’intégrer une caméra métrique, un positionnement par GNSS et IMU de grande
précision. Le temps de vol doit être plus long avec plus d’autonomie. Il est aussi important d’utiliser des solutions logicielles robustes ave
Textes de famille concernant les guerres V2.pdfMichel Bruley
Différents textes relatifs à des épisodes de guerre, écrits par, ou concernant des membres de ma famille. Cette deuxième version est augmentée et passe de 88 à 128 pages. Les textes sont classés dans l'ordre chronologiques :
Guerres napoléoniennes,
Première guerre mondiale,
Deuxième guerre mondiale.
Bonne lecture,
Michel Bruley
3. code{4}lib ? Communauté de développeurs et de bibliothécaires « techniques » (technologists), qui travaillent pour la plupart dans des bibliothèques A commencé par une mailing list en 2003, puis par IRC #code4lib sur freenode 1ère conférence en février 2006, dans l’Oregon : 80 participants. Puis 150 en 2007…
4.
5. Apache Solr Apache Solr : plateforme de recherche opensource, basée sur le projet Apache Lucene Fonctions principales : Recherche plein texte Highlighting (surlignage) Facettes Support de différent type de document (word, pdf…) Recherche distribuée Réplication d’index automatique
6. Apache Solr Se lance comme un serveur indépendant de recherche (dans un conteneur de servlet, comme Apache Tomcat). Ecrit en Java, utilise Lucene comme moteur de recherche. APIs (interfaces) de type REST (HTTP/XML) et JSON, ce qui le rend facile à utiliser avec n’importe quel langage de programmation. Est utilisé à l’ABES par les applications et projets : IdRef, Star et API Sudoc (« Solr total », SudocAD), Step, Portail des thèses. Dans le monde des bibliothèques, est de plus en plus utilisé par les catalogues de nouvelle génération : Blacklight, VuFind, etc.
7.
8. Les nouveautés de Solr Amélioration du support Unicode Indexation et recherche de plus en plus rapide Nouvelles fonctionnalités pour l’indexation et la recherche Accélération du surlignage Support spatial : fonctions sur les distances, facettes sur la géolocalisation Possibilité de grouper les résultats Nouvelle fonction de pondération : « edismax » (supporte la syntaxe complète de Lucene) Fonction pivot sur les facettes : facettes à 2 niveaux Autosuggestion : à partir des données indexées Possibilité de modifier les données par JSON et CSV SolrCLOUD Solr UIMA : http://uima.apache.org/ En cours : amélioration des performances, XMLQueryParser (indexer directement de l’XML)
9.
10. Islandorarepository Framework opensource basé sur Drupal et Fedora. Commencé en 2008. LDAP / Groups / Forms Drupal FCK / Hooks / Modules Open Layers ABBYY / Blast Filters / Rule Engine / PHP Islandora Java / XML / Drupal Modules SolR / LuceneDjatoka / Gate Fedora : Policies / Folders Solution clé en main Adaptable : configuration du workflow, accepte beaucoup (+ de 20) de formats de métadonnées : METS / MIX / MODS / TEI… 120 VREs : environnements de recherche virtuels http://islandora.ca/
50. Sessions plénières Critical collaborations : Catalogueurs / developpeurs Comment je peux changer ça? / J’ai 1 idée! Départsmodestes / grandsobjectifs. Quellespriorités ? Priorités communes ? Est-cequ’onapprend de l’autrecedont on a besoin de savoir ?
51. Sessions plénières OCLC Il n’y a pas que le texte pour trouver 1 document : différents prototypes présentés : Google maps / Code barre / timeLine / Nuage de mots / nuage de mots avec géolocalisation / autorités sous forme d’arbre (relations) / Google Chart API (diagrammes) Pour savoir où se trouve un utilisateur : Google location JS : latitude/longitude
52. Sessions plénières KUALI : open library environment Utilisé par : Universitiésaméricaines : Duke, Florida, Chicago Utilisé au Canada, en Australie etc. OpenSource pour l’enseignementsupérieur DRUPAL 7 as a RAD Tool RAD : Rapid Application Development Out of the box : blog / website / CMS Plus compliqué (que wordpress) mais bcp de modules/API
53. Sessions plénières Utilisation de CouchApp CouchDBestune base de donnéesorientées document qui peutêtreinterrogée et indexée avec unemanière de “MapReduce”, en utilisant JavaScript. CouchDBoffreaussi la réplicationincrémentale avec détection et résolution de conflitbidirectionnel. ‘ CouchDB propose une API JSON (REST) qui peutêtreinterrogée par n’importequelenvironnement qui accepte les requêtes HTTP. Il y a un nombreconsidérable de librairiesclientes qui rendent facile la programmation avec le langagequel’onveut. CouchApp : sont des applications JavaScript et HTML5 serviesdirectementdepuisCouchDB. Si vouspouveztaillervotre application avec cescontraintes, alorsvousgagnez la “scalability” et la flexibiltié de CouchDB, sans rien faire.
54. Sessions plénières Avant, utilisation de : Client -> Node.js (programmation Javascript I/O serveur)-> CouchDB Mais avec couchApp, on peut se passer de Node.js HTTP API interface / easy replication / attach objects / document versioning by attaching earlier records Define data models in one place : models can be modified on the fly Forms, validation, and display extend from models Search : couchdb-lucene / solr / b-trees
55. Sessions plénières MCROSERVICES Des « blocs » de programmes Merritt : service individuel pour chaquefonction du dépôt Pas de base de donnéesmais des fichiers “plats” (JSON) Mustache : librairie de template (disponible pour une 20aine de langage de programmation) Compass-style.org : CSS ++ Les fichiers Compass sontcompilés en CSS qui fonctionnentsurtous les navigateurs -> Possible d’inclure un style dans un autre etc. border en 1 ligne etc. JQuery UI JQuery BBQ : gère le bouton “back” du navigateur : librairieJavascript qui gère les états Git ++ : contrôle de version Bonsai : tinytree.info : crée automatiquement les répertoires pour faire un site web YUI compressor : permet de compresser les fichiers pour économiser la bandepassante CSS sprites : généré par « lemonade » : permet de ne charger qu’une seule image contenant toutes les images : 1 seule requête et 1 seule image en cache Custom Sitemapgenerator : pour envoyer à google toutes les urls dynamiques (référencement) Avantages : plus riche en fonctionnalités, plus petit et plus facile à maintenir / à adapter 1 service pour plusieurs sites : comme ça on met à jour à un seul endroit.
56. Sessions plénières Un système fait maison de bibliothèque “digitale” XForms (Orbeon) / XPF = XML pipeline Workflow services images (imageMagick) Edition de DC, mais voudrait l’étendre à d’autres standards Soucis de performance (éditeur Orbeon) et notamment à cause de la flexibilité du METS Flash pour la visionneuse
57. Sessions éclairs (lightningtalks) ?? 45% : des recherches Il faut que l’information soit en haut de l’écran, sinon elle n’est pas lu Le ranking est très important Social network in archives (EAD) Utilise des données de plusieurs sites/bases dans une interface. Ressemble à Calames + services « sociaux » : commentaires/images JQuerywidget ajout de fonctionnalité (popup) en 5 minutes NDL Search (Japan) : portail FRBR structure / web APIs (RSS/Atom/SRU) / smartphone ABES : * STAR *