code4lib 2011 : choses vues et entendues par l'ABES

1. Code{4}lib 2011 Bloomington, IN Du 7 au 10 février 2011

3. code{4}lib ? Communauté de développeurs et de bibliothécaires « techniques » (technologists), qui travaillent pour la plupart dans des bibliothèques A commencé par une mailing list en 2003, puis par IRC #code4lib sur freenode 1ère conférence en février 2006, dans l’Oregon : 80 participants. Puis 150 en 2007…

5. Apache Solr Apache Solr : plateforme de recherche opensource, basée sur le projet Apache Lucene Fonctions principales : Recherche plein texte Highlighting (surlignage) Facettes Support de différent type de document (word, pdf…) Recherche distribuée Réplication d’index automatique

6. Apache Solr Se lance comme un serveur indépendant de recherche (dans un conteneur de servlet, comme Apache Tomcat). Ecrit en Java, utilise Lucene comme moteur de recherche. APIs (interfaces) de type REST (HTTP/XML) et JSON, ce qui le rend facile à utiliser avec n’importe quel langage de programmation. Est utilisé à l’ABES par les applications et projets : IdRef, Star et API Sudoc (« Solr total », SudocAD), Step, Portail des thèses. Dans le monde des bibliothèques, est de plus en plus utilisé par les catalogues de nouvelle génération : Blacklight, VuFind, etc.

8. Les nouveautés de Solr Amélioration du support Unicode Indexation et recherche de plus en plus rapide Nouvelles fonctionnalités pour l’indexation et la recherche Accélération du surlignage Support spatial : fonctions sur les distances, facettes sur la géolocalisation Possibilité de grouper les résultats Nouvelle fonction de pondération : « edismax » (supporte la syntaxe complète de Lucene) Fonction pivot sur les facettes : facettes à 2 niveaux Autosuggestion : à partir des données indexées Possibilité de modifier les données par JSON et CSV SolrCLOUD Solr UIMA : http://uima.apache.org/ En cours : amélioration des performances, XMLQueryParser (indexer directement de l’XML)

10. Islandorarepository Framework opensource basé sur Drupal et Fedora. Commencé en 2008. LDAP / Groups / Forms Drupal FCK / Hooks / Modules Open Layers ABBYY / Blast Filters / Rule Engine / PHP Islandora Java / XML / Drupal Modules SolR / LuceneDjatoka / Gate Fedora : Policies / Folders Solution clé en main Adaptable : configuration du workflow, accepte beaucoup (+ de 20) de formats de métadonnées : METS / MIX / MODS / TEI… 120 VREs : environnements de recherche virtuels  http://islandora.ca/

11. 1152 disques dur 247 Petabytes + de 1000 machines virtuelles

13. collaborations: ORCID, ELSEVIER…

14. données : système locaux (appli RH et appli ES), agrégateurs de données, dépôts institutionnels, individus et leurs relations

15. données stockées en RDF => représentation sémantique des données

17. coller de manière significative des silos de données entre eux

18. interopéralibilité : construit avec (sur) les autres (DC, FOAF, SKOS, BIBO)

19. compatible SPARQL

21. Java, Apache Tomcat, MySQL, RDB ou SDB pour (stockage de triplets RDF)

22. 2 millions de triplets += 12 Gb de mémoire

23. Import/saisie de données ->moissonage-> VIVO RDF -> RDF (linked data)

27. difficile à s’approprier, très académique : s’appuie sur des notions mathématiques, la récursivité

28. basé sur l'évaluation d'expression et non sur l'exécution d'instruction

30. concepts majeures : first-class functions, lambda functions, higherorderfunctions, closures, et functioncurrying

31. Langages : haskell, javascript, ocaml, F# (MS), erlang (ericsson), utilisé dans les secteurs industriels, informatique embarquéex: qualcomm, at&t, facebook, twiter, credit suisse, yahoo, ericsson, citrix - Framework javascript : prototype, Jquery …

32. Programmation fonctionnelle(3) var maFonction = function (func) { return( function(x,y){ func(y,x); } );};

35. SolR utilisé pour récupérer les notices

37. Le code pour extraire les données de MARC est moche

38. « Il faut se débarrasser de MARC »« MARC must DIE » (sic) Demian Katz membre actif vufind

43. Maintenance aisée

44. Personnalisation plus facile

45. Gérer rapidement d’autre format que le MARC (c’est le but)

46. Avantages de la POODemo

48. The Pode project : FRBRisation et linked data (norvège)

50. Sessions plénières Critical collaborations : Catalogueurs / developpeurs Comment je peux changer ça? / J’ai 1 idée! Départsmodestes / grandsobjectifs. Quellespriorités ? Priorités communes ? Est-cequ’onapprend de l’autrecedont on a besoin de savoir ?

51. Sessions plénières OCLC Il n’y a pas que le texte pour trouver 1 document : différents prototypes présentés : Google maps / Code barre / timeLine / Nuage de mots / nuage de mots avec géolocalisation / autorités sous forme d’arbre (relations) / Google Chart API (diagrammes) Pour savoir où se trouve un utilisateur : Google location JS : latitude/longitude

52. Sessions plénières KUALI : open library environment Utilisé par : Universitiésaméricaines : Duke, Florida, Chicago Utilisé au Canada, en Australie etc. OpenSource pour l’enseignementsupérieur DRUPAL 7 as a RAD Tool RAD : Rapid Application Development Out of the box : blog / website / CMS Plus compliqué (que wordpress) mais bcp de modules/API

53. Sessions plénières Utilisation de CouchApp CouchDBestune base de donnéesorientées document qui peutêtreinterrogée et indexée avec unemanière de “MapReduce”, en utilisant JavaScript. CouchDBoffreaussi la réplicationincrémentale avec détection et résolution de conflitbidirectionnel. ‘ CouchDB propose une API JSON (REST) qui peutêtreinterrogée par n’importequelenvironnement qui accepte les requêtes HTTP. Il y a un nombreconsidérable de librairiesclientes qui rendent facile la programmation avec le langagequel’onveut. CouchApp : sont des applications JavaScript et HTML5 serviesdirectementdepuisCouchDB. Si vouspouveztaillervotre application avec cescontraintes, alorsvousgagnez la “scalability” et la flexibiltié de CouchDB, sans rien faire.

54. Sessions plénières Avant, utilisation de : Client -> Node.js (programmation Javascript I/O serveur)-> CouchDB Mais avec couchApp, on peut se passer de Node.js HTTP API interface / easy replication / attach objects / document versioning by attaching earlier records Define data models in one place : models can be modified on the fly Forms, validation, and display extend from models Search : couchdb-lucene / solr / b-trees

55. Sessions plénières MCROSERVICES Des « blocs » de programmes Merritt : service individuel pour chaquefonction du dépôt Pas de base de donnéesmais des fichiers “plats” (JSON) Mustache : librairie de template (disponible pour une 20aine de langage de programmation) Compass-style.org : CSS ++ Les fichiers Compass sontcompilés en CSS qui fonctionnentsurtous les navigateurs -> Possible d’inclure un style dans un autre etc. border en 1 ligne etc. JQuery UI JQuery BBQ : gère le bouton “back” du navigateur : librairieJavascript qui gère les états Git ++ : contrôle de version Bonsai : tinytree.info : crée automatiquement les répertoires pour faire un site web YUI compressor : permet de compresser les fichiers pour économiser la bandepassante CSS sprites : généré par « lemonade » : permet de ne charger qu’une seule image contenant toutes les images : 1 seule requête et 1 seule image en cache Custom Sitemapgenerator : pour envoyer à google toutes les urls dynamiques (référencement) Avantages : plus riche en fonctionnalités, plus petit et plus facile à maintenir / à adapter 1 service pour plusieurs sites : comme ça on met à jour à un seul endroit.

56. Sessions plénières Un système fait maison de bibliothèque “digitale” XForms (Orbeon) / XPF = XML pipeline Workflow services images (imageMagick) Edition de DC, mais voudrait l’étendre à d’autres standards Soucis de performance (éditeur Orbeon) et notamment à cause de la flexibilité du METS Flash pour la visionneuse

57. Sessions éclairs (lightningtalks) ?? 45% : des recherches Il faut que l’information soit en haut de l’écran, sinon elle n’est pas lu Le ranking est très important Social network in archives (EAD) Utilise des données de plusieurs sites/bases dans une interface. Ressemble à Calames + services « sociaux » : commentaires/images JQuerywidget ajout de fonctionnalité (popup) en 5 minutes NDL Search (Japan) : portail FRBR structure / web APIs (RSS/Atom/SRU) / smartphone ABES : * STAR *

code4lib 2011 : choses vues et entendues par l'ABES

Recommended

Recommended

More Related Content

What's hot

What's hot (7)

Viewers also liked

Viewers also liked (20)

Similar to code4lib 2011 : choses vues et entendues par l'ABES

Similar to code4lib 2011 : choses vues et entendues par l'ABES (20)

More from ABES

More from ABES (20)

Recently uploaded

Recently uploaded (7)

code4lib 2011 : choses vues et entendues par l'ABES