0
numérisation et bibliothèque numérique

Luc Bellier, BnF
École de bibliothécaires documentalistes, Septembre-Octobre
Travaux pratiques : manipuler un
document numérique


Objectif : appréhender les différents composant le document
numériq...
Travaux pratiques : manipuler un
document numérique
•TéléchargerPDF
•Trouver le mode texte
•Télécharger l’ePub
•Changer le...
Travaux pratiques : manipuler un
document numérique
•Le titre = métadonnées descriptives
•Les pages = métadonnées de struc...
•
Les métadonnées

•Un document
numérique / électronique,
c’est une suite de fichiers
sans lien entre eux

• identifiant u...
Travaux pratiques : manipuler un
document numérique
•Le contenu d’un ePub
Travaux pratiques : manipuler un
document numérique
•Le manifeste *.opf
Travaux pratiques : manipuler un
document numérique

•Toc.ncx
•J
PG

•X
HT
M

L

•O
PF

•N
CX

Produire et décrire le
document numérique

»

Le cas des livres numériques ePub
•Métadonn...
•
Les métadonnées

•Un document
numérique / électronique,
c’est une suite de fichiers
sans lien entre eux

• identifiant u...
Travaux pratiques : manipuler un
document numérique
Travaux pratiques : manipuler un
document numérique
Travaux pratiques : manipuler un
document numérique
Travaux pratiques : manipuler un
document numérique
Fiche à faire à la maison


À compléter et à envoyer à lbellier@gmail.com



Présentation du site





Nom de la bibl...
•
Les métadonnées

•Un document
numérique / électronique,
c’est une suite de fichiers
sans lien entre eux

• identifiant u...
Qu’est-ce qu’une bibliothèque
numérique?

Luc Bellier, BnF
École de bibliothécaires documentalistes, octobre-novembre
2010
Plan


Qu’est-ce qu’une bibliothèque numérique?



Des collections de documents





Sélectionner
Numériser
Décrire ...
Qu’est-ce qu’une bibliothèque?

…qui ont besoin de
confort,
de lumière, d’espace,
d’outils pour lire,
écrire, discuter,
tr...
La bibliothèque numérique : visite
Entrée
accès

services

Votre place

Le bureau de

Accès au moteur
accès
de recherche

...
Une collection de documents
La chaîne de numérisation : qu’est-ce que numériser ?


Sélectionner



Scanner :



72 dpi ? 300 ? 600 ?





Coule...
1- La chaîne de numérisation :
sélectionner
•Estimation et analyse de
besoins
•Recherche et collecte
d’informations
•Sélection, acquisition des
documents
•Traitement ...
La chaîne de numérisation

Sélection
Sélection
Relecture
Relecture

Acquisition
Acquisition
Signalement
Signalement
Presta...
La chaîne de numérisation, 1 : « sélection- acquisition»
Politique documentaire de la bibliothèque
Organisation logistique...
« Sélection » : la politique documentaire

Numérisation de sauvegarde : les documents
fragiles, en danger?

Objectifs &
mi...
Les programmes de numérisation à la BnF


Collection encyclopédique



Documents libres de droits



Tout support



...
La question des droits : considérer le contenu
auteur

Robert Doisneau (1912-1994)
Epouvantails, 1964

oeuvre
personne

au...
La question des droits (http://print.google.com)

Recherche dans l’ensemble du texte, visualisation d’extraits
La question des droits (http://www.persee.fr)

Blocage des images
« Acquisition » : mettre à disposition les originaux?


Une fois la sélection faite, il faut se procurer les documents

...
« Acquisition » : mettre à disposition les originaux?

Filière Papier

Filière Microformes
Films

Reliés

Massicots

Fiche...
« Acquisition » : mettre à disposition les originaux?
Les « objets » sont transportés dans des caisses scellées
2- La chaîne de numérisation :
signaler
La chaîne de numérisation, 2 : « signalement »

Sélection
Sélection
Relecture
Relecture

Acquisition
Acquisition
Signaleme...
La chaîne de numérisation, 2 : « signalement »
La chaîne de numérisation, 2 : « signalement »
« Signalement » : la notion de métadonnées
Des données sur les données ...
– qui servent à organiser la connaissance et à ...
Pourquoi a-t-on besoin de métadonnées?
La déconstruction du document numérique
« Signalement » : les métadonnées

Un livre numérisé, c’est une suite de
fichiers sans lien entre eux : la
numérisation dé...
Le document : notion de granularité

•

Notion de document complexe

•

Un document peut avoir plusieurs niveaux d’accès

...
3- La chaîne de numérisation :
numériser
La chaîne de numérisation, 3 : « Numérisation »

Sélection
Sélection
Relecture
Relecture

Acquisition
Acquisition
Signalem...
Numériser en mode image


La numérisation en mode image
s’intéresse à la forme et donc à la
structure physique



Avanta...
Numériser en mode texte


La numérisation en mode texte
s’intéresse directement au
contenu et donc à la structure
logique...
Numériser en mode texte



Il y a deux techniques de création du mode texte…



La reconnaissance automatique de caractè...
Numériser en texte et image


Il existe des solutions qui combinent les deux modes



Avantage




Combiner les avanta...
Numériser en texte et image
(http://www.bium.univ-paris5.fr/histmed/medica.htm)
Liste des chapitres en
mode texte

Pages e...
Numériser en texte et image
(http://www.persee.fr)

Mode image

Mode texte (OCR de très
bonne qualité,
documents récents)
Numériser en texte et image
Visualisation du mode image uniquement, mode texte
issu d’OCR en sous-couche permettant la rec...
L’OCR



L’OCR est un processus automatique



La qualité comme la reconnaissance sont calculés
par des machines



C’e...
Numériser : l’équipement
Les ouvrages de la filière « reliés » sont numérisés soit…. Automatiquement
Numérisation à 90°

K...
Numériser : l’équipement
Les ouvrages de la filière « reliés » sont numérisés soit…. manuellement sur des scanners de livr...
Numériser : l’équipement
Les microformes sont numérisées sur des scanners de microfilms et de microfiches

Microfiches

Mi...
Numériser : l’équipement
Les ouvrages de la filière « massicots » sont numérisés sur des scanners de production grande vit...
Numériser : un exemple de traitement d’image
Un opérateur contrôle le traitement des images sur le logiciel SpiFactory

Re...
4- La chaîne de numérisation :
décrire et organiser
La chaîne de numérisation, 4 : « indexation - mise en ligne »

Sélection
Sélection
Relecture
Relecture

Acquisition
Acquis...
« Indexation » : la création des accès


Le matériau indexable :





L’indexation permet de créer des accès aux docum...
« Mise en ligne » : la salle de lecture virtuelle


La « salle de lecture virtuelle » est un espace où l’on consulte les
...
5- La chaîne de numérisation :
stocker et conserver
La conservation



Une fois les documents numérisés, sont-il
vraiment en sécurité ? Pour combien de
temps ?
Sauvegarder n...
6- les services
Le partage des données : OAI et coopération


Interopérabilité des données (OAI-PMH, Entrepôts OAI)





Initiative OA...
OAI et coopération : Gallica
serveur OAI

serveur OAI
serveur OAI

serveur OAI

serveur OAI

CNUM

Syndicat
national de
l’...
Bibliothèques numériques :
actualités, gallica
Hathi trust
L’actualité en 2004-2005


Oct. 2004 : annonce du lancement de Google Print à la Foire de
Francfort (Google), rebaptisé G...
L’actualité en 2006-2007


Sept. 2006 : réalisation par la BnF d’une maquette (Europeana)
préfigurant des accès et servic...
Que sont devenus ces projets en 2013?


Google recherche de livres en 2012:





30 bibliothèques partenaires pour la...
Google Recherche de Livres
Hathi Trust
Open Content Alliance
World Digital Library
Europeana
Principales différences entre
ces différents projets


Bibliothèque (Gallica, Europeana, WDL) versus Entrepôt (Google,
OC...
Les enjeux


Enjeux culturels





Enjeux technologiques






Le Web comme média principal pour la diffusion de l...
Gallica
Conclusion :
que retenir de tout cela ?
Règle n° 1 : « Numériser, ce n’est pas éditer »



Numériser ce n’est pas



commenter





interpréter
améliorer

Nu...
Règle n° 2 : « l’information n’est pas connaissance »



Une bibliothèque numérique ce n’est pas






Un entrepôt de...
Règle n° 3 : « Numériser n’est pas seulement un acte technique »



Les choix techniques ne sont pas






Déterminés...
Sélection

Collecte / production

Préparation à la

Gestion d’une
collection

Acquisition

Description : Catalogage

00100...
Le rôle du bibliothécaire numérique


Ce qui ne change pas :






Il travaille à la constitution des collections et ...
Quelques sites


http://gallica.bnf.fr / http://gallica2.bnf.fr



http://www.europeana.eu



http://maquette.bnf.fr/la...
Quelques sites

















http://www.wdl.org/fr/
http://bibliotheque-numerique.inha.fr
http://www.gu...
Quelques ressources


Sur le site Numérisation du patrimoine culturel du Ministère de la Culture :



La bibliographie ...
2013 bibnum ebd
2013 bibnum ebd
Upcoming SlideShare
Loading in...5
×

2013 bibnum ebd

698

Published on

bibliothèque numérique, numérisation, formation à destination des étudiants de 1° année à l'Ecole des bibliothécaires et documentalistes (ebd.fr)

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
698
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
33
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide
  • http://print.google.com
  • http://www.persee.fr
  • Plusieurs niveaux d’accès => plusieurs niveaux de descriptions
  • Transcript of "2013 bibnum ebd"

    1. 1. numérisation et bibliothèque numérique Luc Bellier, BnF École de bibliothécaires documentalistes, Septembre-Octobre
    2. 2. Travaux pratiques : manipuler un document numérique  Objectif : appréhender les différents composant le document numérique  Télécharger un document PDF sur Gallica  http://gallica.bnf.fr/ark:/12148/bpt6k145269m  Le manipuler (mode texte et mode image, appréhender les méta-données et les qualifier)  Consulter le document sur Gallica et retrouver les éléments du document numérique  Télécharger un ePub et le manipuler retrouver les mêmes éléments ( http://fr.feedbooks.com/book/16/bel-ami ou http://gallica.bnf.fr/ark:/12148/bpt6k145269m)  A la maison : consulter un document sur Google Books, athi trust ou autre et décrire les services proposés par la bibliothèque numérique  Prendre quelques images et les passer à l’OCR (presse, patrimonial, illustré, moderne) => préparer le dossier avec images concernées
    3. 3. Travaux pratiques : manipuler un document numérique •TéléchargerPDF •Trouver le mode texte •Télécharger l’ePub •Changer le .ePub en .zip •Ouvrir le dossier
    4. 4. Travaux pratiques : manipuler un document numérique •Le titre = métadonnées descriptives •Les pages = métadonnées de structure
    5. 5. • Les métadonnées •Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux • identifiant unique (localisation / identification) •? •Métadonnées descriptives •rattacher le document à l’original / différentes versions d’un document •donner accès à la copie numérique / électronique •Métadonnées de structure •Métadonnées administratives •rattacher les fichiers entre eux •gérer les droits d’accès •reconstituer la structure du document •gérer la collection, c’est-à-dire •préserver les informations techniques nécessaires à la lecture des fichiers •garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications
    6. 6. Travaux pratiques : manipuler un document numérique •Le contenu d’un ePub
    7. 7. Travaux pratiques : manipuler un document numérique •Le manifeste *.opf
    8. 8. Travaux pratiques : manipuler un document numérique •Toc.ncx
    9. 9. •J PG •X HT M L •O PF •N CX Produire et décrire le document numérique » Le cas des livres numériques ePub •Métadonnées •Descriptives? Métadonnées de structure ?
    10. 10. • Les métadonnées •Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux • identifiant unique (localisation / identification) •? •Métadonnées descriptives •rattacher le document à l’original / différentes versions d’un document •donner accès à la copie numérique / électronique •Métadonnées de structure •Métadonnées administratives •rattacher les fichiers entre eux •gérer les droits d’accès •reconstituer la structure du document •gérer la collection, c’est-à-dire •préserver les informations techniques nécessaires à la lecture des fichiers •garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications
    11. 11. Travaux pratiques : manipuler un document numérique
    12. 12. Travaux pratiques : manipuler un document numérique
    13. 13. Travaux pratiques : manipuler un document numérique
    14. 14. Travaux pratiques : manipuler un document numérique
    15. 15. Fiche à faire à la maison  À compléter et à envoyer à lbellier@gmail.com  Présentation du site    Nom de la bibliothèque numérique Nom de l’institution éditrice Présentation des collections   Quantité estimée des documents   Nature des collections proposées par la bibliothèque Autres informations Services proposés par la bibliothèque numérique  Quels accès aux documents ?  Quels type de lecture est proposée ?  Autres informations
    16. 16. • Les métadonnées •Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux • identifiant unique (localisation / identification) •? •Métadonnées descriptives •rattacher le document à l’original / différentes versions d’un document •donner accès à la copie numérique / électronique •Métadonnées de structure •Métadonnées administratives •rattacher les fichiers entre eux •gérer les droits d’accès •reconstituer la structure du document •gérer la collection, c’est-à-dire •préserver les informations techniques nécessaires à la lecture des fichiers •garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications
    17. 17. Qu’est-ce qu’une bibliothèque numérique? Luc Bellier, BnF École de bibliothécaires documentalistes, octobre-novembre 2010
    18. 18. Plan  Qu’est-ce qu’une bibliothèque numérique?  Des collections de documents     Sélectionner Numériser Décrire et organiser Conserver et stocker  Un espace  Des publics  Des services
    19. 19. Qu’est-ce qu’une bibliothèque? …qui ont besoin de confort, de lumière, d’espace, d’outils pour lire, écrire, discuter, travailler etc... un espace… des outils de référence des livres (sélectionnés et classés) des publics… un public
    20. 20. La bibliothèque numérique : visite Entrée accès services Votre place Le bureau de Accès au moteur accès de recherche La sélection du valorisation bibliothécaire accès renseignements Les actualités valorisation de la bibliothèque La liste des nouveautés valorisation services Les outils de fidélisation et de communication accès Les rayonnages en libreaccès pour le butinage
    21. 21. Une collection de documents
    22. 22. La chaîne de numérisation : qu’est-ce que numériser ?  Sélectionner  Scanner :   72 dpi ? 300 ? 600 ?   Couleurs, niveaux de gris ou noir et blanc ? Quels formats ? Tiff, jpeg etc. Océriser   Pour afficher (faire correspondre texte et image => métadonnées)  Pour vocaliser (qualité optimum ou garantie => comment évaluer la qualité?)   Pour chercher (texte uniquement) Pour transférer (le texte sans l’image , mais que le texte, sur un format portable) Décrire et organiser  Le document (signalement)  Les images constituant le document  Les fichiers textes issus de l’ocr
    23. 23. 1- La chaîne de numérisation : sélectionner
    24. 24. •Estimation et analyse de besoins •Recherche et collecte d’informations •Sélection, acquisition des documents •Traitement des documents •Traitement matériel : •Enregistrement du document •Équipement, reproduction, conservation (reliure etc.) •Traitement intellectuel : •Catalogage et indexation •Analyse, résumé etc. •Enregistrement de l’information •Classemen t •Diffusion de l’information : •Prêt •Mise à disposition des produits secondaires (catalogue, bibliographies, revue de presse etc.)
    25. 25. La chaîne de numérisation Sélection Sélection Relecture Relecture Acquisition Acquisition Signalement Signalement Prestataire encodage encodage En mode texte En mode texte Indexation Indexation Numérisation Numérisation Mise en Mise en ligne ligne En mode image En mode image structuration structuration Compétences bibliothéconomiques Compétences techniques Contrôle Contrôle transformation transformation Pas de compétences particulières
    26. 26. La chaîne de numérisation, 1 : « sélection- acquisition» Politique documentaire de la bibliothèque Organisation logistique Sélection Sélection Relecture Relecture Acquisition Acquisition Signalement Signalement encodage encodage En mode texte En mode texte Indexation Indexation Numérisation Numérisation En mode image En mode image structuration structuration Contrôle Contrôle transformation transformation Mise en Mise en ligne ligne
    27. 27. « Sélection » : la politique documentaire Numérisation de sauvegarde : les documents fragiles, en danger? Objectifs & missions Collections de la bibliothèque Numérisation à la demande des utilisateurs? Numérisation pour la diffusion Politique documentaire Public visé Public de la bibliothèque? Collection encyclopédique? Public à distance? Collection spécialisée? Grand public, chercheurs, étudiants? Types de supports Types de documents Contraintes juridiques et techniques Droits d’auteur État physique des documents Programmes de numérisation
    28. 28. Les programmes de numérisation à la BnF  Collection encyclopédique  Documents libres de droits  Tout support   Pour un public de    Monographies, périodiques, images, son Chercheurs, étudiants, érudits, « médiateurs » (enseignants, journalistes, associations) Grand public de plus en plus ciblé Grands axes :  le patrimoine national (somme des œuvres et des connaissances dans toutes les disciplines, philosophie, histoire, littérature, religion, sciences,…),  des programmes à vocation internationale (rapprochement et confrontation de corpus patrimoniaux portant sur le même sujet mais issus d’autres nationalités : presse quotidienne, documentation juridique, histoire et sciences auxiliaires telles que la généalogie, les langues et leur apprentissage,…)  un corpus d’œuvres et de documents consacrés spécifiquement à l’Europe dans tout ses aspects (philosophie politique, identités nationales, histoire, économie, commerce, le travail, les métiers les sciences et techniques, les questions sociales, les grands évènements culturels, …).
    29. 29. La question des droits : considérer le contenu auteur Robert Doisneau (1912-1994) Epouvantails, 1964 oeuvre personne auteur Robert Doisneau (1912-1994) SAVIGNAC aux échecs. Paris, 1950
    30. 30. La question des droits (http://print.google.com) Recherche dans l’ensemble du texte, visualisation d’extraits
    31. 31. La question des droits (http://www.persee.fr) Blocage des images
    32. 32. « Acquisition » : mettre à disposition les originaux?  Une fois la sélection faite, il faut se procurer les documents  C’est en partie une question technique et financière    Achat de document pour la numérisation Ou numérisation des documents originaux Numériser le papier ou le microfilm ?    Différence de prix, de rapidité et de qualité Question de préservation du document original Numériser des originaux  Le scanner tourne page ? Dérelier ou massicoter ?  Différences de prix et de qualité   Problèmes logistiques liés à la numérisation patrimoniale  Sortir les ouvrages des magasins Problèmes d’indisponibilité pour les lecteurs  Le transport et la livraison (conditions de conservation)  La numérisation sur site (coût) 
    33. 33. « Acquisition » : mettre à disposition les originaux? Filière Papier Filière Microformes Films Reliés Massicots Fiches
    34. 34. « Acquisition » : mettre à disposition les originaux? Les « objets » sont transportés dans des caisses scellées
    35. 35. 2- La chaîne de numérisation : signaler
    36. 36. La chaîne de numérisation, 2 : « signalement » Sélection Sélection Relecture Relecture Acquisition Acquisition Signalement Signalement encodage encodage En mode texte En mode texte Indexation Indexation Numérisation Numérisation En mode image En mode image structuration structuration Contrôle Contrôle transformation transformation Mise en Mise en ligne ligne
    37. 37. La chaîne de numérisation, 2 : « signalement »
    38. 38. La chaîne de numérisation, 2 : « signalement »
    39. 39. « Signalement » : la notion de métadonnées Des données sur les données ... – qui servent à organiser la connaissance et à utiliser et exploiter le document • Métadonnées descriptives, contextuelles et structurelles – Ex. : Notice bibliographique, indexation – Ex. : Date et formats de numérisation – Ex. : Données sur les fichiers pour reconstituer l’ouvrage (Cf. plus loin) • initiales et ajoutées tout au long du cycle de vie du document numérisé – qui servent à le maintenir accessible dans le temps et à garantir et contrôler cet accès • Métadonnées administratives et techniques – Ex. : Droits de lecture en interne seulement ou droit sur Internet • initiales et ajoutées tout au long du cycle de vie du document numérisé – Ex. : passage d’un document protégé dans le domaine public
    40. 40. Pourquoi a-t-on besoin de métadonnées? La déconstruction du document numérique
    41. 41. « Signalement » : les métadonnées Un livre numérisé, c’est une suite de fichiers sans lien entre eux : la numérisation déconstruit le livre identifiant unique ? Métadonnées de structure Métadonnées descriptives •rattacher les fichiers entre eux •rattacher le document à l’original •reconstituer la structure du document •donner accès à la copie numérisée Métadonnées administratives •gérer les droits d ’accès •préserver les informations techniques nécessaires à la lecture des fichiers
    42. 42. Le document : notion de granularité • Notion de document complexe • Un document peut avoir plusieurs niveaux d’accès • Par ex. les périodiques : Collection Document (notice bibliographique) Volume, tome, fascicule... Page Vue de détail (article)
    43. 43. 3- La chaîne de numérisation : numériser
    44. 44. La chaîne de numérisation, 3 : « Numérisation » Sélection Sélection Relecture Relecture Acquisition Acquisition Signalement Signalement encodage encodage En mode texte En mode texte Indexation Indexation Numérisation Numérisation En mode image En mode image structuration structuration Contrôle Contrôle transformation transformation Mise en Mise en ligne ligne
    45. 45. Numériser en mode image  La numérisation en mode image s’intéresse à la forme et donc à la structure physique  Avantages :    un fac-similé préserve l’intégrité de l’original Inconvénients :  un seul point d ’accès : la notice bibliographique  pas de possibilités de manipulation du texte  poids des images > stockage, temps de téléchargement  mise en place de chaînes de numérisation complexes
    46. 46. Numériser en mode texte  La numérisation en mode texte s’intéresse directement au contenu et donc à la structure logique  Avantages   souplesse et portabilité   recherche plein texte et autres manipulations Accessibilité pour les personnes en situation de handicap visuel Inconvénients  lourdeur de réalisation  coût
    47. 47. Numériser en mode texte  Il y a deux techniques de création du mode texte…  La reconnaissance automatique de caractères ou OCR   problèmes : caractères anciens, mal formés, caractères spéciaux, titres, documents en mauvais état…  recherches en cours, amélioration des logiciels   fortement conditionnée par la qualité de numérisation mais correction manuelle obligatoire pour une qualité à 100% La saisie  saisie manuelle : coût en termes de ressources humaines  « double saisie manuelle comparée »
    48. 48. Numériser en texte et image  Il existe des solutions qui combinent les deux modes  Avantage   Combiner les avantages du texte et de l’image Inconvénients  Difficulté de réalisation et de contrôle  Globalement, cela revient à numériser deux fois… donc deux fois plus de travail, et coûts élevés
    49. 49. Numériser en texte et image (http://www.bium.univ-paris5.fr/histmed/medica.htm) Liste des chapitres en mode texte Pages en mode image
    50. 50. Numériser en texte et image (http://www.persee.fr) Mode image Mode texte (OCR de très bonne qualité, documents récents)
    51. 51. Numériser en texte et image Visualisation du mode image uniquement, mode texte issu d’OCR en sous-couche permettant la recherche plein texte et le surlignage des résultats de la recherche (http://books.google.fr/)
    52. 52. L’OCR  L’OCR est un processus automatique  La qualité comme la reconnaissance sont calculés par des machines  C’est le nombre de caractères suspects divisés par le nombre total de caractères sur une page.  Une page de dix caractères vaut autant qu’une page de 10000 caractères dans un même ouvrage.
    53. 53. Numériser : l’équipement Les ouvrages de la filière « reliés » sont numérisés soit…. Automatiquement Numérisation à 90° Kirtas APT 2400
    54. 54. Numériser : l’équipement Les ouvrages de la filière « reliés » sont numérisés soit…. manuellement sur des scanners de livres Numérisation à plat Digibook 2000LC Suprascan A0 Copybook
    55. 55. Numériser : l’équipement Les microformes sont numérisées sur des scanners de microfilms et de microfiches Microfiches Microfilms
    56. 56. Numériser : l’équipement Les ouvrages de la filière « massicots » sont numérisés sur des scanners de production grande vitesse Docuscan 6000 Plus de 6000 pages/heure
    57. 57. Numériser : un exemple de traitement d’image Un opérateur contrôle le traitement des images sur le logiciel SpiFactory Redressement Recadrage des pages Illustrations Binarisation (transformation des images de niveau de gris et couleur en noir et blanc) Filtrage des formes (redressement des blancs, des lignes, des caractères à l’intérieur d’une image)
    58. 58. 4- La chaîne de numérisation : décrire et organiser
    59. 59. La chaîne de numérisation, 4 : « indexation - mise en ligne » Sélection Sélection Relecture Relecture Acquisition Acquisition Signalement Signalement encodage encodage En mode texte En mode texte Indexation Indexation Numérisation Numérisation En mode image En mode image structuration structuration Contrôle Contrôle transformation transformation Mise en Mise en ligne ligne
    60. 60. « Indexation » : la création des accès  Le matériau indexable :    L’indexation permet de créer des accès aux documents    Via un catalogue Via un moteur de recherche le catalogue    les métadonnées – descriptives – structurées le texte – en grande quantité – de qualité variable adapté pour la recherche avancée Classement par titre, auteur etc. le moteur de recherche    recherche simple conforme aux habitudes du web recherche fine (plein-texte) classement des résultats par pertinence
    61. 61. « Mise en ligne » : la salle de lecture virtuelle  La « salle de lecture virtuelle » est un espace où l’on consulte les collections      Elle met à disposition des lecteurs les instruments d’accès et de renseignement bibliographique Elle propose des outils de présentation des collections (mise en contexte, valorisation) : pages éditoriales Elle constitue un espace convivial (rencontres, expositions) Elle constitue un espace de confort pour travailler (lecture du document) Elle offre des services de valeur ajoutée pour aider les lecteurs dans leur travail  1. faire aussi bien que le livre  2. faire mieux que le livre
    62. 62. 5- La chaîne de numérisation : stocker et conserver
    63. 63. La conservation  Une fois les documents numérisés, sont-il vraiment en sécurité ? Pour combien de temps ? Sauvegarder n’est pas archiver  Surveiller et renouveler régulièrement les supports (de façon préventive)  Collecter toutes les informations nécessaires pour maîtriser le document (métadonnées)  Transformer le document dans une forme plus facile à conserver dans le temps (« migration »)  Collecter des environnements et des plateformes de références pour l’avenir (« émulation »)
    64. 64. 6- les services
    65. 65. Le partage des données : OAI et coopération  Interopérabilité des données (OAI-PMH, Entrepôts OAI)    Initiative OAI : Open Archive Initiative (1999)  Objectif : améliorer le signalement des e-prints, des publications scientifiques et l’interopérabilité des bases d’archives ouvertes  Moyen : création d’un protocole technique de diffusion et de collecte de métadonnées OAI-PMH : Protocol for Metadata Harvesting Intérêt dans le domaine culturel et patrimonial  Collections partagées dans des architectures réparties  Interrogation centralisée Fournisseurs de données Fournisseurs de services
    66. 66. OAI et coopération : Gallica serveur OAI serveur OAI serveur OAI serveur OAI serveur OAI CNUM Syndicat national de l’édition Library of Congress 363 notices Universités de Strasbourg 5546 notices 435 notices 91 notices serveur OAI Bibliothèques virtuelles humanistes 186 notices BIUM 3970 notices Base de données site SICD Strasbourg site LOC Editeurs site CNUM site BIUM Consultation de ces documents sur les autres sites serveur OAI site BVH
    67. 67. Bibliothèques numériques : actualités, gallica
    68. 68. Hathi trust
    69. 69. L’actualité en 2004-2005  Oct. 2004 : annonce du lancement de Google Print à la Foire de Francfort (Google), rebaptisé Google Book Search/ Google Recherche de livres en nov. 2005  Janv. 2005 : article de JN Jeanneney dans Le Monde lance l’idée d’une Bibliothèque numérique européenne (BnF, Commission européenne)  Oct. 2005 : création du consortium Open Content Alliance (Internet Archive, Yahoo!, MSN, Bibliothèques, archives anglophones etc.)  Nov. 2005 : partenariat Microsoft-Bristish Library pour numérisation de 25 millions de pages ($2,5 M) et annonce MSN Live Search  Nov. 2005 : lancement de la World Digital Library par James Billington (Library of Congress + UNESCO) avec l’aide de Google ($3 M)
    70. 70. L’actualité en 2006-2007  Sept. 2006 : réalisation par la BnF d’une maquette (Europeana) préfigurant des accès et services pour une bibliothèque numérique européenne  Déc. 2006 : lancement de MSN Live Search  Mars 2007 : lancement par la BnF du prototype Europeana au Salon du livre (hors ligne depuis fin 2007)  Juillet 2007 : reprise du projet Europeana au niveau européen (géré par EDL Foundation)  Oct. 2007 : lancement de Gallica 2  Mars 2010 : 1 millions de documents accessibles dans Gallica
    71. 71. Que sont devenus ces projets en 2013?  Google recherche de livres en 2012:     30 bibliothèques partenaires pour la numérisation de leurs collections 10 000 éditeurs et auteurs partenaires Interface dans 35 langues Pas de communication sur le nombre de documents (20 Millions évoqués)  Arrêt du programme de numérisation de livres de MSN en mai 2008  Open Content Alliance en novembre 2008 : Open Library  Bibliothèques américaines (Boston Library consortium), canadiennes, universités, Sociétés de l’Internet (une cinquantaine de partenaires)  19,401,009 titres de livres numérisés dont 340,083 en plein-texte  Documents également accessibles sur Internet Archive   http://www.hathitrust.org/ rassemble depuis 2008 les grandes bibliothèques américaines (NYPL, Yale, Cornell, Columbia…)  10,556,750 volumes 5,556,767 livres 274,642 périodiques 3,694,862,850 pages Dont 1 702 727 volumes dans le domaine public en 2010 et 1 437 886 en 2012
    72. 72. Google Recherche de Livres
    73. 73. Hathi Trust
    74. 74. Open Content Alliance
    75. 75. World Digital Library
    76. 76. Europeana
    77. 77. Principales différences entre ces différents projets  Bibliothèque (Gallica, Europeana, WDL) versus Entrepôt (Google, OCA)  Gouvernance centralisée (Google) versus Consortium ou Partenariats (OCA, Europeana, WDL)  Financements majoritairement publics (Europeana, Gallica) versus financements privés (Google, OCA)  Architecture centralisée (Google, OCA) versus architecture répartie (Europeana)  L’utilisateur va vers la ressource (Gallica, Google, Europeana, WDL) versus la ressource va vers l’utilisateur (OCA)  Modèles organisationnels et économiques différents
    78. 78. Les enjeux  Enjeux culturels    Enjeux technologiques     Le Web comme média principal pour la diffusion de l’information et de la connaissance, enjeu de démocratisation culturelle Nécessité de répondre aux attentes des utilisateurs, de s’adapter aux pratiques des internautes (recherche plein texte) Numérisation comme support de sauvegarde et de diffusion machines pour la numérisation de masse Mise en réseaux de ressources dispersées et nécessité d’interopérabilité (coopération) Enjeux économiques    Enjeu commercial : plus de contenu pour attirer plus d’internautes / Enjeu culturel : mission de diffusion et de valorisation des institutions Besoin de contenu/besoin de financement Partenariats public/privé
    79. 79. Gallica
    80. 80. Conclusion : que retenir de tout cela ?
    81. 81. Règle n° 1 : « Numériser, ce n’est pas éditer »  Numériser ce n’est pas   commenter   interpréter améliorer Numériser c’est  reproduire  donner à consulter  aider à lire
    82. 82. Règle n° 2 : « l’information n’est pas connaissance »  Une bibliothèque numérique ce n’est pas     Un entrepôt de données Un moteur de recherche Une librairie en ligne Une bibliothèque numérique c’est     Un ensemble organisé Des services Des informations structurées et contextualisées Un accès à toutes les informations contenues dans un document
    83. 83. Règle n° 3 : « Numériser n’est pas seulement un acte technique »  Les choix techniques ne sont pas     Déterminés uniquement par les moyens financiers Déterminés par le prestataire qui numérise La première chose à décider Les choix techniques sont    Déterminants pour les conditions de consultation Déterminants pour l’interopérabilité Déterminants pour la conservation à long terme
    84. 84. Sélection Collecte / production Préparation à la Gestion d’une collection Acquisition Description : Catalogage 00100000001000000010000000110001001100100011000000100000001 00000001000000010000000110101001110000010000000100000001101 01001000000010000000100000001100010011100100111000001100010 01011010011000000111001001011010011001100110000010101000011 00010011010000111010001100100011001000111010001100000011000 10010111000110110001100100011100101011010001000000010000000 10000000110011001110000011100100111000001011100011011100110 00000100000001000000010000000110010001100110011010100110010 00101110001101000011010100100000001000000010000000100000001 00000001011010011000100101110001101100011011000100000001000 00001000000010110100110111001011100110111001100100010000000 10000000101101001100010011100000101110001101100011000100100 00000100000001011010011100000110000001011000110000001100000 01000000010000000101101001110000011000000101110001100000011 00000010000000100000001000000011000100100000001000000011010 00011001100100000001000000010000000111001001000000010000000 10000000100000001110010011100000111001001011100011010000110 01000100000001000000010000000100000001000000011000100110110 00101110001100000011001000100000001000000010000000100000001 00000001101010011001100101110001110000011001100100000001000 00001000000010000000100000001101010011011000101110001101100 01100100010000000100000001000000010000000100000001000000011 01000010111000111000001100010010000000100000001000000010000 00011011100111001001100110010111000110101001110000010000000 10000000100000001000000010000000100000001100110010111000110 01100110100000010100010000000100000001000000011000100110010 00110000001000000010000000100000001000000011010100111000001 00000001000000011010100100000001000000010000000110001001110 01001110000011000100101101001100000011100100101101001100110 01100000101010000110001001101000011101000110010001100100011 10100011000000110101001011100011011100111000001110000101101 00010000000100000001000000011001100111000001110010011010000 10111000110110001101000010000000100000001000000011001000110 10100110100001101100010111000111000001110000010000000100000 00100000001000000010000001000000010110100111000001100000010 Sélection consultation : Équipement Description : Métadonnées / indexation Préparation à la consultation : Empaquetage Gestion Magasinage Conservation Communication Valorisation Consultation d’une collection Rangement et conserrvatopn d’une collection Constitution d’une collection Bibliothèque physique et bibliothèque numérique Préservation Accès Valorisation
    85. 85. Le rôle du bibliothécaire numérique  Ce qui ne change pas :     Il travaille à la constitution des collections et à l’élaboration des instruments de référence qui permettent d’y accéder Il gère physiquement la collection, veille à son organisation, à son bon état de conservation Il sert d’interface (au sens propre) entre le public et les collections, fait fonctionner les services au public et la collection Ce qui change    Il acquiert des compétences techniques en informatique (architecture Web, capacité à rédiger à cahier des charges – même si ce n’est pas lui qui met en œuvre) Il comprend ce qu’est un document numérique, et la différence avec un document bibliographique et un document analogique, il connaît l’environnement juridique de la propriété intellectuelle Il est capable de traduire en termes ergonomiques ses compétences de service public pour s’adapter à un public distant
    86. 86. Quelques sites  http://gallica.bnf.fr / http://gallica2.bnf.fr  http://www.europeana.eu  http://maquette.bnf.fr/labs/scenario/Europeana.demo.html  http://memory.loc.gov/ammem/index.html  http://www.gutenberg.org  http://cnum.cnam.fr/  www.bvh.univ-tours.fr  http://gdz.sub.uni-goettingen.de/de/index.html  http://www.persee.fr  http://elec.enc.sorbonne.fr/  http://books.google.fr/  http://www.openlibrary.org
    87. 87. Quelques sites                 http://www.wdl.org/fr/ http://bibliotheque-numerique.inha.fr http://www.gutenberg.org/browse/languages/fr http://www.europeana.eu/portal/ http://fr.wikipedia.org/wiki/Wikisource http://www.archive.org http://classiques.uqac.ca/ http://www.e-corpus.org http://www.livres-et-ebooks.fr/ http://www.cairn.info http://www.persee.fr http://www.revues.org/ http://www.erudit.org http://fr.wikisource.org/ http://web2.bium.univ-paris5.fr http://expositions.bnf.fr/livres/
    88. 88. Quelques ressources  Sur le site Numérisation du patrimoine culturel du Ministère de la Culture :   La bibliographie : http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_06.htm, Les fiches techniques : http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_04.htm  Figoblog http://www.figoblog.org/  Affordance : http://affordance.typepad.com/mon_weblog/  Silex : http://scinfolex.wordpress.com/  Tour de toile du BBF (bibliothèques numériques et numérisation) http://blogbbf.enssib.fr/? Bib_num_numerisation  Bibliothèques sur le Web, BBF 2006 - Paris, t. 51, n° 3  Entretiens de la BnF, 7-8 décembre 2006 “Numérique et bibliothèques : le deuxième choc » http://www.bnf.fr/pages/infopro/journeespro/jp_entretiens06.htm  Dico illustré du Web 2.0 http://www.journaldunet.com/diaporama/0610-dicoweb2/index.shtml  http://www.bnf.fr/pages/zNavigat/frame/infopro.htm : rubrique en cours de mise à jour
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×