Tutoriel d'aide à l'installation de Greenstone logiciel libre de création et de gestion de bibliothèque numérique. Présentation mise à jour le 02 février 2016 intégrant notamment l'installation de l'extension PDFBox pour gérer les documents en format PDF récents (version 1.5 et plus).
23. Spécificité liée aux documents PDF
Le Plugiciel PDF permet de
gérer les documents en format
PDF, mais pas les versions les
plus récentes du format à partir
de la version 1.5. Ce qui explique
que certains des documents PDF
seront rejetés au moment de
l’étape de Création de la
collection.
Il faut donc installer l’extension
PDFBOX pour prendre en
compte ces versions du format
les plus récentes.
1.Télécharger l’extension pour
Greenstone à partir de l’adresse
suivante :
http://trac.greenstone.org/browse
r/gs2-extensions/pdf-
box/trunk/pdf-box-java.tar.gz
2.Décompresser le fichier
PDFBOX.Zip et l’extraire dans le
répertoire EXT de l’installation
Greenstone
1
2
23
La partie en haut à droite du panneau "Index de recherche" affiche des informations sur le moteur de recherche utilisé par la collection. Ceci peut être modifié en cliquant sur "Modifier ...". Une fenêtre secondaire apparaît avec la liste d'options : MG, MGPP et Lucene. Modifier ceci affecte la façon dont les index sont construits, et peut affecter la fonctionnalité de recherche.
Pour les index MG, on doit aussi choisir la granularité de l'index en utilisant le menu "Niveau d'indexation :".
Pour un index MGPP ou Lucene, la granularité de l'index est déterminée globalement, et non par l'index. Les niveaux possibles sont affichés sur le panneau principal "Index de recherche", et peuvent être ajoutés à la collection en cochant les cases correspondantes.
Un index particulier est disponible sous MGPP et Lucene : un index «tous champs», qui donne la possibilité d'une recherche combinée sur tous les index spécifiés, sans avoir à préciser un index autre qui contiendrait tous ces éléments. Pour ajouter cet index, cocher la case "Ajouter une recherche combinée sur tous les index" et cliquer sur "Ajouter index".
Pour MGPP et Lucene, un bouton "Ajouter tout" est également disponible. Il s’agit d'un raccourci pour ajouter toutes les métadonnées ainsi que le texte intégral en tant qu'index individuels.
Pour plus d'informations sur les classificateurs, lire le chapitre 2 du Guide du Développeur Greenstone -- Exploitez vos documents au maximum.
Une fois la collection construite, on doit décider de la manière dont elle doit apparaître à l'utilisateur. Quels noms doivent être utilisés pour la liste déroulante de l'index dans le formulaire de recherche? Comment les résultats de recherche doivent être affichés? Quelles métadonnées doivent être affichées lorsqu'un document est visualisé? Tout cela peut être personnalisé.
Les pages web que l’on voit en utilisant Greenstone ne sont pas pré-stockées mais sont générées «à la volée» au fur et à mesure qu'on en fait appel. Les commandes de format sont utilisées pour modifier l'apparence de ces pages générées. Elles déterminent le lieu d'apparition des boutons lorsqu'un document est visualisé, ainsi que les liens qui sont affichés par le classificateur DateList. Les commandes de format ne sont pas faciles à manier, et la lecture du chapitre 2 du Guide du Développeur Greenstone est recommandée : http://www.greenstone.org/manuals/gsdl2/fr/html/Chapter_getting_the_most_out_of_your_documents.htm#Section_formatting_greenstone_output