]> <Text id="2">Guide de l'utilisateur de la bibliothèque numérique Greenstone</Text><Updated date="1-Mar-2004 by unknown"/> Ian H. Witten, Stefan Boddie et John Thompson Département d'informatique,
Université de Waikato, Nouvelle-Zélande
Retourner à l'indexe du manuel Retourner à l'indexe du dessus Greenstone est une suite logicielle destinée à la construction et à la distribution de collections de bibliothèques numériques. Cette suite fournit une nouvelle manière d'organiser l'information et de la publier sur l'Internet ou sur un cédérom. Greenstone est produit par le projet de bibliothèque numérique de Nouvelle-Zélande (dépendant de l'université de Waikato), et distribué en coopération avec l'UNESCO et le projet de bibliothèques pour l'humanité. C'est un logiciel Open Source, qu'on peut obtenir à l'URL http://greenstone.org, et qui est diffusé selon les termes de la licence publique générale de GNU. Nous souhaitons nous assurer que ce logiciel fonctionne bien pour vous.
Faites-nous part, en anglais, de tout problème à l'adresse électronique greenstone@cs.waikato.ac.nz.
Greenstone gsdl-2.70 Mars 2006
<Text id="9">À propos de ce manuel</Text> Ce manuel fournit une description complète de la manière d'utiliser le logiciel Greenstone pour accéder à et construire des collections de bibliothèques numériques. La section  donne une vue d'ensemble des possibilités du logiciel. La section  explique comment utiliser les collections de Greenstone. L'interface parle d'elle-même -- la meilleure façon d'apprendre est d'essayer -- et cette section correspond aux informations d'aide en ligne fournies pour une collection typique. La section  explique la procédure de création d'une bibliothèque propre de collections en utilisant le "Greenstone Librarian Interface" (l'Interface Bibliothécaire de Greenstone). La section  introduit l'outil d'administration, qui permet à l'administrateur système de surveiller ce qui se passe, et de contrôler les droits de construction de collections. Les annexes listent les fonctionnalités du logiciel Greenstone, et donnent un glossaire des termes utilisés dans la documentation de Greenstone.
<Text id="13">Documents d'accompagnement</Text> L'ensemble des documents de Greenstone comprend quatre volumes: Guide d'installation de la bibliothèque numérique Greenstone Guide de l'utilisateur de la bibliothèque numérique Greenstone (ce document-ci) Guide du développeur de la bibliothèque numérique Greenstone Bibliothèque numérique Greenstone: du papier à la collection
<Text id="19">Remerciements</Text> Le logiciel Greenstone a vu le jour grâce à un effort de collaboration entre de nombreuses personnes. Rodger McNab et Stefan Boddie en sont les principaux architectes et développeurs. Des contributions ont été faites par David Bainbridge, George Buchanan, Hong Chen, Michael Dewsnip, Katherine Don, Elke Duncker, Carl Gutwin, Geoff Holmes, Dana McKay, John McPherson, Craig Nevill-Manning, Dynal Patel, Gordon Paynter, Bernhard Pfahringer, Todd Reed, Bill Rogers, John Thompson, et Stuart Yeates. D'autres membres du Projet de bibliothèque numérique de Nouvelle-Zélande ont également donné des conseils et inspiré les concepteurs du système: Mark Apperley, Sally Jo Cunningham, Steve Jones, Te Taka Keegan, Michel Loots, Malika Mahoui, et Lloyd Smith. Nous remercions aussi tous ceux qui ont contribué au développement des modules sous licence GNU GPL qui font partie de cette distribution: MG, GDBM, PDFTOHTML, PERL, WGET, WVWARE, XLHTML.
<Text id="21">Vue d'ensemble de Greenstone</Text> Greenstone est un système complet pour construire et présenter des collections de milliers ou de millions de documents, comprenant du texte, des images, des contenus audio et vidéo.
<Text id="23">Les collections</Text> La bibliothèque numérique typique construite avec Greenstone contient de nombreuses collections, organisées individuellement -- même si elles ont un air de famille prononcé. Elles sont faciles à maintenir, et on peut facilement y ajouter du contenu et les reconstruire automatiquement. Il existe plusieurs manières de retrouver de l'information dans la plupart des collections Greenstone. On peut par exemplerechercher des mots particuliersapparaissant dans le corps du texte ou dans une section du document. On peut aussiconsulter des documents par leur titre: il suffit alors de cliquer sur un livre pour le lire. On peut encoreconsulter des documents par thème. Les thèmes représentent les étagères de la bibliothèque: il suffit de cliquer sur une étagère pour en voir les livres. Quand cela a un sens, les documents sont fournis avec une table des matières: on peut alors cliquer sur un chapitre ou sur une sous-section pour en lire le contenu, on peut développer toute la table des matières, ou encore développer tout le document dans la fenêtre de son navigateur (ce qui est utile pour imprimer). Le site web de la bibliothèque numérique de Nouvelle-Zélande (nzdl.org) propose de nombreux exemples de collections. La page de garde de chaque collection présente l'objectif et la couverture de la collection, et en explique l'organisation. On peut consulter la plupart des collections en y recherchantdes mots-clefs ou en ynaviguant. Lors de recherches, le logiciel Greenstone examine l'ensemble du texte de tous les documents de la collection (ce qui s'appelle une «recherche dans le corps du texte»). Dans la plupart des collections l'utilisateur peut choisir entre plusieurs index, construits à partir de différentes portions des documents. Certaines collections disposent d'un index des documents complets, d'un index des paragraphes, et d'un index des titres, dans lesquels on peut rechercher des mots ou des groupes de mots particuliers. On peut de cette manière retrouver tous les documents contenant un ensemble de mots précis (les mots pouvant s'étaler sur tout le document), tous les paragraphes qui contiennent ce même ensemble de mots (les mots doivent alors tous apparaître dans le même paragraphe), ou tous les documents dont les titres contiennent les mots recherchés (les mots doivent alors se trouver dans les titres du document). On peut rencontrer d'autres index, comme par exemple un index des sections, ou encore un index des en-têtes de sections. Lors de navigations, l'utilisateur examine des listes: liste des auteurs, liste des titres, liste des dates, structures de classification hiérarchiques, etc. Différentes collections proposeront différentes manières de naviguer.
<Text id="27">Trouver l'information</Text> Greenstone construit des index portant sur le corps du texte à partir des contenus textuels du document -- ce sont des index qui permettent de rechercher tout mot apparaissant dans le texte du document. On peut rechercher dans les index des mots particuliers, des ensembles ou des groupes de mots, et les résultats sont ordonnés en fonction de leur pertinence par rapport à la requête. Dans la plupart des collections, des données descriptives telles que l'auteur, la date, des mots-clefs, etc., sont associées à chaque document. On appelle ces informations «méta-données». De nombreuses collections de documents contiennent également des index portant sur le texte de certains types de méta-données. De nombreuses collections proposent par exemple un index de recherche dans les titres des documents. Les utilisateurs peuvent naviguer de manière interactive à travers des listes et des structures hiérarchiques qui sont engendrées à partir des méta-données associées à chaque document de la collection. Les méta-données forment la matière première de la navigation: elles doivent être explicitement fournies, ou bien il doit être possible de les obtenir automatiquement à partir des documents eux-mêmes. Différentes collections proposeront différentes manières de naviguer. Les index de recherche et de navigation sont créés lors d'un processus de «construction», en se basant sur les informations fournies dans le fichier de configuration de la collection. Greenstone crée toutes ses structures d'index automatiquement à partir des documents et des fichiers qui les accompagnent: rien n'est fait manuellement. Si de nouveaux documents du même format sont disponibles, ils peuvent être automatiquement fusionnés au reste de la collection. En fait, pour la plupart des collections, tout ceci est pris en charge par des processus qui s'exécutent régulièrement, partent à la recherche de nouveaux contenus, et reconstruisent les index -- le tout sans aucune intervention manuelle.
<Text id="32">Les formats de documents</Text> Les documents originaux sont dans un grand nombre de formats, et sont traduits sous une forme XML standard à l'aide de «greffons» (plugins). Les greffons distribués avec Greenstone sont capables de traiter des documents aux formats texte brut, HTML, Word, PDF, et les messages électroniques (de courrier ou de groupes de discussion). On peut écrire de nouveaux greffons pour de nouveaux types de documents (pour ce faire, il faudra préalablement étudier le Guide du développeur de la bibliothèque numérique Greenstone). Pour construire des structures de navigation à partir de méta-données, on utilise de même un système de «classificateurs». Ces derniers créent des index de navigation de divers types: listes déroulantes, sélecteurs alphabétiques, dates et autres hiérarchies arbitraires. Ici encore, des programmeurs Greenstone peuvent créer de nouvelles structures de navigation.
<Text id="34">Documents multimédia et multilingues</Text> Les collections peuvent comprendre du texte, des images, des contenus audio et vidéo. Les contenus non textuels peuvent être reliés aux documents textuels ou accompagnés de descriptions textuelles (telles que les légendes des figures) pour pouvoir être accessibles depuis une recherche dans le corps du texte ou la navigation. Greenstone utilise partout Unicode, qui est un système standard pour représenter les jeux de caractères des langues du monde. Ceci permet de traiter et de représenter toutes les langues de manière consistante. On a construit des collections avec de l'anglais, de l'arabe, du chinois, de l'espagnol, du français, et du maori. Les collections multilingues intègrent une reconnaissance automatique de la langue, et l'interface est disponible dans toutes les langues mentionnées ci-dessus (entre autres).
<Text id="37">Distribuer Greenstone</Text> Les collections sont mises à disposition sur l'Internet ou publiées, sous une forme exactement semblable, sur un cédérom qui s'installe automatiquement sous Windows. Les textes et les index sont compactés, et un protocole CORBA permet de gérer les collections distribuées et les interfaces de requêtes graphiques. La bibliothèque numérique de Nouvelle-Zélande (nzdl.org) fournit de nombreux exemples de collections, y compris des documents historiques, des informations humanitaires et de développement, des rapports techniques et des bibliographies, des 1#1uvres littéraires, et des magazines. Sa nature Open Source fait de Greenstone un logiciel facile à compléter, et il bénéficie de l'inclusion de modules sous licence publique générale de GNU pour la recherche dans le corps du texte, la gestion des bases de données, et l'extraction de texte depuis des formats de documents propriétaires. Seule une coopération internationale permettra aux logiciels de bibliothèque numérique de devenir suffisamment complets et de satisfaire les besoins des utilisateurs en richesse comme en souplesse.
<Text id="41">Utilisation des collections Greenstone</Text> Le logiciel Greenstone a été conçu dans un souci d'ergonomie. Les interfaces des collections sont identiques, sur le web comme sur des cédéroms. L'installation de Greenstone à partir du cédérom est une opération très simple, sur tout ordinateur équipé de Windows ou de Linux: un programme d'installation standard complète des binaires pré-compilés. On peut utiliser une collection localement, sur l'ordinateur où elle est installée; on peut aussi, si cet ordinateur est relié à un réseau, autoriser de manière automatique et transparente l'accès à cette collection depuis tous les autres ordinateurs du réseau. La section suivante décrit l'installation d'un cédérom de Greenstone. Nous examinerons ensuite les possibilités de recherche et de navigation offertes par une collection Greenstone représentative: la collection «Demo», fournie avec Greenstone. D'autres collections présenteront des fonctionnalités semblables: savoir en manipuler une, c'est savoir les manipuler toutes. Vient ensuite une explication sur la manière d'adapter l'interface à vos propres besoins à l'aide de la page de préférences.
<Text id="44">Utilisation d'un cédérom de Greenstone</Text> Le logiciel de bibliothèque numérique Greenstone lui-même est distribué sur un cédérom, et votre administrateur système ou vous l'avez déjà installé sur votre système, en suivant les instructions du Guide d'installation de la bibliothèque numérique Greenstone. Si telle est bien votre situation, Greenstone est déjà installé sur votre ordinateur et vous pouvez négliger de lire le reste de la présente section et passer directement à la suivante. Certaines collections Greenstone sont distribuées sur un cédérom minimal, qui contient juste assez du logiciel pour n'utiliser que cette collection. Pour utiliser un tel cédérom, il suffit de l'insérer dans le lecteur de cédérom sur tout ordinateur personnel équipé de Windows. Dans la plupart des cas (si le programme autorun est activé), une fenêtre apparaîtra, qui vous invitera à installer le logiciel Greenstone. Dans le cas contraire, trouvez le lecteur de cédérom (sur les systèmes Windows actuels, on y parvient en double-cliquant sur l'icone Mon ordinateur, située sur le bureau), et double-cliquez dessus, puis sur le fichier Setup.exe qu'elle contient. Le programme Setup de Greenstone sera alors exécuté et vous guidera tout au long de la procédure d'installation. La plupart des gens se contentent de répondre oui (yes) à toutes les questions. À la fin de la procédure d'installation, vous trouverez la bibliothèque dans le sous-menu Programmes du menu Démarrer de Windows, et elle portera le nom de la collection, comme par exemple, Humanity Libraries («bibliothèques pour l'humanité) ou United Nations University («université des Nations-Unies»). Une fois que le logiciel a été installé, vous entrerez automatiquement dans la bibliothèque à chaque insertion du cédérom, si le programme autorun est activé.
<Text id="49">Trouver l'information</Text> La meilleure manière d'apprendre à utiliser une collection Greenstone est de pratiquer. Pas d'inquiétude -- vous ne pouvez rien casser. Cliquez partout et sans crainte: la plupart des images qui apparaîtront sur votre écran réagissent aux clics. Si vous maintenez le pointeur de la souris au-dessus d'une image, la plupart des navigateurs afficheront un message qui vous expliquera ce qui se passera si vous cliquez. Faites l'expérience! Choisissez des mots communs tels que «le» (the) ou «et» (and) en tant que critères de recherche -- voilà qui devrait fournir des réponses, et vous ne pourrez rien casser. Les bibliothèques numériques Greenstone comprennent souvent plusieurs collections distinctes -- par exemple, des rapports scientifiques et techniques, des 1#1uvres littéraires, des FAQ de l'Internet, des magazines. Le système de bibliothèque numérique disposera d'une page d'accueil qui vous permettra d'accéder à toute collection publiquement accessible; de plus, chaque collection dispose de sa propre page «à propos» qui vous fournira toutes les informations relatives à l'organisation de la collection et aux principes guidant ce qui y est inclus. Pour retrouver cette page à tout moment, cliquez simplement sur l'icone de «collection» qui apparaît dans le coin supérieur gauche de toutes les pages de recherche et de navigation. La figure  présente une copie d'écran de la collection «Demo», fournie avec le logiciel Greenstone, et qui représente un tout petit sous-ensemble de la collection de bibliothèque de développement pour l'humanité; nous l'utiliserons comme référence pour la description des différentes manières de trouver de l'information. Si vous ne trouvez pas la collection «Demo», utilisez à la place la bibliothèque de développement pour l'humanité: elle lui ressemble en tous points. D'abord, on peut cliquer sur presque toutes les icones. Plusieurs icones apparaissent au sommet de la plupart des pages; le tableau  explique leur signification.
<Text id="54">Utilisation de la collection «Demo»</Text>
<Text id="55">Signification des icones situées au sommet de chaque page</Text>
Vous emmène sur la page «à propos»
Vous emmène sur la page d'accueil de la bibliothèque numérique, depuis laquelle vous pourrez choisir une autre collection
Fournit un texte d'aide similaire au présent
Vous permet de mettre en place des options d'interface utilisateur et de recherche qui seront dès lors sélectionnées
La barre située juste dessous, intitulée «recherche ... thèmes ... titres a-z ... organisation ... comment faire» vous donne accès aux fonctionnalités de recherche et de navigation. Le bouton le plus à gauche sert aux recherches, et les autres boutons -- au nombre de quatre dans la cette collection -- évoquent plusieurs types de navigation. Ces quatre derniers boutons peuvent varier d'une collection à l'autre. <Text id="61">Comment trouver de l'information</Text> Le tableau  montre les cinq manières de trouver de l'information dans la collection «Demo». <Text id="63">Signification des icones de la barre de recherche/navigation</Text>
Recherche de mots-clefs particuliers
Accès aux publications par thème
Accès aux publications par titre
Accès aux publications par organisation
Accès aux publications par listes de «comment faire»
Vous pouvez rechercher des mots-clefs particuliersdans le corps du texte à partir de la page de «recherche» (semblable en tous points à la page «à propos» présentée dans la figure , à ceci près qu'elle ne contient pas la mention à propos de cette collection). On atteint la page de recherche en cliquant sur le bouton Rechercher. Vous pouvezaccéder aux publications par thèmeen cliquant sur le bouton Thèmes. Ceci affiche une liste de thèmes, représentés par des étagères qu'on peut ensuite développer en cliquant dessus. Vous pouvezaccéder aux publications par titreen cliquant sur le bouton titres a-z. Ceci affiche une liste de livres par ordre alphabétique. Vous pouvezaccéder aux publications par organisationen cliquant sur le bouton organisation. Ceci affiche une liste d'organisations. Vous pouvezaccéder aux publications par liste de «comment faire»en cliquant sur le bouton comment faire. Ceci affiche une liste de «comment faire». Tous ces boutons sont visibles dans la figure .
<Text id="70">Comment lire les documents</Text> Dans la collection «Demo», on sait qu'on est arrivé à un livre particulier quand on voit apparaître la photographie de sa couverture (comme sur la figure ). Une table des matières jouxte cette image: la ligne en gras marque l'endroit courant, qui est dans le cas présent Introduction and Summary («introduction et résumé»), c'est-à-dire la première section du livre considéré. On peut développer cette table des matières: cliquer sur les dossiers aura pour effet de les ouvrir ou de les fermer. Cliquer sur le livre ouvert au sommet le fermera. Vient ensuite le texte de la section courante (The international demand for tropical butterflies... -- «la demande internationale en papillons tropicaux...» dans l'exemple cité, juste sous l'illustration). À la fin de la lecture, des flèches vous proposeront de passer à la section suivante ou de revenir sur la section précédente. Sous la photographie, on trouve quatre boutons. Cliquer sur Détacher créera une nouvelle fenêtre de navigateur pour ce seul livre (ce qui est utile si on souhaite comparer des livres, ou en lire plusieurs à la fois). Si vous avez atteint ce livre suite à une opération de recherche, les termes de la recherche seront mis en valeur: le bouton Supprimer la mise en évidence désactive cette fonctionnalité. Cliquer sur Développer le texte développera tout le texte de la section ou du livre en cours. Cliquer sur Développer le contenu présentera toute la table des matières du livre, de sorte que vous pourrez voir les titres de tous les chapitres et sous-sections. Dans certaines collections, les documents ne disposent pas d'une telle structure hiérarchique. Dans ce cas, aucune table des matières n'est affichée lorsque l'on parvient sur un document particulier -- on ne dispose alors que du texte du document. Dans certains cas, le document est divisé en pages, qu'on peut alors lire dans l'ordre, ou passer d'une page à une autre.
<Text id="75">Un livre de la collection «Demo»</Text>
<Text id="76">Signification des icones</Text> Lorsque vous naviguerez dans la collection, vous trouverez les éléments présentés au tableau . <Text id="78">Comment rechercher des mots-clefs particuliers</Text> À partir de la page de recherche, suivez les étapes suivantes pour effectuer une requête: Spécifiez les unités concernées par la recherche: dans la collection «Demo» vous pouvez effectuer des recherches dans les titres des sections ou dans le corps du texte des livres. Précisez si vous souhaitez rechercher tout ou partie des mots-clefs indiqués. Tapez les mots que vous souhaitez rechercher dans la boîte de requête. Cliquez sur le bouton Débuter la recherche. Lorsque vous effectuez une requête, les titres des documents correspondants seront présentés par paquets de 20 au maximum. Un bouton situé à la fin vous emménera aux 20 suivants, d'où d'autres boutons vous emméneront aux 20 suivants, ou vous permettront de revenir 20 premiers, et ainsi de suite. Cependant, des soucis d'efficacité ont dicté le choix d'un maximum de 100 documents renvoyés pour toute requête. Vous pourrez changer ces nombres en cliquant sur le bouton préférences situé au sommet de la page. <Text id="85">Icones que vous rencontrerez lors de la navigation</Text>
Cliquez sur l'icone d'un livre pour lire le livre correspondant
Cliquez sur une étagère pour examiner les livres relatifs à ce thème
Visualiser ce document
Ouvrir ce dossier et visualiser son contenu
Cliquez sur cette icone pour fermer le livre
Cliquez sur cette icone pour fermer le dossier
Cliquez sur la flèche pour continuer vers la prochaine section...
...ou pour revenir à la section précédente
Ouvrir cette page dans une nouvelle fenêtre
Développer la table des matières
Afficher tout le texte
Mettre en valeur les termes de la recherche
Cliquer sur le titre de tout document ou sur la petite icone qui le jouxte aura pour effet de l'ouvrir. L'icone peut représenter un livre, un dossier, ou une page: ce sera un livre si vous recherchez parmi des livres; dans le cas contraire, si vous recherchez parmi des sections, ce sera une icone de dossier ou de page selon que la section trouvée dispose ou non de sous-sections. <Text id="99"><i>Termes de la recherche</i></Text> Ce que vous taperez dans la boîte de requête sera interprété comme une liste de mots appelée «termes de la recherche». Chaque terme de la recherche ne peut contenir que des lettres de l'alphabet ou des chiffres, et les termes sont séparés par des blancs. Tous les autres caractères apparaissant, tels que des signes de ponctuation, seront interprétés comme des séparateurs de termes, exactement comme les blancs. Ils ne seront donc pas pris en compte: vous ne pouvez pas rechercher des mots incluant des signes de ponctuation. Par exemple, la requête: Agro-forestry in the Pacific Islands: Systems for Sustainability (1993)
(«agriculture-et-forêt dans les îles du Pacifique: systèmes de durabilité (1993)»)
sera traitée exactement comme: Agro forestry in the Pacific Islands Systems for Sustainability 1993
(«agriculture et forêt dans les îles du Pacifique systèmes de durabilité 1993»)
<Text id="105"><i>Types de requêtes</i></Text> On trouve deux types de requêtes: Des requêtes sur tous les termes. Ces requêtes recherchent des documents (ou des chapitres, ou des titres) qui contiennent tous les termes spécifiés. Les documents qui satisfont la requête sont affichés. Des requêtes sur certains termes. Contentez-vous de lister des termes susceptibles d'apparaître dans les documents que vous recherchez. Les documents sont affichés par ordre de degré de satisfaction de la requête. Lors du calcul du degré de satisfaction d'une requête: plus un document contient de termes de recherche, mieux il correspond; les termes rares sont plus importants que les termes communs; les documents courts reçoivent un score plus élevé que les documents volumineux. Utilisez autant de termes de recherche que vous le désirez -- une phrase complète, ou même un paragraphe complet. Si vous ne spécifiez qu'un seul terme, le choix d'une requête sur tous les termes ou sur certains termes n'aura que peu d'importance, à ceci près que dans le second cas, les résultats seront triés en fonction de la fréquence d'apparition du terme de la recherche.
<Text id="113">Portée des requêtes</Text> Dans la plupart des collections vous pourrez choisir parmi différents index de recherche. On peut trouver par exemple des index des auteurs ou des titres, ou bien des chapitres ou des paragraphes. En général, tout le document correspondant est renvoyé, quel que soit l'index de recherche utilisé. Si les documents sont des livres, ils seront ouverts à l'endroit approprié. <Text id="116">Fonctionnalités de recherche avancée</Text> Même si la plupart des besoins de recherche sont satisfaits par ce qui est décrit ci-dessus, Greenstone propose des fonctionnalités de recherche avancée. On les active à partir de la page de préférences, qu'on atteint en cliquant sur le bouton préférences, situé au sommet de la page. Après avoir modifié vos préférences, ne revenez pas «en arrière» dans votre navigateur -- cela aurait pour effet d'annuler les modifications. Cliquez plutôt sur n'importe lequel des boutons de la barre de recherche/navigation. <Text id="118"><i>Dépendance à la casse et troncature</i></Text> Lors de la spécification de termes de recherche, on peut décider si les majuscules et minuscules doivent correspondre entre la requête et le document: c'est la «dépendance à la casse». On peut aussi choisir de ne prendre en compte que les racines des mots et d'ignorer les terminaisons: c'est la «troncature». Sous Options de recherche dans la page préférences, vous trouverez deux boutons libellés ignorer la casse et les majuscules et les minuscules doivent correspondre; ces boutons contrôlent la dépendance à la casse. Suivent deux boutons libellés ignorer la fin des mots et le mot entier doit correspondre: ils contrôlent la troncature. Si on sélectionne par exemple les boutons ignorer la casse et ignorer la fin des mots, la requête: African building
(«Africaine construction»)
sera traitée de la même manière que: africa builds
(«afrique construit»)
car la majuscule du mot «African» sera transformée en minuscule, et car les suffixes «n» et «ing» seront respectivement ôtés des mots «African» et «building» (de même, le suffixe «s» serait ôté du mot «builds»). On conseille en général d'ignorer la casse et les terminaisons sauf dans le cadre de recherches de mots ou d'acronymes particuliers.
<Text id="127"><i>Recherche de groupes de mots</i></Text> Si votre requête comprend un groupe de mots entre apostrophes doubles (""), seuls les documents contenant ce groupe de mots, exactement tel que saisi par vous, seront renvoyés. Si vous souhaitez utiliser la recherche de groupes de mots, il vous faut apprendre un peu son fonctionnement. Les groupes de mots sont traités par un examen post-recherche. D'abord, la requête est effectuée de la manière habituelle -- tous les mots du groupe de mots sont inclus dans les termes de la recherche -- puis les documents renvoyés sont examinés pour éliminer ceux où le groupe de mots précisé n'apparaît pas. Lors de l'examen post-recherche, les groupes de mots sont pris tels qu'ils sont, et ceci inclut tout signe de ponctuation. Par exemple, la requête: what's a "post-retrieval scan?"
(qu'est-ce qu'un «examen post-recherche»?)
rapatriera d'abord tous les documents correspondant aux mots: what s a post retrieval scan puis les documents renvoyés seront examinés à la recherche du groupe de mots: post-retrieval scan?
(examen post-recherche?)
Les recherches de groupes de mots sont indépendantes de la casse si on a sélectionné le bouton ignorer la casse sur la page préférences.
<Text id="136"><i>Mode de requête avancé</i></Text> Dans le mode de requête avancé, qu'on peut sélectionner sur la page de préférences, les requêtes pour tous les mots, telles que décrites ci-dessus, sont en réalité des requêtes booléennes. Elles consistent en une liste de termes reliés par des opérateurs logiques «&» (et), «|» (ou), et «!» (non). Toute absence d'opérateur entre des termes de recherche sera interprétée comme un «&» (et): c'est pourquoi une recherche ne précisant aucun opérateur renvoie des documents contenant tous les termes de la requête. Si les mots «AND», «OR», et «NOT» apparaissent dans votre requête, ils sont traités comme des termes de recherche ordinaires, et non pas comme des opérateurs. Pour utiliser les opérateurs il faut préciser «&», «|», et «!». On peut de plus utiliser des parenthèses pour préciser les priorités. <Text id="139"><i>Utiliser l'historique de recherche</i></Text> En activant la fonctionnalité d'Historique de la recherche dans la page de préférences, vous aurez accès à vos dernières recherches, ainsi qu'une vue synthétique du nombre de résultats qu'elles ont fourni. Cliquez sur le bouton jouxtant l'une des recherches antérieures pour copier le texte de cette recherche dans la boîte de requête. Ceci facilite la répétition de versions légèrement modifiées de requêtes précédentes.
<Text id="141">Changer les préférences</Text>
<Text id="142">La page de «préférences»</Text>
Cliquer sur le bouton préférences situé en haut de la page vous permettra de modifier certains aspects de l'interface pour qu'elle corresponde mieux à vos propres souhaits. Les préférences sont propres à la collection; vous en trouverez un exemple dans la figure . Lors de l'ajustement des préférences de recherche, il vaut mieux cliquer sur le bouton Appliquer (illustré figure ). Après le positionnement des préférences, ne revenez pas «en arrière» dans votre navigateur -- cela aurait pour effet d'annuler les modifications. Cliquez plutôt sur n'importe lequel des boutons de la barre d'accès, vers le haut de la page. <Text id="144">Préférences de collection</Text> Certaines collections comprennent plusieurs sous-collections, dans lesquelles on peut mener des recherches indépendantes ou groupées, comme si elles ne formaient qu'une unité. Si c'est le cas, vous pouvez choisir quelles sous-collections inclure dans vos recherches dans la page de préférences. <Text id="146">Préférences de langue</Text> Chaque collection dispose d'une langue de présentation par défaut, mais vous pouvez choisir une autre langue si tel est votre désir. Vous pouvez aussi modifier l'encodage utilisé par Greenstone en alimentation de votre navigateur -- le logiciel a des valeurs par défaut raisonnables, mais un autre encodage fournit de meilleurs résultats sur certains navigateurs. Toutes les collections permettent de passer d'une interface graphique standard à une interface textuelle. Ceci est particulièrement utile pour les mal voyants utilisant de grosses polices à l'écran, ou pour les personnes utilisant un synthétiseur vocal sur leur ordinateur. <Text id="148">Préférences de présentation</Text> Selon les collections, on peut trouver d'autres options pour contrôler la présentation. Les collections de pages web vous permettront de supprimer la barre de navigation de Greenstone au sommet de chaque page de document, de telle sorte qu'une recherche vous mène directement à la page web correspondante, sans en-tête Greenstone. Pour mener une autre recherche il vous faudra revenir «en arrière» dans votre navigateur. Ces collections vous permettront également de supprimer le message d'avertissement de Greenstone lorsque vous cliquerez sur un lien qui vous ménera hors de la collection de bibliothèques numériques, vers le web. Enfin, certaines collections web vous permettront de décider si les liens de la page de Résultats de la recherche doivent vous mener directement vers l'URL concernée, ou vers une copie de la page au niveau de la bibliothèque numérique. <Text id="150">Préférences de recherche</Text> Sous Préférences de recherche dans la figure , les deux premiers boutons vous permettent d'obtenir une grosse boîte de requête, de manière à effectuer facilement des recherches de la taille d'un paragraphe. Dans Greenstone, il est étonnamment rapide de rechercher des portions importantes de texte. Les deux paires de boutons suivantes contrôlent le type de texte trouvé par les recherches effectuées. Le premier groupe (libellé Respecter la casse:) contrôle la distinction majuscules/minuscules. Le second groupe, La fin des mots:, contrôle la prise en compte ou non des fins de mots. Le prochain couple de boutons vous fera passer en mode de recherche «avancée», tel que décrit ci-dessus, ce qui vous permettra de spécifier des requêtes plus précises en combinant des termes par les opérations «et» (&), «ou» (|), et «non» (!). Vous pouvez activer ou désactiver la fonctionnalité d'historique de recherche, mentionnée précédemment. Enfin, vous pouvez contrôler le nombre de résultats renvoyés, ainsi que le nombre de résultats présentés sur chaque écran, grâce à la dernière entrée de la figure .
<Text id="153">Créer une collection Greenstone</Text> La voie la plus simple pour créer de nouvelles bibliothèques est d'utiliser "Greenstone Librarian Interface" (l'Interface Bibliothécaire de Greenstone), GLI. Cela vous permet de rassembler une série de documents, importer ou assigner des méta-données, de les intégrer dans une collection Greenstone. Elle permet cinq activités de base qui peuvent être interpolées mais qui sont normalement entreprises dans cet ordre: Copier le document de l'espace fichiers de l'ordinateur, y compris les collections existantes, vers la nouvelle collection. Toute méta-donné existante reste "attachée" à ces documents. Des documents peuvent être collectés à partir du web par le biais d'une fonctionnalité de mirroring incorporée. Enrichir les documents en ajoutant des métadatas supplémentaires à des documents individuels ou des groupes de documents. Concevoir la bibliothèque en déterminant son aspect et les fonctionnalités d'accès qu'elle permet. Mettre sur pied la bibliothèque en utilisant Greenstone. Prévisualiser la bibliothèque nouvellement créée, qui aura été installée dans votre page Greenstone en tant que collection ordinaire. "Librarian Interface" (l'Interface Bibliothécaire) vous permet d'ajouter aux documents ce qu'on appelle méta-données "externes", des méta-données rattachées au document dans son ensemble. Mais les documents ont souvent besoin d'être structurés en sections et sous sections, et des méta-données "internes" peuvent être associées à chaque partie. Dans Greenstone, des documents sources peuvent être "marqués" avec cette information, ce qui sera expliqué dans la section . Enfin, une autre alternative pour la création de collections est fournie par le Collecteur "Collector" qui aide à confectionner de nouvelles collections, de modifier ou d'ajouter des éléments à des collections existantes, ou de supprimer des collections. Dans la plupart des cas, le "Librarian Interface" (l'Interface Bibliothécaire), plus recent, devrait être utilisé en lieu et place du collecteur. Ceci sera décrit dans la section . Pour utiliser la puissance entière de Greenstone pour construire des collections avancées il faut aussi lire chapitre du Guide de développeur.
<Text id="163">l'Interface du Bibliothécaire</Text> Examinons un exemple simple pour expliquer le fonctionnement de l'Interface du Bibliothécaire de greenstone. Les figures de à sont des captures d'écran en divers points durant l'interaction. Cet exemple utilise les documents de la collection DLS "Development Library subset" qui est distribuée avec Greenstone. Pour des besoins de l'exposé, la procédure prend la forme d'un passage simple à travers les étapes énumérées ci-dessus. Un modèle d'utilisation plus réaliste pour les utilisateurs est de passer successivement de l'avant à l'arriière à travers les différentes étapes au fur et à mesure que l'exécution se poursuit. L'interface bibliothécaire peut fonctionner dans un de 4 mode: Assistant Bibliothécaire, Bibliothécaire, Spécialiste des Systemes Bibliothécaires, et Expert. Ces modes cotrolent les niveaux de détails dans l'interface, et peut etre changé à travers 'Préférences' par le menu 'Fichier'. Pour consulter cette partie, il faut que l'interface soit dans le mode pré-construit, Bibliothécaire. <Text id="166">Démarrage</Text> Lancer le "Librarian Interface" (l'Interface Bibliothécaire) sous Windows en sélectionnant "Greenstone Digital Library" (Bibliothèque numérique de Greenstone) dans la section des Programmes du menu "Démarrer" et en choisissant "Librarian Interface". SI vous utilisez Unix, taper plutôt: cd ~/gsdl cd gli ./gli.sh où /gsdl est le répertoire contenant le système Greenstone. Pour commencer, on peut soit ouvrir une collection existante, soit en débuter une nouvelle. La figure  montre l'utilisateur en train de débuter une nouvelle collection. Il a sélectionné "Nouveau" dans le menu Fichier et a commencé à fournir les informations générales sur la collection -- son titre, l'adresse électronique de la personne responsable et une description sommaire du contenu, dans une fenêtre pop up. Le titre de la collection est une courte expression utilisée dans la bibliothèque numérique pour identifier le contenu de la collection : les collections existantes ont des noms tels que Bibliothèque de la nourriture et de l'alimentation, Bibliothèque de l'environnement Mondial et ainsi de suite. Lorsque vous tapez le titre, le système attribue un identificateur mnémotechnique unique, le "nom" de la collection, pour un usage interne (Vous pouvez le changer si vous voulez). L'adresse électronique précise le premier point de contact pour tout problème rencontré avec la collection. La description sommaire est une déclaration qui décrit les principes qui gouvernent ce qui est inclus dans la collection. Il apparaît sous le titre "À propos de cette collection" sur la page initiale de la collection.
<Text id="170">Création d'une nouvelle collection</Text>
<Text id="171">Exploration de l'espace de fichiers local</Text>
A ce point, l'utilisateur décide soit de baser la nouvelle collection sur la structure d'une collection existante, soit de créer une collection d'un type totalement nouveau. Dans la figure , il a choisi de la baser sur la collection DLS " Development Library Subset ". Cela implique que la série de méta-données "DLS" qui est utilisée dans cette collection sera utilisée dans la nouvelle collection. (En fait, cette série de méta-données a été utilisée pour mettre sur pied plusieurs collections Greenstone qui partagent une structure et une organisation communes mais avec un contenu différent, comme les collections DLS "Development Library Subset" et la collection de démonstration fournies comme modèles avec Greenstone. Le jeu de méta-données de DLS contient les éléments suivants: Titre Sujet Langue Organisation Mot-clé (c.-à-d. "Howto") (En plus, il y a un élément de méta-donnée appelé "AZList" qui est utilisé pour déterminer la case de la liste alphabétique qui contient le titre du document, avec des valeurs comme "A-B" ou "C-D-E". Ceci est utilisé pour avoir un contrôle précis sur les divisons à l'intérieur de la liste. Pour la plupart des autres collections il est absent, et Greenstone attribue lui-même les récipients.) Si, au contraire, l'utilisateur avait choisi utilise "Nouvelle collection" à ce stade, il lui est demandé de sélectionner jeux de méta-données qui doivent être utilisés dans la nouvelle collection. Trois jeux standard sont pré-fournis: "Dublin Core", le jeu de méta-données DLS mentionnée ci-dessus et un jeu qui comprend les éléments de méta-données extraits automatiquement par Greenstone à partir des documents de la collection. L'utilisateur peut aussi créer de nouveaux jeux de méta-données en utilisant un paneau popup activé à travers le menu "metadata" (méta-données). Plusieurs jeux de méta-données différents peuvent être associés à la même collection; le système les maintient distinctes (si bien que par exemple, des documents peuvent avoir à la fois un titre "Dublin Core" et un titre DLS). Les différents jeux sont clairement distinguées dans l'interface. Dans les coulisses, les jeux de méta-données sont représentés en XML.
<Text id="182">Assemblage du matériel source</Text> Après avoir cliqué sur le bouton "OK" du popup "Nouvelle collection", les parties restantes de l'interface, qui étaient grises avant, deviennent actives. Le panneau "Rassembler", sélectionné par l'onglet éponyme en haut de la figure , est initialement affiché. Ceci permet à l'utilisateur d'explorer l'espace de fichiers local et les collections existantes tout en rassemblant les documents choisis pour la nouvelle collection. Le panneau est divisé en deux sections, celle de gauche pour naviguer parmi les structures existantes et celle de droite pour les documents dans la collection. Les opérations disponibles à cette étape sont: Navigation dans la hiérarchie de la structure existante des fichiers, et dans celle qui est en cours de création, de la manière usuelle. "Glisser-coller" de fichiers dans la nouvelle collection. Sélection multiple de fichiers. "Glisser-coller" de sous-hiérarchies entières. Suppression de documents de la collection naissante. Création de nouvelles sous-hiérarchies à l'intérieur de la collection. Filtrage des fichiers visibles aussi bien dans le système de fichiers local que dans la collection; filtrage basé sur des groupes prédéterminés ou sur des termes contenus dans des fichiers. Invocation du programme approprié pour afficher les contenus du fichier sélectionné en le double-cliquant. Une attention particulière est prise pour traiter les collisions de noms identiques quand des fichiers de même nom dans différentes parties de la structure de répertoires de l'ordinateur sont copiés dans le même répertoire de la collection. Dans la figure , l'utilisateur utilise l'affichage interactif de l'arborescence des fichiers pour explorer le système local de fichiers. A ce stade, la collection sur la droite est vide; l'utilisateur la remplit en opérant un "glisser-coller" des fichiers d'intérêt du panneau de gauche vers le panneau de droite. De tels fichiers sont "copiés" plutôt que "déplaces": de cette façon, le système de fichiers original n'est pas perturbé. Les techniques usuelles de sélection multiple, de "glisser-coller", de structuration de la nouvelle collection en créant des sous-répertoires et de suppression de fichiers en les déplaçant vers la corbeille, sont toutes disponibles. Les collections existantes sont représentées par un sous-répertoire à gauche appelé "Collections Greenstone", qui peut être ouvert et exploré comme tout autre répertoire. Cependant, les documents qui s'y trouvent diffèrent des fichiers ordinaires parce qu'ils ont des méta-données qui leurs sont attachées et ceci est conservé quand ils sont déplacés vers une nouvelle collection. Des conflits peuvent arriver lorsque des méta-données ont été assignées en utilisant un jeu de méta-données différent de celui en cours d'utilisation, et il revient à l'utilisateur de les résoudre. Dans la figure , l'utilisateur a sélectionné des documents à partir de la collection existante et les a ajoutés à la nouvelle collection. La fenêtre pop up explique que l'organisation des éléments de méta-données ne peut pas être automatiquement importée, et demande à l'utilisateur soit de sélectionner un jeu de méta-données et de cliquer sur "Ajouter" pour ajouter l'élément de méta-données à ce jeu, soit de choisir un jeu de méta-données, puis un élément et ensuite cliquer sur "Fusionner" pour renommer l'ancien élément de méta-donnée en l'élément nouveau en fusionnant les deux. Les méta-données dans les documents suivants de la même collection subiront la même manipulation. Lorsque des ensembles importants de fichiers sont sélectionnés, déposés par un "glisser-coller" dans la nouvelle collection, l'opération de copie peut prendre quelque temps surtout quand il y a conversion de méta-données. Pour indiquer la progression de l'opération, l'interface montre le fichier qui est en train d'être copié et le pourcentage de fichiers déjà traités. Des fonctionnalités spéciales sont fournies pour le traitement de gros jeux de fichiers. Par exemple, l'utilisateur peut choisir de filtrer l'arborescence des fichiers pour afficher seulement certains fichiers, en utilisant un menu déroulant de types de fichier affiché en dessous des arborescences. Dans la figure , on montre seulement les fichiers HTM et HTML (et seuls ces fichiers seront copiés par l'opération "glisser-coller". <Text id="198">Enrichir les documents</Text> La prochaine étape dans la construction d'une collection consiste à enrichir les documents en y ajoutant des méta-données. L'onglet "Enrichir" affiche un nouveau panneau d'information (figure ), qui montre l'arborescence de documents représentant la collection sur la gauche, et permet, sur la droite, l'ajout de méta-données datas à des documents individuels ou des groupes de documents. Les documents qui sont copiés durant la première étape viennent avec des méta-données quelcoques qui leurs sont associées. Si un document est une partie de la collection Greenstone, des méta-données précédemment définies sont transférées vers la nouvelle collection. Il est évident que la nouvelle collection peut avoir un jeu différente de méta-données ou, peut être tout juste un sous-ensemble des méta-données définies, et seules les méta-données qui appartiennent au jeu de la nouvelle collection sont transférées. La résolution de tels conflits peut nécessiter l'intervention de l'utilisateur par le biais d'un dialogue supplémentaire (figure ). Tous les choix faits sont enregistrés et appliqués pour des copies de fichiers ultérieures. Le panneau Enrich permet l'assignation de valeurs de meta-données aux documents de la collection. Par exemple, de nouvelles valeurs peuvent être ajoutées au jeu de valeurs déjà existantes pour un élément. Si les valeurs de l'élément ont une structure hiérarchique, la structure peut être étendue de la même manière.
<Text id="202">Importation de méta-données existantes</Text>
<Text id="203">Filtrage des arborescences de fichiers</Text>
<Text id="204">Assignation de méta-données en utilisant "Enrich"</Text>
<Text id="205">Affichage de toutes les méta-données pour des fichiers sélectionnés</Text>
Des valeurs de méta-donnée peuvent aussi être assignés à des répertoires, exactement de la même manière. Les documents dans ces répertoires pour lesquels cette méta-donnée n'est pas spécifiée, héritent les valeurs de la méta-donnée. Cependant, elles peuvent être écrasées par la suite en fournissant des valeurs différentes pour ces documents. Les opérations à ce stade comprennent: Assignation de valeurs de méta-données nouvelles ou existente aux documents. Assignation de méta-donnée à un document individuel. Assignation de méta-donnée à un répertoire ( ceci est hérité par tous les documents dans le répertoire, y compris ceux qui sont des sous-répertoires. Assignation de méta-donnée hiérarchique dont la structure peut être mise à jour de façon dynamique si cela est nécessaire. Edition et mise à jour de méta-donnée assignée. Revue de méta-données assignées à une sélection de fichiers et répertoires. Pour notre exemple, dans la figure  l'utilisateur a sélectionné le dossier ec121e et a assigné "Ec courier" comme son organisation de méta-données. Les boutons pour mettre à jour et supprimer les méta-données sont activées suivant les sélections effectuées. Durant cette phase d'enrichissement, en fait à n'importe quel autre moment, l'utilisateur peut choisir d'afficher toutes les méta-données qui ont été assignées aux documents de la collection. Ceci est fait en sélectionnant une série de documents et en choisissant "Méta-données assignées" à partir du menu des jeux de méta-données, ce qui ouvre une fenêtre popup comme celle de la figure  qui montre les méta-données sous forme d'un tableau. Pour les grandes collections, il est utile de pouvoir afficher les méta-données associées à certains types de documents seulement, et quand l'utilisateur a spécifié un filtre de fichiers comme mentionné ci-dessus, seuls les documents sélectionnés sont visibles dans l'affichage des méta-données. Le panneau dans la figure  permet à l'utilisateur d'éditer les jeux de méta-données. Ici, l'utilisateur regarde l'élément "Subject" du jeu DLS. Les valeurs de cet élément forment une hiérarchie, et l'utilisateur est en train d'examiner et peut être de changer la liste des valeurs qui lui sont assignées. Le même panneau permet de changer le "profil" pour la mise en correspondance des éléments d'un jeu de méta-données l'autre. Ce profil est créé au cours de l'importation de documents à partir de collections qui ont des méta-données pré-assignées.
<Text id="217">Edition deu jeu de méta-données</Text>
<Text id="218">Conception de la collection</Text>
<Text id="219">Spécification des plugins à utiliser</Text>
<Text id="220">Configuration des arguments de plugin</Text>
<Text id="221">Conception de la collection</Text> Le panneau de conception (figure ) permet la spécification de la structure, l'organisation et la présentation de la collection qui est en train d'être créée. Comme déjà noté, le résultat de ce processus est enregistré dans le fichier de configuration de la collection "collection configuration file", qui est le moyen pour Greenstone d'exprimer les fonctionnalités requises par une collection. Cette étape comprend une série d'écrans d'interaction séparés, chacun traitant un aspect de la conception de la collection. En effet, il sert d'équivalent graphique à l'opération usuelle d'édition manuelle du fichier de configuration. Les opérations comprennent: Revue et édition de méta-données de niveau collection, telles que titre, auteur et accès public à la collection. Définition des indexes de texte complet à construire. Création de sous-collections et construction d'indexes à leur allouer. Ajout ou suppression de support de langues d'interface prédéfinies. Construction d'une liste de plugins à utiliser, et leurs arguments. Présentation de la liste à l'utilisateur pour revue et modification. Configuration de plugins individuels. Construction d'une liste de "classificateurs", leurs arguments, affectation et configuration. Affectation de chaînes de formatage à divers contrôles de la collection, en vue de changer son apparence. Revue des jeux de méta-données utilisés dans la collection ainsi que leurs éléments. Dans la figure , l'utilisateur a cliqué sur l'onglet "Conception" et étudie les informations générales sur la collection, entrées lors de la création de la nouvelle collection. A gauche, sont listés les différentes facettes que l'utilisateur peut configurer : Général, Plug-ins de document , Type de recherche, Indexes de recherche, Indexes de partition, Recherche inter-collection, Classificateurs de navigation, Fonctionnalités de formatage, Traduction de texte, Jeux de méta-données. L'apparence et la fonctionnalité varient entre celles-ci. Par exemple, en cliquant sur Plug-in, on a l'écran de la figure  qui vous permet d'ajouter, de supprimer ou de configurer des plugins, et de changer l'ordre dans lequel les plugins sont appliqués aux documents. Les plugins et les classificateurs disposent de plusieurs arguments ou "Options" que l'utilisateur peut fournir. La boîte de dialogue dans la figure  montre l'utilisateur précisant des arguments à certains plugins. Les champs grisés deviennent actifs quand l'utilisateur ajoute l'option en cliquant sur la case à cocher se trouvant à côté. Puisque Greenstone est un système open-source en croissance continuelle, le nombre d'options tend à augmenter au fur et à mesure que les développeurs ajoutent de nouvelles fonctionnalités. Pour aider à y faire face, Greenstone a un programme fonctionnel "Plug-in information " qui liste les options disponibles pour chaque plugin, et le "Librarian Interface" (l'Interface Bibliothécaire) l'invoque automatiquement pour déterminer quelle option montrer. Ceci permet à l'interface interactive de l'utilisateur de suivre automatiquement les développements dans le logiciel.
<Text id="236">Prêt pour créer la nouvelle collection</Text>
<Text id="237">Aperçu de la collection nouvellement créée</Text>
<Text id="238">Construction de la collection</Text> Le panneau "Créer" (figure ) est utilisé pour construire une collection basée sur les documents et d'assigner des méta-données. Le plus gros du travail est fait par le code Greenstone lui-même. L'utilisateur contrôle le déroulement externe à travers une série d'écrans interactifs, chacun traitant les arguments fournis à une certaine étape du processus de création. L'utilisateur observe la construction en cours à travers une fenêtre qui montre non seulement le texte génèré par les scripts d'importation et de construction d'index, mais aussi par les barres de progression qui indiquent le degré global d'exécution de chaque script. La figure  montre le "Create View" (Affichage Créer). Des options, pouvant être appliquées pendant la création de ce processus, sont montrées en haut. L'utilisateur sélectionne les valeurs appropriées pour les options. La figure illustre un popup "tool tip" (boîte à outils) qui est disponible à travers l'interface pour expliquer la fonction de chaque argument. Lorsqu'il est satisfait avec ces arguments, l'utilisateur clique "Construire collection". Greenstone affiche continuellement un texte qui indique le déroulement et ceci est montré par le biais d'une barre de progression plus informative. <Text id="243">Aperçu</Text> Le bouton "Prévisualiser la Collection" (figure ) est utilisé pour visualiser la collection qui a été créée. L'appui sur ce bouton initiera la page web hebergeant cette collection (figure ). En pratique, l'aperçu montre souvent des défauts dans la conception de la collection ou sur les valeurs individuelles de méta-données, et l'utilisateur retourne souvent aux étapes précédentes pour les corriger. Ce bouton devient actif une fois que la collection a été créée. La collection nouvellement créée sera aussi installée dans votre page d'accueil Greenstone comme une des collections normales. <Text id="245">Aide</Text> L'aide en ligne est toujours disponible et elle est obtenue en utilisant l'élément "Aide" situé à droite de la principale barre de menu, en haut de chacune des figures. Ceci ouvre un fichier hiérarchiquement structuré du texte d'aide, et il est tenu compte du contexte courant de l'utilisateur pour mettre en relief la section qui est appropriée à l'étape actuelle de l'interaction. En plus, comme noté ci-dessus, à chaque fois que la souris est maintenue sur tout objet interactif, une petite fenêtre popup apparaît afin de donner un "tool tip" textuel comme illustré vers le bas de la figure .
<Text id="247">L'interface bibliothécaire du Guide d'Utilisateur</Text> &chap_gli;
<Text id="453">Le balisage des fichiers de documents</Text> Les documents source ont souvent besoin d'être structurés en sections et sous-sections, et il faut communiquer cette information à Greenstone de sorte qu'il puisse puisse conserver la structure hiérarchique des documents. On peut également associer des méta-données -- telles que son titre -- à chaque section et sous-section. Les documents source d'un processus de reconnaissance optique de caractères (ROC) sont typiquement un ensemble de fichiers de traitement de texte, y compris des images. S'ils sont représentés sous la forme de fichiers Microsoft Word, on peut les importer dans Greenstone en utilisant le greffon Word. On peut aussi les convertir en HTML et les importer dans Greenstone en utilisant le greffon HTML. Dans les deux cas, on peut indiquer la structure hiérarchique d'un document en insérant des balises dans le texte comme suit: <!-- <Section> <Description> <Metadata name="Title"> Assurer le respect des droits de l'homme pour les pauvres: stratégies pour atteindre les cibles de développement international </Metadata> </Description> --> (texte de la section) <!-- </Section> --> On utilise les marqueurs<!-- ... -->car ils dénotent des commentaires en HTML; ces balises de section n'auront donc aucun impact sur la mise en forme du document. Il faut inclure ces autour des balises de sections, même si le document sur lequel on travaille n'est pas de l'HTML (si par exemple il s'agit d'un fichier de type Microsoft Word). On peut spécifier d'autres types de méta-données dans la portion Description (située entre les balises<Description>et</Description>), mais ce n'est pas le cas du style de collection décrit ici. Il est important de se rappeler que l'on crée une table des matières hiérarchique lorsque l'on insère des balises de sections dans le document. Cela signifie qu'on peut imbriquer des sections dans d'autres sections. En fait, il faut imbriquer toutes les sections dans une grande section qui recouvre l'ensemble du document. L'exemple suivant illustre le cas d'un document composé de deux chapitres, dont le second contient deux sous-sections. Vous trouverez des exemples concrets de documents source balisés de cette manière dans les documents source des collections Demo et DLS. <!-- <Section> <Description> <Metadata name="Title">Mon document</Metadata> </Description> <Section> <Description> <Metadata name="Title">Chapitre 1</Metadata> </Description> --> (text du chapitre 1) <!-- </Section> <Section> <Description> <Metadata name="Title">Chapitre 2</Metadata> </Description> <Section> <Description> <Metadata name="Title">Sous-section 1</Metadata> </Description> --> (texte de la sous-section 1) <!-- </Section> <Section> <Description> <Metadata name="Title">Sous-section 2</Metadata> </Description> --> (texte de la sous-section 2) <!-- </Section> </Section> </Section> --> Il faut noter que des méta-données assignées à partir dun onglet de section dans un document source prend le pas sur celle assignée au document tout entier. Ceci signifie que vous ne devez pas spécifier explicitement la méta-donnée "Title" ("Titre") pour la section de plus haut niveau à l'intérieur d'un document source à moins que vous ne veuilliez écraser le titre que vous lui avez donné en spécifiant la méta-donnée. Dans l'exemple ci-dessus, à moins de vouloir écraser le titre du document existant, vous devriez omettre la ligne où on peut lire: <Metadata name="Title">Mon document</Metadata>
<Text id="467">Le Collector</Text> Le Collector est un outil d'assistance qui vous aidera à créer de nouvelles collections, à modifier ou ajouter à des collections existantes, ou à effacer des collections. Pour ce faire vous serez guidés à travers un ensemble de pages web qui vous demanderont les informations nécessaires. Ces pages web parlent d'elles-mêmes, et la présente section vous les décrira. Au lieu d'utiliser le Collector, on peut aussi construire des collections depuis la ligne de commande -- les premières pages du Guide du développeur détaillent ce processus pas à pas. Avant de construire et de distribuer des collections d'informations numériques, il faut réfléchir aux conséquences et aux responsabilités que cela implique. On trouve des aspects légaux relatifs aux droits: pouvoir accéder à des documents n'implique pas forcément qu'on puisse les distribuer à des tiers. On trouve aussi des aspects sociaux: les collections devraient respecter les coutumes de la communauté dont leurs documents proviennent. Enfin, on trouve des aspects éthiques: il existe des documents qu'il vaut mieux ne pas communiquer. La plume est plus puissante que l'épée! Soyez sensible au pouvoir de l'information, et faites-en sage usage. Pour accéder au Collector, cliquez sur le lien approprié depuis la page d'accueil de la bibliothèque numérique. Dans Greenstone, la structure d'une collection est déterminée lors de sa mise en place. Cela comprend aussi bien le format des documents source, la manière de les représenter à l'écran, les sources de méta-données, quelles possibilités de navigation offrir, quels index de recherche dans le corps du texte fournir, et comment afficher les résultats des recherches. Après la mise en place de la collection, il est facile d'y inclure de nouveaux documents -- pour peu qu'ils soient dans le même format que les documents existants, et que les mêmes méta-données soient fournies, exactement de la même manière. Le Collector dispose des fonctions de base suivantes: créer une nouvelle collection de même structure qu'une collection existante; créer une nouvelle collection d'une structure différente de celle des collections existantes; ajouter du contenu à une collection existante; modifier la structure d'une collection existante; effacer une collection; et exporter une collection existante sur un cédérom autonome et auto-installable. Les figures  et suivantes illustrent l'utilisation du Collector pour la création d'une nouvelle collection, à partir d'un ensemble de fichiers HTML stockés localement dans le cas de cet exemple. Il faut d'abord décider de travailler sur une collection existante ou d'en construire une nouvelle. Dans le premier cas, vous vous trouverez dans les deux premiers points de la liste numérotée ci-dessus; dans le second, ce seront les quatre derniers points qui vous concerneront. Dans la figure , l'utilisateur opte pour la création d'une nouvelle collection.
<Text id="480">Utiliser le Collector pour construire une nouvelle collection (à suivre)</Text> <SubTitle> <Text id="481">(a)</Text> </SubTitle>
<Text id="482">Se connecter</Text> Dans tous les cas, il est nécessaire de se connecter avant de pouvoir faire quoi que ce soit. En général, on utilise un navigateur web pour accéder à l'outil de construction de collection sur un ordinateur distant, afin de construire une collection sur ce serveur. Il est bien sûr hors de question d'autoriser n'importe qui à construire des collections (ne serait-ce que pour des raisons de droits), c'est pourquoi Greenstone renferme un système de sécurité qui oblige qui veut construire des collections à se connecter avant toute autre chose. Ceci permet à un système central d'offrir un service à ceux qui souhaitent construire des collections d'informations et utiliser le serveur pour les rendre disponibles à d'autres. D'autre part, même si vous utilisez Greenstone sur votre ordinateur local et y construisez des collections, il est nécessaire de vous connecter car il ne faut pas autoriser des tiers utilisant Greenstone sur votre ordinateur à construire des collections sans autorisation préalable. <Text id="484">Structure de dialogue</Text>
<Text id="485">Utiliser le Collector pour construire une nouvelle collection (Suite)</Text> <SubTitle> <Text id="486">(b)</Text> </SubTitle>
Suite à la connexion, on voit apparaître la page présentée figure . Elle montre la suite d'étapes impliquées dans la construction d'une collection, c'est-à-dire: Informations sur la collection Données source Configurer la collection Construire la collection Afficher la collection. La première étape consiste à spécifier le nom de la collection et les informations associées. La deuxième étape est de préciser d'où proviendront les données source. La troisième permet d'ajuster les options de configuration, une étape que vous trouverez de plus en plus utile à mesure que vous serez plus expérimenté avec Greenstone. La quatrième étape indique où se fera tout le travail (de l'ordinateur). Durant le processus de «construction» le système construit tous les index et rassemble toutes les autres informations nécessaires au bon fonctionnement de la collection. La cinquième étape vous permettra de visualiser la collection nouvellement créée. Ces cinq étapes sont représentées sous forme d'une suite de boutons gris au bas de l'écran figure , ainsi qu'au bas de toutes les autres pages générées par le Collector. Cet affichage aide les utilisateurs à se rappeler où ils en sont dans le processus. Le bouton à cliquer pour passer à la suite est affiché en vert (informations sur la collection sur la figure ). Les boutons gris (tous les autres, sur la figure ) sont inactifs. Les boutons deviennent jaunes au fur et à mesure de la progression dans les étapes, et l'utilisateur peut revenir à une étape antérieure en cliquant sur le bouton jaune correspondant. Cet affichage est inspiré des «assistants» largement utilisés dans les logiciels propriétaires pour guider les utilisateurs tout au long des différentes étapes de l'installation de nouveaux logiciels.
<Text id="495">Informations sur la collection</Text>
<Text id="496">Utiliser le Collector pour construire une nouvelle collection (Suite)</Text> <SubTitle> <Text id="497">(c)</Text> </SubTitle>
La prochaine étape, celle des informations de collection, est illustrée figure . Lorsqu'on crée une nouvelle collection, il est nécessaire de donner certaines informations la concernant: titre, adresse de courrier électronique de contact, et une brève description. Le titre de la collection est une petite phrase utilisée à travers la bibliothèque numérique pour identifier le contenu de la collection. On peut citer comme exemples de titres «Bibliothèque de la nourriture et de la nutrition», «Bibliothèque environnementale mondiale», «Bibliothèque de développement pour l'humanité», etc. L'adresse électronique spécifie qui contacter pour tout problème rencontré avec la collection. Si le logiciel Greenstone détecte un problème, il est possible qu'il y envoie un rapport décrivant l'erreur. Enfin, la brève description est une phrase décrivant les critères d'inclusion dans la collection. Elle apparaît sous l'en-tête à propos de la première page, lors de la présentation de la collection. La position actuelle dans les étapes de construction de la collection est dénotée par une flèche qui apparaît au bas de chaque page -- dans ce cas, comme illustré par la figure , nous nous trouvons à l'étape des informations de la collection. On continue vers la figure  en cliquant sur le bouton vert données source.
<Text id="504">Données source</Text>
<Text id="505">Utiliser le Collector pour construire une nouvelle collection (Suite) </Text> <SubTitle> <Text id="506">(d)</Text> </SubTitle>
La figure  est le moment où l'utilisateur spécifie le texte source qui constituera la collection. On peut soit baser sa collection sur l'une des structures par défaut fournies, soit sur la structure d'une collection existante. Si vous optez pour la structure par défaut, la nouvelle collection pourra contenir des documents HTML (fichiers d'extensions .htm ou .html), des fichiers texte (fichiers d'extensions .txt ou .text), des fichiers au format Microsoft Word (fichiers d'extensions .doc), des documents PDF (fichiers d'extensions .pdf), ou des courriers électroniques (fichiers d'extensions .email). Vous trouverez plus d'informations sur les différents formats de documents qu'on peut inclure dans la section 3.4.9. Si vous basez votre nouvelle collection sur une collection existante, les fichiers de la nouvelle collection devront avoir exactement le même type que ceux utilisés pour construire la collection existante. Vous remarquerez que certaines collections utilisent des formats de fichiers en entrée non standard, et que d'autres utilisent des méta-données stockées dans des fichiers auxiliaires. Si ces informations sont absentes de vos nouvelles données, certaines fonctionnalités de navigation pourront mal fonctionner. Si par exemple vous clonez la collection «Demo», vous remarquerez peut-être que les boutons thèmes, organisation, et comment faire ne fonctionnent pas bien. La page web propose des boîtes pour indiquer la localisation des documents source: on peut spécifier jusqu'à trois sources différentes en entrée dans la figure . Si cela ne vous suffit pas, cliquez sur le bouton intitulé More sources («davantage de sources»). Il existe trois types de spécifications: un nom de répertoire dans le système du serveur Greenstone (commençant par «file://»); une adresse commençant par «http://», pour les fichiers à télécharger depuis le web; une adresse commençant par «ftp://», pour les fichiers à télécharger en FTP anonyme. Si vous utilisez file:// ou ftp:// pour spécifier un fichier, ce fichier sera rapatrié. Si vous utilisez http://, tout dépend si l'URL correspondante fournit dans le navigateur une page web normale ou une liste de fichiers. Si elle fournit une page web normale, cette page sera téléchargée -- ainsi que toutes les pages vers lesquelles elle pointe, et les pages vers lesquelles pointent ces dernières, etc., pourvu que toutes résident sur le même site, sous cette URL. Si vous utilisez file:// ou ftp:// pour spécifier un dossier ou un répertoire, ou si vous donnez une URL en http:// qui mène vers une liste de fichiers, tout le dossier et tous ses sous-dossiers seront inclus dans la collection. Vous pouvez spécifier des sources de plusieurs types. Dans le cas de la figure , la nouvelle collection contiendra des documents copiés depuis un système de fichiers local ainsi que depuis un site web externe, qui sera copié localement (une copie «miroir» en sera faite) pendant le processus de construction. Quand on clique sur le bouton configurer la collection pour passer à la prochaine étape de la construction, le Collector vérifie que toutes les sources de données spécifiées sont joignables. Ceci peut prendre quelques secondes, ou même quelques minutes si vous avez spécifié plusieurs sources. Si l'une ou l'autre des sources spécifiées ne sont pas disponibles, on obtient une page comme celle de la figure , marquant d'une croix les sources non disponibles (dans le cas présent, c'est le cas de toutes deux).
<Text id="521">Utiliser le Collector pour construire une nouvelle collection (Suite)</Text> <SubTitle> <Text id="522">(e)</Text> </SubTitle>
Plusieurs raisons peuvent expliquer le fait que des sources soient non disponibles: le fichier, le site FTP ou l'URL indiqué n'existe pas; il vous faut d'abord vous connecter à votre FAI; vous tentez d'accéder à une URL alors que vous vous trouvez derrière un pare-feu. Le dernier cas est potentiellement celui qui a l'air le plus mystérieux. Il se produit si en temps normal il vous faut fournir un nom d'utilisateur et un mot de passe pour accéder à l'Internet. Parfois, il est possible que votre navigateur web affiche correctement la page si on y en entre l'URL, alors que le Collector prétend que cette source n'est pas disponible. L'explication est que la version affichée dans votre navigateur provient peut-être d'une copie tampon (cache). Malheureusement, les copies tampon locales sont invisibles au Collector. Dans un tel cas de figure, nous vous recommandons de télécharger d'abord les pages à l'aide de votre navigateur.
<Text id="528">Configurer la collection</Text>
<Text id="529">Utiliser le Collector pour construire une nouvelle collection (Suite)</Text> <SubTitle> <Text id="530">(f)</Text> </SubTitle>
La figure  présente l'étape suivante. La construction et la présentation de toutes les collections sont contrôlées par des spécifications enregistrées dans un fichier de configuration de collection spécial (voir ci-dessous). Les utilisateurs expérimentés pourront utiliser cette page pour modifier les réglages de configuration, mais la plupart passeront directement à la dernière étape. En fait, dans la figure , les boutons configurer la collection et construire la collection sont tous les deux affichés en vert, ce qui signifie bien que l'on peut complètement court-circuiter la troisième étape du processus. Dans notre exemple, l'utilisateur a fait une petite modification au fichier de configuration par défaut en incluant le drapeau file_is_url à l'aide du greffon (plugin) HTML. Ce drapeau provoque l'insertion des méta-données d'URL dans chaque document, en se fondant sur la convention de nom de fichier adoptée par l'outil qui crée le miroir. Ces méta-données sont utilisées dans la collection pour permettre aux utilisateurs de se référer à la version originale du document, plutôt qu'à une copie locale.
<Text id="533">Construire la collection</Text>
<Text id="534">Utiliser le Collector pour construire une nouvelle collection (Suite)</Text> <SubTitle> <Text id="535">(g)</Text> </SubTitle>
La figure  illustre l'étape de «construction». Jusqu'à présent, les réponses fournies dans l'interface ont simplement été enregistrées dans un fichier temporaire. L'étape de construction est celle où tout le travail est réellement effectué. Lors de la construction, les index de navigation et de recherche sont construits en suivant les instructions du fichier de configuration de collection. Le processus de construction peut prendre de quelques minutes à quelques heures, selon la taille de la collection et la puissance de l'ordinateur. Certaines collections très conséquentes peuvent prendre plus d'un jour à construire. Lorsque vous atteindrez cette étape, une ligne d'état située au bas de la page web vous donnera un suivi de la progression de l'opération, suivi mis à jour toutes les 5 secondes. Le message visible dans la figure  indique que lors de la capture d'écran, Greenstone effectuait une conversion de format de document de PDF vers HTML. Des avertissements seront affichés si certains fichiers ou URL requis en entrée n'existent pas, ou existent mais qu'aucun greffon (plugin) ne peut les traiter, ou que le greffon ne peut pas trouver un fichier associé, telle qu'une image incrustée dans un document HTML. L'objectif est que vous suiviez cette progression en laissant cette fenêtre ouverte dans votre navigateur. Si des erreurs provoquent la fin prématurée du processus, elles seront enregistrée dans cette zone d'état. Vous pouvez arrêter le processus de construction à tout instant en cliquant sur le bouton Arrêt de la construction, visible figure . Si vous quittez la page web (sans avoir annulé le processus de construction à l'aide du bouton Arrêt de la construction), la construction continuera à s'effectuer, et la nouvelle collection sera installée à la fin de l'opération.
<Text id="541">Afficher la collection</Text> Quand la collection est construite et installée, la suite de boutons visibles aux bas des figures  à apparaît au bas de la figure , avec le bouton afficher la collection activé. Ce bouton emmène directement l'utilisateur vers la collection nouvellement construite. Enfin, il existe une fonctionnalité d'envoi de courrier d'électronique à l'adresse électronique de contact de la collection ainsi qu'à l'administrateur système, à chaque création (ou modification) d'une collection. Ceci permet aux responsables de vérifier tout changement prenant place et de surveiller ce qui se passe sur le système. Cette fonctionnalité est désactivée par défaut mais elle peut être activée en éditant le fichier de configuration main.cfg (voir à ce sujet le Guide du développeur de la bibliothèque numérique Greenstone, section ). <Text id="544">Travailler avec des collections existantes</Text> Lorsque l'on démarre le Collector, il faut spécifier si on souhaite créer une collection entièrement nouvelle, ou travailler avec une collection existante, en y ajoutant ou en en effaçant des données. Étant donné qu'il crée automatiquement toutes les structures de recherche et de navigation à partir des documents eux-mêmes, Greenstone facilite l'ajout de nouvelles informations à des collections existantes. Aucun lien n'étant inséré manuellement, il est possible de fusionner automatiquement au reste de la collection de nouveaux documents disponibles, s'ils sont au même format. Pour travailler avec une collection existante, il faut d'abord sélectionner la collection au sein d'une liste fournie par le logiciel. Certaines collections sont «protégées en écriture» et ne peuvent pas être modifiées: de telles collections n'apparaîtront pas dans la liste de sélections. Avec la collection retenue, vous pourrez: Ajouter de nouvelles données et reconstruire la collection; Éditer le fichier de configuration de la collection; Effacer entièrement la collection; Exporter la collection sur un cédérom. <Text id="551">Ajouter de nouvelles données</Text> Les fichiers spécifiés par vous seront ajoutés à la collection. Assurez-vous de ne pas spécifier à nouveau des fichiers déjà présents dans la collection, sans quoi deux copies en seraient incluses. Les fichiers sont identifiés par leur chemin d'accès complet, et les pages web par leur adresse web absolue. On peut spécifier des répertoires et des fichiers de la même manière que lors de la construction d'une nouvelle collection. Si vous souhaitez ajouter des données à une collection et que pour l'une ou l'autre raison, le processus de construction échoue, l'ancienne version de la collection demeurera inchangée. <Text id="554">Éditer le fichier de configuration</Text> Les utilisateurs expérimentés peuvent éditer le fichier de configuration de la collection, de la même manière que lors de la construction d'une nouvelle collection. La section 4explique les réglages de configuration. <Text id="556">Effacer la collection</Text> On vous demandera de confirmer le fait que vous souhaitez vraiment effacer la collection. Une fois la collection effacée, Greenstone ne pourra pas la récupérer! <Text id="558">Exporter la collection</Text> Vous pouvez exporter la collection sous une forme qui lui permette d'être écrite sur un cédérom Windows autonome et auto-installable. Les logiciels propriétaires créant des cédéroms auto-installables étant onéreux, cette fonctionnalité comprend un module d'installation maison. Lors de l'export de la collection, la boîte de dialogue vous informe du nom du répertoire où se trouve le résultat de l'opération. Ce répertoire doit intégralement être gravé sur le cédérom en utilisant un logiciel standard de gravage. L'immense variété des différentes configurations Windows possibles nous a empêché de tester et de déboguer l'installeur de Greenstone dans toutes les conditions possibles. Bien qu'il produise des cédéroms qui fonctionneront sur la plupart des systèmes Windows, il est toujours en cours de développement. Si vous rencontrez des problèmes et que vous disposez d'un logiciel d'installation propriétaire (tel qu'InstallShield, par exemple), vous pouvez utiliser ce dernier pour créer des cédéroms à partir des informations fournies par Greenstone. Le répertoire d'export mentionné ci-dessus contient quatre fichiers relatifs au processus d'installation, et trois sous-répertoires qui contiennent la collection et le logiciel au complet. Ôtez les quatre fichiers et utilisez InstallShield pour créer une image de cédérom qui installera ces répertoires et créera un raccourci vers le programme gsdlserver.exe. <Text id="562">Formats de documents</Text> Lors de la construction de collections, Greenstone traite chaque format de document source en recherchant un «greffon» (plugin) qui est capable de le traiter. Les greffons sont spécifiés dans le fichier de configuration de la collection. Greenstone utilise en général le nom de fichier pour déterminer le format de document -- par exemple, toto.txt sera traité comme un fichier texte, toto.html comme un fichier HTML, et toto.doc comme un fichier Word. Voici un résumé des greffons disponibles pour les formats de documents les plus courants. Vous trouverez plus de détails sur ces greffons ainsi que des greffons supplémentaires, capables de traiter des formats moins courants, dans le Guide du développeur de la bibliothèque numérique Greenstone. <Text id="565">TEXTPlug (*.txt, *.text)</Text> TEXTPlug interprète un fichier texte comme un simple document. Il ajoute des méta-données de titre en se fondant sur la première ligne du fichier. <Text id="567"><i>HTMLPlug (*.htm, *.html; et aussi .shtml, .shm, .asp, .php, .cgi)</i></Text> HTMLPlug traite les fichiers HTML. Il extrait les méta-données de titre en se fondant sur la balise<title>, et peut aussi extraire toute autre méta-donnée exprimée dans la syntaxe de la balise<meta>de HTML. Ce greffon dispose de nombreuses options, documentées dans le Guide du développeur de la bibliothèque numérique Greenstone. <Text id="569"><i>WORDPlug (*.doc)</i></Text> WORDPlug importe des fichiers au format Microsoft Word. Il en existe de nombreuses variantes différentes -- et même les programmes de Microsoft sont coutumiers d'erreurs de conversion. Greenstone utilise des programmes indépendants pour convertir les fichiers Word en HTML. Pour certains anciens formats Word, le système utilise un simple algorithme d'extraction qui trouve toutes les portions de texte incluses dans le fichier en entrée. <Text id="571"><i>PDFPlug (*.pdf)</i></Text> PDFPlug importe des documents au format PDF d'Adobe («format de document portable»). Comme WORDPlug, il utilise un programme indépendant, qui s'appelle pdftohtml dans le cas présent, pour convertir des fichiers PDF en HTML. Comme dans le cas de WORDPlug, les collections afficheront par défaut l'équivalent HTML du fichier lorsque l'utilisateur cliquera sur l'icone document; cependant, on peut modifier les chaînes de format dans le fichier de configuration de la collection pour donner plutôt accès à l'utilisateur au fichier PDF original, et nous vous recommandons de procéder ainsi. Contentez-vous de remplacer les balises<link> ... </link>par des balises<srclink> ... </srclink>. Le programme pdftohtml ne parvient pas à traiter certains fichiers PDF. Le processus de conversion prend un temps exponentiellement long, et on voit souvent apparaître à l'écran un message traitant de ce processus. Si cela se produit, la seule solution que nous puissions proposer est d'ôter le document concerné de la collection. PDFPlug ne peut pas non plus traiter les fichiers PDF chiffrés. <Text id="575"><i>PSPlug (*.ps)</i></Text> PSPlug importe des documents au format PostScript. Il fonctionne au mieux si votre ordinateur dispose déjà d'un programme standard sous Linux et appelé ps2ascii. Ce programme est disponible sur la plupart des installations Linux, mais pas sous Windows. Si ce programme n'est pas disponible, PSPlug se limite à un simple algorithme d'extraction de texte. <Text id="577"><i>EMAILPlug (*.email)</i></Text> EMAILPlug importe des fichiers contenant du courrier électronique, et traite les formats de courrier électronique courants tels que ceux utilisés par Netscape, Eudora, et les lecteurs de courrier électronique sous Unix. Chaque document source est examiné à la recherche d'un ou de plusieurs courriers électroniques mis bout à bout, et si cette recherche aboutit le contenu du document est traité. Le greffon extrait les méta-données des champs Subject («objet»), To («destinataire»), From («expéditeur»), et Date. Cependant, ce greffon ne traite pas encore correctement les courriers électroniques encodés au format MIME -- bien que lisibles, ils ont souvent un aspect étrange. <Text id="579"><i>ZIPPlug (.gz, .z, .tgz, .taz, .bz, .zip, .tar)</i></Text> Le greffon ZIPPlug traite les formats d'entrée compactés et/ou d'archives suivants: gzip (.gz, .z, .tgz, .taz), bzip (.bz), zip (.zip .jar), et tar (.tar). Il repose sur les programmes gunzip, bunzip, unzip, et tar, qui sont des outils standard sous Linux. ZIPPlug est désactivé sur les ordinateurs employant Windows.
<Text id="581">Administration</Text> Chaque installation de Greenstone comprend un outil d'«administration», auquel on accède en cliquant sur le lien approprié de la page d'accueil. La première page, présentée figure , donne des informations sur chacune des collections proposées par le système. Remarquez qu'il est possible que certaines collections «privées» n'apparaissant pas sur la page d'accueil de Greenstone soient listées ici:toutesles collections sont ici présentes. Chaque collection est accompagnée de son nom court, de son nom complet, du fait qu'elle est ou non publique, et du fait qu'elle est ou non en fonctionnement. Cliquer sur l'abréviation (abbrev.) d'une collection (la première colonne de liens dans la figure ) fournira des informations sur cette collection, informations synthétisées à partir du fichier de configuration de cette collection ainsi qu'à partir d'autres structures internes créées pour elle. Si la collection est publique et en cours de fonctionnement, cliquer sur le nom complet de la collection (le deuxième lien) vous emménera sur la collection à proprement parler. Une collection appelée wohiex, pour women's history excerpt, est visible près du bas de la figure . Figure  montre l'information qui est affichée quand on appuie sur ce lien. Quand on choisit une collection, la première section donne des informations sur le fichier de configuration et sur la taille de la collection (dans le cas présent, elle comprend environ 1000 documents, un million de mots, et plus de 6 méga-octets de données). Les sections suivantes contiennent des informations internes relatives au protocole de communication utilisé pour accéder aux collections. Par exemple, les options de filtre pour «QueryFilter» montrent les options et les valeurs possibles qu'on peut utiliser lors de l'interrogation de la collection par requêtes. L'outil d'administration présente également des informations de configuration relatives à l'installation et permet de modifier cette dernière. Il facilite l'examen du journal d'erreurs (qui enregistre les erreurs internes) et du journal utilisateur (qui consigne l'utilisation de la collection). Il permet à un ou plusieurs utilisateurs spécifiés d'en autoriser d'autres à construire des collections et à ajouter du contenu à des collections existantes. On accède à toutes ces fonctionnalités de manière interactive à partir d'éléments du menu situé à gauche sur la figure .
<Text id="586">Outil d'administration de Greenstone</Text>
<Text id="587">Informations relatives à une collection particulière</Text>
<Text id="588">Fichiers de configuration</Text> Deux fichiers de configuration contrôlent le fonctionnement de Greenstone: le fichier de configuration de site gsdlsite.cfg et le fichier de configuration principal main.cfg. Le fichier gsdlsite.cfg sert à configurer Greenstone pour le site particulier sur lequel il est installé. Il est conçu pour enregistrer les options de configuration propres à un site donné, comme par exemple le nom du répertoire abritant le logiciel, l'adresse HTTP du système Greenstone, et si l'option «Fast-CGI» est utilisée ou non. Les entrées de ce fichier sont décrites dans le Guide d'installation de la bibliothèque numérique Greenstone Le fichier main.cfg contient des informations communes à l'interface et à toutes les collections servies sur un site Greenstone. Il comprend l'adresse électronique du mainteneur du système, le fait que les pages d'état et de Collector sont activées ou non, le fait qu'on conserve ou non des journaux de l'activité utilisateur, et si l'on utilise ou non des «cookies» web pour identifier les utilisateurs.
<Text id="592">Journaux</Text> On peut examiner trois types de journaux: journaux d'utilisation, d'erreur, et d'initialisation. Les deux derniers types de journaux ne présenteront réellement d'intérêt qu'aux yeux des mainteneurs du logiciel. Le logiciel Greenstone peut consigner toute l'activité utilisateur, c'est-à-dire toutes les pages visitées par chaque utilisateur, bien qu'aucune information nominative ne soit stockée dans les journaux. On active la journalisation (qui est désactivée par défaut) en incluant les lignes suivantes: logcgiargs true usecookies true dans le fichier de configuration principal du système. Ces deux options ayant par défaut la valeur fausse false, aucune journalisation n'a lieu tant qu'elles ne reçoivent pas la valeur vraie true. C'est la ligne logcgiargs qui a pour effet d'activer ou de désactiver la journalisation. En activant usecookies, on affecte à chaque utilisateur un code d'identification unique, ce qui permet de suivre dans le journal les interactions de chaque utilisateur. Chaque ligne du journal utilisateur représente une page visitée -- même les pages générées pour la consultation des journaux sont ainsi consignées! Elle comprend (a) l'adresse IP de l'ordinateur de l'utilisateur, (b) une estampille temporelle entre crochets, (c) les arguments CGI entre parenthèses, et (d) le nom du navigateur de l'utilisateur (sachant que le navigateur de Netscape s'appelle «Mozilla»). Voici un exemple d'une telle ligne, échantillon ventilé et annoté pour en faciliter la lecture: /fast-cgi-bin/niupepalibrary (a) its-www1.massey.ac.nz (b) [Thu Dec 07 23:47:00 NZDT 2000] (c) (a=p, b=0, bcp=, beu=, c=niupepa, cc=, ccp=0, ccs=0, cl=, cm=, cq2=, d=, e=, er=, f=0, fc=1, gc=0, gg=text, gt=0, h=, h2=, hl=1, hp=, il=l, j=, j2=, k=1, ky=, l=en, m=50, n=, n2=, o=20, p=home, pw=, q=, q2=, r=1, s=0, sp=frameset, t=1, ua=, uan=, ug=, uma=listusers, umc=, umnpw1=, umnpw2=, umpw=, umug=, umun=, umus=, un=, us=invalid, v=0, w=w, x=0, z=130.123.128.4-950647871) (d) "Mozilla/4.08 [en] (Win95; I ;Nav)" Le dernier argument CGI, «z», est un code d'identification ou «cookie» engendré par le navigateur de l'utilisateur: il comprend le numéro IP suivi d'une estampille temporelle portant la date de la première visite de cet utilisateur à la bibliothèque numérique. Le journal usage.txt est placé dans le répertoire etc de la structure de fichiers de Greenstone (voir à ce sujet le Guide du développeur de la bibliothèque numérique Greenstone). Lorsque la journalisation est activée, chaque action de chaque utilisateur est consignée. Cependant, seules les 100 dernières entrées du journal sont affichées par le lien Journal de l'utilisation visible figure .
<Text id="599">Gestion des utilisateurs</Text> Greenstone incorpore un système d'authentification qu'on peut utiliser pour contrôler l'accès à certaines fonctionnalités. Pour le moment, il ne sert qu'à restreindre l'accès au Collector et à certaines fonctions d'administration. Si pour une collection particulière il s'avérait nécessaire d'authentifier les utilisateurs avant de leur renvoyer des informations, cela serait également possible. On pourrait par exemple protéger individuellement des documents de telle sorte que seuls des utilisateurs enregistrés puissent y accéder en tapant un mot de passe. Cependant, aucune collection n'utilise cette possibilité actuellement. L'authentification se fait en requérant un nom d'utilisateur et un mot de passe, comme illustré figure . La page d'administration permet de lister les utilisateurs, d'en ajouter de nouveaux, et d'en effacer d'anciens. Évidemment, ce pouvoir est lui aussi protégé: seuls les utilisateurs disposant de privilèges d'administration peuvent ajouter de nouveaux utilisateurs. Il est également possible à chaque utilisateur d'appartenir à différents «groupes». Actuellement, il n'existe que deux groupes, qui sont «administrator» (administrateur) et «colbuilder» (constructeur de collection). Les membres du premier groupe peuvent ajouter et effacer des utilisateurs, et modifier leurs groupes. Les membres du second peuvent accéder aux fonctionnalités décrites plus haut pour construire de nouvelles collections et modifier (ou effacer) des collections existantes. Lors de l'installation de Greenstone, il existe un utilisateur, appelé admin, qui appartient aux deux groupes. Son mot de passe est mis en place pendant le processus d'installation. Cet utilisateur peut créer de nouveaux identifiants et mots de passe associés pour des utilisateurs qui n'appartiendraient qu'au groupe colbuilder, ce qui est la méthode conseillée pour donner à d'autres utilisateurs la possibilité de construire des collections. Les informations utilisateur sont stockées dans deux bases de données placées dans la structure de fichiers de Greenstone (voir à ce sujet le Guide du développeur de la bibliothèque numérique Greenstone).
<Text id="603">Informations techniques</Text> Les liens situés sous l'en-tête Informations techniques fournissent davantage d'informations sur l'installation. Le lien Général donne accès aux informations techniques, y compris les répertoires de stockage. L'élément de menu Protocoles donne, pour chaque type de protocole, des informations sur les collections accessibles par ce protocole. Enfin, le code de l'interface utilisateur (appelé le «réceptionniste») utilise desactionspour communiquer les souhaits de l'utilisateur au système. Ces actions correspondent à l'argument CGI libellé «a». Si par exemplea=status, le réceptionniste invoque l'action status, qui affiche la page d'états. Un élément de menu donne accès aux listes de toutes les actions proposées par le système, et un autre mène aux arguments acceptés par ces actions.
<Text id="606">Fonctionnalités du logiciel</Text> <TableContent> <tr> <th width="132"> <Text id="607"><i>Accessible à travers un navigateur web</i></Text> </th> <th width="397"> <Text id="608">On accède aux collections à travers un navigateur web standard (tel que Netscape ou Internet Explorer), ce qui fournit à la fois une navigation facile et des fonctionnalités de recherche puissantes. </Text> </th> </tr> <tr> <th width="132"> <Text id="609"><i>Fonctionnalités du logiciel</i></Text> </th> <th width="397"> <Text id="610">L'utilisateur peut effectuer des recherches dans le corps du texte des documents, ou choisir parmi plusieurs index construits à partir de différentes portions des documents. Certaines collections proposent par exemple un index des documents complets, un index des sections, un index des titres, et un index des auteurs, qu'on peut tous sélectionner pour rechercher certains mots ou groupes de mots. Les résultats peuvent être ordonnés par leur pertinence ou en utilisant une méta-donnée.</Text> </th> </tr> <tr> <th width="132"> <Text id="611"><i>Souplesse de la navigation</i></Text> </th> <th width="397"> <Text id="612">L'utilisateur peut naviguer dans les listes des auteurs, des titres, des dates, des structures de classification, etc. Des collections différentes pourront proposer des fonctionnalités de navigation différentes et même au sein d'une collection, on trouvera un large spectre d'interfaces de navigation. Les interfaces de recherche et de navigation sont préparées pendant le processus de construction, en se fondant sur les informations de configuration de la collection.</Text> </th> </tr> <tr> <th width="132"> <Text id="613"><i>Création automatique de structures d'accès</i></Text> </th> <th width="397"> <Text id="614">Le logiciel Greenstone crée des collections d'informations très faciles à maintenir. Toutes les structures de recherche et de navigation sont directement construites à partir des documents eux-mêmes. Aucun lien n'est inséré manuellement, mais tous les liens existant dans les originaux sont conservés. Cela signifie que si de nouveaux documents du même format sont disponibles, ils peuvent être automatiquement fusionnés au reste de la collection. En fait, pour la plupart des collections, tout ceci est pris en charge par des processus qui s'exécutent régulièrement, partent à la recherche de nouveaux contenus, et reconstruisent les index~---~le tout sans aucune intervention manuelle. </Text> </th> </tr> <tr> <th width="132"> <Text id="615"><i>Utilisation des méta-données disponibles</i></Text> </th> <th width="397"> <Text id="616">On peut associer à chaque document ou à chaque section de document des méta-données, c'est-à-dire des informations de description telles que l'auteur, le titre, la date, des mots-clefs, etc. Les méta-données forment la matière première des index de navigation. Elles doivent être explicitement fournies, ou bien il doit être possible de les obtenir automatiquement à partir des documents eux-mêmes. La plupart des documents électroniques utilisent le schéma de méta-données<i>Dublin Core</i>, mais il est également possible d'utiliser d'autres schémas.</Text> </th> </tr> <tr> <th width="132"> <Text id="617"><i>Extension des possibilités du système par greffons («plugins»)</i></Text> </th> <th width="397"> <Text id="618">Pour pouvoir utiliser plusieurs types de documents source, le logiciel est organisé d'une manière telle qu'on peut écrire des «greffons» (plugins) pour de nouveaux formats de documents. Il existe actuellement des greffons pour les formats texte brut, HTML, Word, PDF, PostScript, courrier électronique, certains formats propriétaires, et pour l'exploration récursive de structures de fichiers arborescentes et d'archives compactées contenant de telles structures. Une collection peut proposer des documents de plusieurs formats source. On utilise un schéma semblable de «classificateurs» pour construire des index de navigation à partir des méta-données: les classificateurs créent des index de navigation de divers types en se fondant sur les méta-données.</Text> </th> </tr> <tr> <th width="132"> <Text id="619"><i>Conçu pour gérer des collections de plusieurs méga-octets</i></Text> </th> <th width="397"> <Text id="620">Les collections peuvent contenir plusieurs millions de documents, ce qui fait du système Greenstone un logiciel adapté aux collections de taille allant jusqu'à plusieurs giga-octets.</Text> </th> </tr> <tr> <th width="132"> <Text id="621"><i>Les documents peuvent être écrits dans n'importe quelle langue</i></Text> </th> <th width="397"> <Text id="622">Le logiciel utilise Unicode partout, ce qui permet de traiter tous les langages d'une manière consistante. À l'heure actuelle, on a construit des collections contenant du français, de l'espagnol, du maori, du chinois, de l'arabe, et de l'anglais. C'est une conversion à la volée qui traduit le format Unicode utilisé en interne en un alphabet reconnu par le navigateur web de l'utilisateur.</Text> </th> </tr> <tr> <th width="132"> <Text id="623"><i>L'interface utilisateur est disponible dans de nombreuses langues</i></Text> </th> <th width="397"> <Text id="624">L'interface peut être affichée en de nombreuses langues. Elle est actuellement disponible en allemand, anglais, arabe, chinois, espagnol, français, hollandais, maori, et portugais. On peut facilement ajouter de nouvelles langues à cette liste de traductions.</Text> </th> </tr> <tr> <th width="132"> <Text id="625"><i>Les collections peuvent contenir du texte, des images, du son, et de la vidéo</i></Text> </th> <th width="397"> <Text id="626">Les collections Greenstone peuvent comprendre du texte, des images, des contenus audio et vidéo. La plupart des contenus non textuels sont reliés aux documents textuels ou accompagnés de descriptions textuelles (telles que les légendes des figures) pour pouvoir être accessibles depuis une recherche dans le corps du texte ou la navigation. Cependant, l'architecture du logiciel rend possible l'implémentation de greffons (plugins) et de classificateurs pour des données non textuelles.</Text> </th> </tr> <tr> <th width="132"> <Text id="627"><i>Utilisation de techniques de compression avancées</i></Text> </th> <th width="397"> <Text id="628">Greenstone utilise des techniques de compression pour réduire la taille des index et du texte. La réduction de taille des index par voie de compression a de plus l'avantage d'accélérer la vitesse de rapatriement du texte.</Text> </th> </tr> <tr> <th width="132"> <Text id="629"><i>Fourniture d'une fonction d'administration</i></Text> </th> <th width="397"> <Text id="630">Une fonction d'«administration» permet à des utilisateurs spécifiés d'en autoriser de nouveaux à construire des collections, à protéger des documents de telle sorte que seuls des utilisateurs enregistrés puissent y accéder en tapant un mot de passe, à examiner la composition de toutes les collections, etc. Les journaux d'activité utilisateur peuvent enregistrer toutes les requêtes effectuées vers chaque collection Greenstone.</Text> </th> </tr> <tr> <th width="132"> <Text id="631"><i>Les nouvelles collections apparaissent dynamiquement</i></Text> </th> <th width="397"> <Text id="632">On peut mettre des collections à jour et en proposer de nouvelles à tout moment, sans devoir arrêter le système: le processus en charge de l'interface utilisateur remarquera (grâce à un système de sondages réguliers) que de nouvelles collections sont apparues et les ajoutera à la liste proposée à l'utilisateur.</Text> </th> </tr> <tr> <th width="132"> <Text id="633"><i>Les collections peuvent être publiées sur l'Internet ou sur un cédérom</i></Text> </th> <th width="397"> <Text id="634">On peut utiliser le logiciel pour servir des collections sur le web. Mais les collections Greenstone peuvent être diffusées, sous une forme exactement semblable, sur cédérom. L'interface utilisateur utilisera un navigateur web standard (Netscape est inclus sur chaque disque), et l'interaction se déroulera de la même manière que sur le web, à ceci près que les temps de réponse seront plus faciles à prédire, et plus reproductibles car moins soumis aux aléas du réseau. Les cédéroms fonctionnent sous toutes les versions du système d'exploitation Windows.</Text> </th> </tr> <tr> <th width="132"> <Text id="635"><i>Les collections peuvent être distribuées sur plusieurs ordinateurs</i></Text> </th> <th width="397"> <Text id="636">Une structure de processus souple permet de faire servir différentes collections par des ordinateurs différents, bien que tout soit présenté à l'utilisateur de manière unifiée, sur la même page web, comme faisant partie de la même bibliothèque numérique.</Text> </th> </tr> <tr> <th width="132"> <Text id="637"><i>Fonctionne sous Windows comme sous Unix</i></Text> </th> <th width="397"> <Text id="638">Greenstone fonctionne à la fois sous Windows (versions 3.1/3.11, 95/98/Me, NT/2000) et sous Unix (Linux et SunOS). On peut utiliser n'importe lequel de ces systèmes comme serveur web. On ne peut pas construire des collections sur des systèmes Windows de bas de gamme, mais on peut y transférer des collections pré-construites ailleurs.</Text> </th> </tr> <tr> <th width="132"> <Text id="639"><i>Ce que Greenstone apporte</i></Text> </th> <th width="397"> <Text id="640">La bibliothèque numérique Greenstone est un logiciel libre, disponible depuis le site web de la bibliothèque numérique de Nouvelle-Zélande (<u>nzdl.org</u>) sous les termes de la licence publique générale de GNU. le logiciel comprend tout ce qui est décrit ci-dessus: service web, création de cédéroms, construction de collection, possibilités multilingues, greffons (plugins) et classificateurs permettant d'accepter un grand nombre de formats de documents source. Il comprend une fonctionnalité d'installation automatique pour faciliter cette opération sur les systèmes Windows comme Unix. Dans l'esprit du logiciel libre, les utilisateurs sont encouragés à nous communiquer tout rapport de bogue, correction, modification ou amélioration.</Text> </th> </tr> </TableContent> </Table> </Content> </Chapter> <Chapter id="appendix_b_glossary_of_terms"> <Title> <Text id="641">Glossaire des termes</Text> <TableContent> <tr> <th width="123"> <Text id="642"><b>Terme</b></Text> </th> <th width="406"> <Text id="643"><b>Signification</b></Text> </th> </tr> <tr> <th width="123"> <Text id="644"><i>autoconf</i></Text> </th> <th width="406"> <Text id="645">Programme Unix utilisé pour configurer le paquetage d'installation du logiciel Greenstone et l'adapter à votre système</Text> </th> </tr> <tr> <th width="123"> <Text id="646"><i>Autorun</i></Text> </th> <th width="406"> <Text id="647">Fonctionnalité de Windows qui démarre un programme automatiquement lors de l'insertion d'un cédérom</Text> </th> </tr> <tr> <th width="123"> <Text id="648">Booléenne, requête</Text> </th> <th width="406"> <Text id="649">Requête dans un système de rapatriement d'informations qui peut contenir des ET, OU, et NON booléens </Text> </th> </tr> <tr> <th width="123"> <Text id="650">Navigation</Text> </th> <th width="406"> <Text id="651">Accès à une collection en parcourant une liste organisée de valeurs de méta-données associées aux documents (telles que l'auteur, le titre, la date, des mots-clefs)</Text> </th> </tr> <tr> <th width="123"> <Text id="652"><i>buildcol.pl</i></Text> </th> <th width="406"> <Text id="653">Programme de Greenstone utilisé pour construire des collections</Text> </th> </tr> <tr> <th width="123"> <Text id="654">Construction</Text> </th> <th width="406"> <Text id="655">Processus de création des structures d'indexation et de navigation utilisées pour accéder à une collection</Text> </th> </tr> <tr> <th width="123"> <Text id="656">C++</Text> </th> <th width="406"> <Text id="657">Langage de programmation dans lequel est écrit la majorité des logiciels Greenstone</Text> </th> </tr> <tr> <th width="123"> <Text id="658">Casse, ignorer la</Text> </th> <th width="406"> <Text id="659">Faire en sorte que les opérations de recherche ne distinguent pas les majuscules des minuscules</Text> </th> </tr> <tr> <th width="123"> <Text id="660">CGI</Text> </th> <th width="406"> <Text id="661">Common Gateway Interface (interface commune de passerelle), système qui permet à des utilisateurs d'activer des programmes sur l'ordinateur hôte (ou serveur) en cliquant sur des pages web</Text> </th> </tr> <tr> <th width="123"> <Text id="662">CGI, script</Text> </th> <th width="406"> <Text id="663">Code associé à un bouton, un menu, ou à un lien sur une page web qui spécifie ce que l'ordinateur hôte (ou serveur) doit faire lorsque l'utilisateur clique sur cet objet</Text> </th> </tr> <tr> <th width="123"> <Text id="664"><i>cgi-bin</i></Text> </th> <th width="406"> <Text id="665">Répertoire de stockage des scripts CGI</Text> </th> </tr> <tr> <th width="123"> <Text id="666">Classificateur</Text> </th> <th width="406"> <Text id="667">Module de code de Greenstone qui examine les méta-données d'un document et crée un index de navigation</Text> </th> </tr> <tr> <th width="123"> <Text id="668">Collection</Text> </th> <th width="406"> <Text id="669">Ensemble de documents rassemblés sous une interface de recherche et de navigation homogène</Text> </th> </tr> <tr> <th width="123"> <Text id="670">Collection, fichier de configuration</Text> </th> <th width="406"> <Text id="671">Fichier qui spécifie comment importer et construire une collection, quels index et quelles interfaces de langue fournir, etc.</Text> </th> </tr> <tr> <th width="123"> <Text id="672">Collection, serveur de</Text> </th> <th width="406"> <Text id="673">Programme fournissant l'accès à une collection en cours d'utilisation</Text> </th> </tr> <tr> <th width="123"> <Text id="674">Configuration, fichier de</Text> </th> <th width="406"> <Text id="675">Voir «Collection, fichier de configuration», «Principal, fichier de configuration», et «Site, fichier de configuration de»</Text> </th> </tr> <tr> <th width="123"> <Text id="676">CVS</Text> </th> <th width="406"> <Text id="677">Concurrent Versioning System (système de versions concurrentes), système permettant de maintenir le code source utilisé par Greenstone</Text> </th> </tr> <tr> <th width="123"> <Text id="678"><i>db2txt</i></Text> </th> <th width="406"> <Text id="679">Outil Greenstone permettant de visualiser une base de données GDBM sous forme textuelle (voir «GDBM»)</Text> </th> </tr> <tr> <th width="123"> <Text id="680">«Demo», collection</Text> </th> <th width="406"> <Text id="681">Sous-ensemble de la bibliothèque de développement pour l'humanité, distribué avec le logiciel Greenstone à des fins d'illustration et de didacticiel</Text> </th> </tr> <tr> <th width="123"> <Text id="682">Bibliothèque numérique</Text> </th> <th width="406"> <Text id="683">Collection d'objets numériques (textes, extraits audio ou vidéo) ainsi que de méthodes d'accès et de rapatriement, de sélection, d'organisation, et de maintenance</Text> </th> </tr> <tr> <th width="123"> <Text id="684"><i>HDL</i></Text> </th> <th width="406"> <Text id="685">Humanity Development Library (bibliothèque de développement pour l'humanité), collection Greenstone d'informations humanitaires pour les pays en voie de développement</Text> </th> </tr> <tr> <th width="123"> <Text id="686">Document</Text> </th> <th width="406"> <Text id="687">Unité de base servant à construire des collections de bibliothèques numériques; elle peut contenir du texte, des graphiques, du son, de la vidéo, etc.</Text> </th> </tr> <tr> <th width="123"> <Text id="688">Dublin core</Text> </th> <th width="406"> <Text id="689">Manière standardisée de décrire les méta-données</Text> </th> </tr> <tr> <th width="123"> <Text id="690">Fast CGI</Text> </th> <th width="406"> <Text id="691">Outil qui permet aux scripts CGI de demeurer actifs en permanence, de manière à éviter de les redémarrer de zéro à chacune de leurs invocations</Text> </th> </tr> <tr> <th width="123"> <Text id="692">Filtre, programme de</Text> </th> <th width="406"> <Text id="693">La portion d'un serveur de collection Greenstone qui implémente les opérations de requête et de navigation</Text> </th> </tr> <tr> <th width="123"> <Text id="694">Format, chaîne de</Text> </th> <th width="406"> <Text id="695">Chaîne qui spécifie comment afficher les documents et autres listes dans Greenstone</Text> </th> </tr> <tr> <th width="123"> <Text id="696">GB, encodage</Text> </th> <th width="406"> <Text id="697">Manière standardisée d'encoder le chinois</Text> </th> </tr> <tr> <th width="123"> <Text id="698">GDBM</Text> </th> <th width="406"> <Text id="699">GNU DataBase Manager (gestionnaire de bases de données de GNU), programme utilisé par le logiciel Greenstone pour stocker les méta-données de chaque document</Text> </th> </tr> <tr> <th width="123"> <Text id="700">GIMP</Text> </th> <th width="406"> <Text id="701">GNU Image-Manipulation Program (programme de manipulation d'images de GNU), utilisé (sur Unix) pour créer les icones de Greenstone</Text> </th> </tr> <tr> <th width="123"> <Text id="702">GML</Text> </th> <th width="406"> <Text id="703">Greenstone Markup Language (langage de balisage de Greenstone), un format compatible XML utilisé pour stocker les documents de manière interne</Text> </th> </tr> <tr> <th width="123"> <Text id="704">GNU, licence publique générale (GPL)</Text> </th> <th width="406"> <Text id="705">licence de logiciels qui permet aux utilisateurs de copier et de distribuer librement les programmes d'ordinateurs qu'elle couvre, ainsi que de les modifier, pour peu que toutes les modifications soient rendues publiques</Text> </th> </tr> <tr> <th width="123"> <Text id="706">Greenstone</Text> </th> <th width="406"> <Text id="707">Nom de ce logiciel de bibliothèque numérique </Text> </th> </tr> <tr> <th width="123"> <Text id="708">GSDL</Text> </th> <th width="406"> <Text id="709">Abréviation de \lang{Greenstone Digital Library} (bibliothèque numérique Greenstone)</Text> </th> </tr> <tr> <th width="123"> <Text id="710"><i>%GSDLHOME%</i></Text> </th> <th width="406"> <Text id="711">Variable pour le système d'exploitation (Windows) représentant le répertoire racine où tous les programmes et collections Greenstone sont stockés (<i>$GSDLHOME</i>sur des systèmes Unix)</Text> </th> </tr> <tr> <th width="123"> <Text id="712"><i>%GSDLOS%</i></Text> </th> <th width="406"> <Text id="713">Variable pour le système d'exploitation (Windows) représentant le système d'exploitation en cours d'utilisation (<i>$GSDLOS</i>sur des systèmes Unix)</Text> </th> </tr> <tr> <th width="123"> <Text id="714"><i>hashfile</i>DL</Text> </th> <th width="406"> <Text id="715">Programme Greenstone utilisé au moment de l'import ou de la construction pour générer l'OID de chaque document</Text> </th> </tr> <tr> <th width="123"> <Text id="716">HTML</Text> </th> <th width="406"> <Text id="717">HyperText Markup Language (langage de balisage pour l'hypertexte), le langage dans lequel la plupart des documents web sont écrits</Text> </th> </tr> <tr> <th width="123"> <Text id="718"><i>import.pl</i></Text> </th> <th width="406"> <Text id="719">Programme Greenstone utilisé pour importer des documents</Text> </th> </tr> <tr> <th width="123"> <Text id="720">Importing</Text> </th> <th width="406"> <Text id="721">Processus de rassemblement de collections de documents dans le système Greenstone </Text> </th> </tr> <tr> <th width="123"> <Text id="722">Index</Text> </th> <th width="406"> <Text id="723">Structure d'information utilisée pour la recherche ou la navigation au sein d'une collection</Text> </th> </tr> <tr> <th width="123"> <Text id="724">InstallShield</Text> </th> <th width="406"> <Text id="725">Programme Windows, utilisé par les cédéroms Greenstone, qui permet à un système d'être installé à partir d'un cédérom</Text> </th> </tr> <tr> <tr> <th width="123"> <Text id="726">Principal, fichier de configuration</Text> </th> <th width="406"> <Text id="727">Fichier contenant les spécifications communes à toutes les collections servies par un site</Text> </th> </tr> <th width="123"> <Text id="728">Méta-données</Text> </th> <th width="406"> <Text id="729">Informations de description telles que l'auteur, le titre, la date, des mots-clefs, etc., associées à un document (ou à une collection de documents)</Text> </th> </tr> <tr> <th width="123"> <Text id="730">MG</Text> </th> <th width="406"> <Text id="731">Managing Gigabytes (gérer les giga-octets), programme utilisé par le système Greenstone pour l'indexation du corps du texte, embarquant des techniques de compression (voir à ce sujet le livre de Witten, I.H., Moffat, A., et Bell, T. intitulé \mytitle{Managing Gigabytes: compressing and indexing documents and images} (gérer les giga-octets: compression et indexation des documents et des images), Morgan Kaufmann, deuxième édition, 1999)</Text> </th> </tr> <tr> <th width="123"> <Text id="732"><i>mgbuild</i></Text> </th> <th width="406"> <Text id="733">Programme MG utilisé pour construire un index de corps du texte</Text> </th> </tr> <tr> <th width="123"> <Text id="734"><i>mgquery</i></Text> </th> <th width="406"> <Text id="735">Programme MG utilisé pour effectuer des requêtes dans un index compressé de corps du texte</Text> </th> </tr> <tr> <th width="123"> <Text id="736"><i>mkcol.pl</i></Text> </th> <th width="406"> <Text id="737">Programme Greenstone qui crée et initialise la structure de répertoire d'une nouvelle collection</Text> </th> </tr> <tr> <th width="123"> <Text id="738">Nouvelle-Zélande, projet de bibliothèque numérique de</Text> </th> <th width="406"> <Text id="739">Projet de recherche du département d'informatique de l'université de Waikato en Nouvelle-Zélande, qui a créé le logiciel Greenstone (<u>nzdl.org</u>)</Text> </th> </tr> <tr> <th width="123"> <Text id="740">OID</Text> </th> <th width="406"> <Text id="741">Object Identifier (identifiant d'objet), code d'identification unique associé à un document</Text> </th> </tr> <tr> <th width="123"> <Text id="742">Perl</Text> </th> <th width="406"> <Text id="743">Langage de programmation utilisé pour une grande partie des opérations de manipulation de texte se déroulant lors du processus de construction</Text> </th> </tr> <tr> <th width="123"> <Text id="744">Ping</Text> </th> <th width="406"> <Text id="745">Message envoyé à un système pour déterminer s'il est en fonctionnement ou non</Text> </th> </tr> <tr> <th width="123"> <Text id="746">Greffon («plugin»)</Text> </th> <th width="406"> <Text id="747">Module de code qui gère des documents de divers formats, utilisé lors des processus d'import et de construction</Text> </th> </tr> <tr> <th width="123"> <Text id="748">Protocole</Text> </th> <th width="406"> <Text id="749">Ensemble de conventions par lesquelles le réceptionniste de Greenstone communique avec un serveur de collection</Text> </th> </tr> <tr> <th width="123"> <Text id="750">Ordonnée, requête</Text> </th> <th width="406"> <Text id="751">Requête à un système de rapatriement d'informations effectuée en langage naturel, et ordonnant les documents trouvés par ordre de pertinence</Text> </th> </tr> <tr> <th width="123"> <Text id="752">Réceptionniste</Text> </th> <th width="406"> <Text id="753">Programme qui organise l'interface utilisateur de Greenstone</Text> </th> </tr> <tr> <th width="123"> <Text id="754">RTF</Text> </th> <th width="406"> <Text id="755">Rich Text Format (format de texte enrichi), format standard pour l'échange de documents texte</Text> </th> </tr> <tr> <th width="123"> <Text id="756">Recherche</Text> </th> <th width="406"> <Text id="757">Accès à une collection à travers une recherche dans le corps du texte de ses contenus (ou d'une partie de ses contenus, telle que les titres de sections)</Text> </th> </tr> <tr> <th width="123"> <Text id="758">Serveur</Text> </th> <th width="406"> <Text id="759">Voir «Collection, serveur de» et «Web, serveur»</Text> </th> </tr> <tr> <th width="123"> <Text id="760"><i>setup.bat, setup.sh, setup.csh</i></Text> </th> <th width="406"> <Text id="761">Script utilisé pour mettre en place l'environnement nécessaire à la reconnaissance du logiciel Greenstone</Text> </th> </tr> <tr> <th width="123"> <Text id="762">Site, fichier de configuration de</Text> </th> <th width="406"> <Text id="763">Fichier contenant les spécifications utilisées pour configurer le logiciel Greenstone pour le site particulier sur lequel il est installé. </Text> </th> </tr> <tr> <th width="123"> <Text id="764">Troncature</Text> </th> <th width="406"> <Text id="765">Ôter la terminaison d'un mot dans un terme de requête pour généraliser la requête</Text> </th> </tr> <tr> <th width="123"> <Text id="766">STL</Text> </th> <th width="406"> <Text id="767"><i>Standard template library</i> (bibliothèque standard de patrons), bibliothèque très répandue de code C++, développée par Silicon Graphics</Text> </th> </tr> <tr> <th width="123"> <Text id="768">txt2db</Text> </th> <th width="406"> <Text id="769">Programme Greenstone utilisé au moment de la construction pour créer la base de données GDBM</Text> </th> </tr> <tr> <th width="123"> <Text id="770">Unicode</Text> </th> <th width="406"> <Text id="771">Système standard de représentation des ensembles de caractères utilisés dans les langues du monde</Text> </th> </tr> <tr> <th width="123"> <Text id="772">UNU</Text> </th> <th width="406"> <Text id="773">L'université des Nations-Unies; on utilise également ce sigle pour évoquer une collection Greenstone créée pour cette organisation</Text> </th> </tr> <tr> <th width="123"> <Text id="774">Web, serveur</Text> </th> <th width="406"> <Text id="775">Programme standard utilisé par les ordinateurs pour publier de l'information sur le web</Text> </th> </tr> <tr> <th width="123"> <Text id="776">XML</Text> </th> <th width="406"> <Text id="777">Format standard pour les documents et les données structurés sur le web (le langage de balisage de Greenstone—voir à ce sujet «GML»—est un format compatible XML)</Text> </th> </tr> </TableContent> </Table> </Content> </Chapter> <FootnoteList> <Footnote id="1"> <Text id="778">N.D.T. : Respectivement «et», «ou», et «non» en anglais.</Text> </Footnote> </FootnoteList> </Manual>