creator greenstone@cs.waikato.ac.nz public true buildtype mg plugin HTMLPlugin -input_encoding iso_8859_1 -description_tags -OIDtype dirname plugin GreenstoneXMLPlugin plugin MetadataXMLPlugin plugin ArchivesInfPlugin plugin DirectoryPlugin indexes section:text section:Title document:text classify Hierarchy -metadata "dls.Subject" -buttonname Subject -hfile dls.Subject.txt -sort dls.Title classify Hierarchy -metadata dls.AZList -buttonname Title -hfile dls.AZList.txt -hlist_at_top -sort dls.Title classify List -metadata dls.Organization -sort_leaf_nodes_using dls.Title -buttonname Organization -bookshelf_type always classify List -metadata dls.Keyword -buttonname Howto -bookshelf_type never format VList "[link][icon][/link] [highlight]{Or}{[dls.Title],[Title],Untitled}[/highlight] {If}{[Date],
_textdate_[Date]}{If}{[NumPages],
_textnumpages_[NumPages]}{If}{[Source],
_textsource_[Source]}
" format SearchVList "[link][icon][/link] {If}{[parent(All\': \'):Title], [parent(All\': \'):Title]:} [link][Title][/link]" format CL4VList "[link][dls.Keyword][/link]" format DocumentText "

[Title]

\\n\\n

[Text]" format DocumentImages true format DocumentButtons "Expand Text|Expand Contents|Detach|Highlight" format HList "[link][highlight][ex.Title][/highlight][/link]" format DocumentHeading "{Or}{[parent(Top):Title],[Title],untitled}
" # -- English strings ---------------- collectionmeta collectionname [l=en] "Development Library Subset collection" collectionmeta .section:text [l=en] "chapters" collectionmeta .section:Title [l=en] "section titles" collectionmeta .document:text [l=en] "entire documents" # -- French strings ---------------- collectionmeta collectionname [l=fr] "Sous-ensemble de la collection Bibliothèque de Développement" collectionmeta .section:text [l=fr] "chapitres" collectionmeta .section:Title [l=fr] "titres des sections" collectionmeta .document:text [l=fr] "documents entiers" # -- Spanish strings ---------------- collectionmeta collectionname [l=es] "Subconjunto de la Biblioteca para el Desarrollo" collectionmeta .section:text [l=es] "capítulos" collectionmeta .section:Title [l=es] "títulos de las secciones" collectionmeta .document:text [l=es] "documentos completos" # -- Russian strings ---------------- collectionmeta collectionname [l=ru] "Субколлекция Библиотеки развития" collectionmeta .section:text [l=ru] "Главы" collectionmeta .section:Title [l=ru] "Названия разделов" collectionmeta .document:text [l=ru] "Полные документы" # -- Simplified Chinese strings ---------------- collectionmeta collectionname [l=zh] "发展图书馆子馆藏" collectionmeta .section:text [l=zh] "章" collectionmeta .section:Title [l=zh] "节标题" collectionmeta .document:text [l=zh] "整个文档" # -- English text ---------------- collectionmeta collectionextra [l=en] "The Humanitarian Development Libraries represent a large collection of practical information aimed at helping reduce poverty, increasing human potential, and providing a practical and useful education for all. This subset contains about 25 publications--documents, reports, and periodical articles--in various areas of human development, from agricultural practice to economic policies, from water and sanitation to society and culture, from education to manufacturing, from disaster mitigation to micro-enterprises.

The editors of this collection are Human Info NGO, HumanityCD Ltd, and participating organizations. Contact us at Humanitarian and Development Libraries Project, Oosterveldiaan 196, B-2610 Antwerp, Belgium, Tel 32-3-448.05.54, Fax 32-3-449.75.74, email humanity@humaninfo.org.\n

How the collection works

\n

The DLS collection is fairly complex. If you\'re just starting out you might prefer to look at some other collections first (e.g. Word and PDF demonstration, or the Greenstone Archives, or the Simple Image collection).\n

The collection configuration file, like all collection configuration files, begins with a line (\"creator\") that gives the email address of the collection\'s creator, and another (\"public\") that determines whether the collection will appear on the home page of the Greenstone installation. Note that setting \"public\" to \"false\" only removes it from the home page; it will still be accessible in the library to anyone that knows the URL (a=p&p=about&c=coll-shortname). \n

Plugins. The \"plugin\" lines in the configuration file give the plugins used by the collection. The documents in the DLS collection are in HTML, so HTMLPlugin must be included. The description_tags option processes tags in the text that define sections and section titles as described below. \n

The other plugins, GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin, and DirectoryPlugin, are used by Greenstone for internal purposes and are standard in almost all collections.

Searchable indexes. The block of lines starting with indexes specifies what searchable indexes will be available. In this collection there are three: you can see them when you pull down the \"Search for\" menu on the search page. The first index is called \"chapters\", the second \"section titles\", and the third \"entire documents\". The names of these three indexes are given by three collectionmeta statements.\n

The contents of the indexes -- that is, the specification of what it is that will be searched -- are defined by the indexes line at the beginning of this block. This specifies three indexes, two at the section level (beginning with section:) and one at the document level (beginning with document:). The difference is that a multi-word query will only match a section-level index if all query terms appear in the same section, whereas it will match a document-level index if the terms appear anywhere within the document (which typically comprises several sections). The first and third indexes are section:text and document:text, and the :text means that the full text of sections and documents respectively will be searched. The second is section:Title, which means that Title metadata will be searched -- in this case, section titles (rather than document titles). The three indexes appear in the order in which they are specified on the indexes line.\n

Classifiers. The block of lines labeled classify define the browsing indexes, called \"classifiers\" in Greenstone. There are four of them, corresponding to four buttons on the navigation bar at the top of each page in the collection (e.g. the search page): subjects, titles, organisations, and howto The search button comes first, then come the four classifiers, in order.\n

The first classifier provides access by subject. It is a Hierarchy classifier whose hierarchy is defined in the file dls.Subject.txt (the hfile argument); this file is discussed below. This classifier is based on dls.Subject metadata, and when several books appear at a leaf of the hierarchy they are sorted by dls.Title metadata (as you can see here). The second classifier provides access by title. It is also a Hierarchy classifier, this time based on dls.AZList metadata, whose hierarchy is defined in dls.AZList.txt. This file is discussed below. The third provides access by organization: it is a List classifier based on dls.Organization metadata. The -bookshelf_type always option creates a new bookshelf for each organization, even if only one document belongs to that category. The fourth provides access by \"Howto\" text: it is a List classifier based on dls.Keyword metadata. The -bookshelf_type never option prevents bookshelves being created even if two documents share the same keywords.

Cover images. Greenstone looks for a cover image for each document, whose name is the same as the document\'s but with a .jpg extension. This image is associated with the document, and may be displayed on the document page (see below). Cover images can be switched off by setting the -no_cover_image flag for each plugin. \n

Format statements. The lines beginning with format, called \"format statements\", govern how various parts of the collection should be displayed. The VList format statement applies to lists of items displayed vertically, such as the lists of titles, subjects and organisations, and the table of contents for the target documents. It is overridden for the search results list by the SearchVList format statement, and also for the Howto classifier by the CL4VList statement (CL4 specifies the fourth classifier).

The DocumentText statement governs how the document text is formatted, with Title metadata ([Title]) in HTML <h3> format followed by the text of the document [Text]. Setting the DocumentImages format statement to true ensures that cover images are shown with each document. The DocumentButtons statement calls for the Expand Text, Expand Contents, Detach and Highlight buttons to be shown with each document.

Most format statements contain a string specified in an augmented form of HTML. Metadata names in square brackets (e.g. [Title], [Creator]) give the value of that metadata; [Text] gives the document text. A hyperlink to the document can be made using [link] ...[/link]; an appropriate icon is produced by [icon]. Format strings can include {If}{... , ...} and {Or}{... , ...}; the first two give examples. These two are fairly complex format statements; we will not explain them here. In Greenstone, changes in format strings take effect immediately unless you are using the local library server, in which case the server needs to be restarted. This makes it easy to experiment with different versions of a format statement and see what happens.\n

Collection-level metadata. The collectionmeta lines in the configuration file are also standard in all Greenstone collections. They give general information about the collection, defining its name, and a description that appears on its home page. The description (in collectionextra) can be seen on the DLS collection\'s home page (this text is part of it).\n

Language translations. The last part of the collection configuration file gives the collection-level metadata in French and Spanish respectively. The languages are indicated by square brackets: [fr] and [es]. If there is no language specification, English is assumed by default. The configuration file shows accented characters (e.g. French é). This file is in UTF-8, and these characters are represented by multi-byte sequences (<C3><A9> in this case). Alternatively they could be represented by their HTML entity names (like &eacute). It makes no difference: they look the same on the screen. However, if the text were searchable it would make a difference; Greenstone uses Unicode internally to ensure that searching works as expected for non-English languages.\n

Description tags. The description tags recognized by HTMLPlugin are inserted into the HTML source text of the documents to define where sections begin and end, and to specify section titles. They look like this:

<!--\n
<Section>\n
<Description>\n
<Metadata name=\"Title\">\n
Realizing human rights for poor people: Strategies\n
for achieving the international development targets\n
</Metadata>\n
</Description>\n
-->\n
(text of section goes here)\n
<!--\n
</Section>\n
-->\n
The <!-- ... --> markers are used to ensure that these tags are marked as comments in HTML and therefore do not affect document formatting. In the Description part other kinds of metadata can be specified, but this is not done for the style of collection we are describing here. Exactly the same specification (including the <!-- ... --> markers) can be used in Word documents too.\n

Metadata Files. Metadata for all documents in the DLS collection is provided in metadata.xml files, one per document folder. The metadata.xml file for one book -- Income generation and money management: training women as entrepreneurs -- is a block of about ten lines encased in <FileSet> ... </FileSet> tags. It defines dls.Title, dls.Language, dls.Subject and dls.AZList metadata. More than one value can be specified for any metadata item. For example, this book has two dls.Subject classifications. Both of these are stored as metadata values for this particular document (because mode=accumulate is specified; the alternative, and the default, is mode=override).\n

Hierarchy files. Hierarchy files contain a succession of lines each of which has three items. The first item is a text string which is matched against the metadata that occurs in the metadata.xml file described above. The second item is a number that defines the position in the hierarchy. The third item is a text string that describes the node of the hierarchy on the web pages that Greenstone generates.

For example, the following shows three lines from the subject hierarchy file dls.Subject.txt.

\"Animal Husbandry and Animal Product Processing\" 7 \"Animal Husbandry and Animal Product Processing\" \n
\"Animal Husbandry and Animal Product Processing|Cattle\" 7.1 \"Cattle\" \n
\"Animal Husbandry and Animal Product Processing|Other animals (micro-livestock, little known animals, \n      silkworms, reptiles, frogs, snails, game, etc.)\" 7.2 \"Other animals (micro-livestock, little known animals, \n      silkworms, reptiles, frogs, snails, game, etc.)\" \n

These three lines define one top level bookshelf (at position 7), titled \"Animal Husbandry and Animal Product Processing\", with two bookshelves underneath it, titled \"Cattle\" and \"Other animals (micro-livestock, little known animals, silkworms, reptiles, frogs, snails, game, etc.)\" respectively.

In this case, the first strings (and therefore the entries in metadata.xml files) contain the entire hierarchy values. Levels in the hierarchy are separated by \"|\". They could be used directly by a Hierarchy classifier without the use of the hierarchy file. However, then the entries would be ordered alphabetically, not in the special order defined by the file.

The dls.AZList.txt hierarchy file used by the titles classifier contains a similar structure. Ordinarily, a titles browser would use a List (or AZList) classifier. In this case, we want to predefine the A-Z groupings, and include a separate entry for periodicals, as can be seen here. " # -- French text ---------------- collectionmeta collectionextra [l=fr] "Les Bibliothèques humanitaires pour le Développement constituent une collection importante dont les objectifs sont d\'aider à réduire la pauvreté, de promouvoir l\'accroissement du potentiel humain, et d\'offrir une éducation pratique et utile à tous. Cette collection contient environ 25 publications -- documents, rapports, et articles de périodiques -- qui traitent de différents sujets liés au développement humain. On y trouve des informations concernant les pratiques agricoles aussi bien que les politiques économiques; les mesures d\'hygiène pour l\'eau et la société et la culture; l\'éducation et la petite industrie; la prévention des désastres et les micro-entreprises.

Les éditeurs de cette collection sont Human Info NGO, HumanityCD Ltd, and organisations ayant contribué. Vous pouvez nous contacter à Humanitarian and Development Libraries Project, Oosterveldiaan 196, B-2610 Antwerp, Belgium, Tel 32-3-448.05.54, Fax 32-3-449.75.74, courriel humanity@humaninfo.org.

Comment, marche la collection

La collection DLS est assez complexe. Pour un débutant, il serait préférable de consulter d\'abord d\'autres collections (par exemple Démonstration Word et PDF ou les Greenstone Archives ou la collection Simple Image).

Le fichier de configuration de la collection, comme tous les fichiers de configuration de collection, commence avec une ligne (\"creator\") qui donne l\'adresse e-mail du créateur de la collection et une autre ligne (\"public\") qui détermine la manière d\'apparition de la collection sur la page d\'accueil de Greenstone. Noter que paramétrer \"public\" à \"false\" ne supprime le lien vers la collection que sur la page d'accueil; la collection reste accessible via la bibliothèque numérique à toute personne qui en connaît l'URL (a=p&p=about&c=nom-abrégé-collection).

Plugins. Le troisième bloc de lignes dans le fichier de configuration donne la liste des plugins utilisés par cette collection. Les documents dans la collection DLS sont en HTML, ainsi HTMLPlugin doit être inclus. L\'option description_tags traite des onglets dans le texte qui définissent les sections et les titres de section comme décrit ci-dessous.

Les autres plugins, GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin et DirectoryPlugin sont utilisés par Greenstone pour des objectifs internes et sont des références dans presque toutes les collections.

Index recherchables. Le bloc de lignes qui commence avec index précise les type d\'index de recherche disponibles. Dans cette collection on en compte trois. Vous pouvez les voir en déroulant le menu \"Rechercher des\" sur la page de recherche. Le premier index est appelé \"chapitre\" , le second \"titres de section\" et le troisième \"documents entiers\". Les noms de ces trois index sont donnés par les trois déclarations collectionmeta.

Les contenus des trois index, à savoir la spécification de ce qui sera recherché, sont définies par la ligne des index au début de ce bloc. Trois index sont spécifiés, deux au niveau section (commençant par section:) et un autre au niveau document (commençant par document:.) La différence est qu\'une requête à mots multiples ne conviendra qu\'à un index de niveau section si tous les termes recherchés se trouvent dans la même section, tandis qu\'elle conviendra à un index de niveau document si les termes apparaissent n\'importe où dans le document (qui typiquement, comprend plusieurs sections). Le premier et le troisième index sont section:text et document:text, et :text signifie que le texte complet des sections et celui des documents seront respectivement recherchés. Le second est section:Title, qui signifie que la méta-donnée Title sera recherchée -- dans ce cas, les titres de section (plutôt que les titres de document). Les trois index apparaissent dans l\'ordre dans lequel ils sont précisés sur la ligne indexes.

Classificateurs. Le bloc de lignes libellé classify définit les index de navigation appelés \"classifiers\" dans Greenstone. Ils sont quatre, correspondant aux quatre boutons sur la barre de navigation en haut de chaque page dans la collection (c\'est à dire la page de recherche): sujets, titres, organisations et comment. Le bouton de recherche vient en premier, les quatre classificateurs.

Le premier classificateur fournit un accès par sujet. C\'est un classificateur Hierarchy dont la hiérarchie est définie dans le fichier dls.Subject.txt (l\'argument \"hfile\"); ce fichier est présenté ci-dessous. Ce classificateur est basé sur la méta-donnée dls.Subject et quand plusieurs livres apparaissent sur une feuille de la hiérarchie, ils sont triés suivant la méta-donnée dls.Title (comme visible ici). Le second classificateur fournit un accès par titre. C'est aussi un classificateur de la Hierarchy, basé cette fois sur la métadonnée dls.AZList, dont la hiérarchie est définie dans le fichier dls.AZList.txt. Ce fichier est décrit plus loin. Le troisième fournit un accès par organisation: c\'est un classificateur List basé sur les méta-données Organization. L'option -bookshelf_type always crée une nouvelle étagère pour chaque organisation, même s'il n'existe qu'un seul document appartenant à cette catégorie. Le quatrième fournit un accès par \"Howto\" : c'est un classificateur List basé sur les métadonnées dls.Keyword. L'option -bookshelf_type never permet d'éviter la création des étagères même si deux documents ont les mêmes mots-clés.

Images Couverture. Greenstone cherche une image couverture pour chaque document, dont le nom est le même que le document\'s mais avec une extension .jpg. Cette image est associée avec le document et pourrais être visualisé sur la page du document (voir ce-dessous). Les images couverture peuvent-être éteintes en réglant le drapeau -no_cover_image pour chauqe plug-in. \n

Déclarations de format. Les lignes commençant par format, appelées \"format statements\", déterminent la façon dont certaines parties de la collection seront affichées. Le format VList est appliqué aux listes d'éléments présentés verticalement, comme les listes de titres, de sujets ou d'organisations, et la table des matières pour les documents cibles. Il est modifié pour les liste de résultats de recherche par le format SearchVList, ainsi que par le format CL4VList pour le classificateur Howto (CL4 détermine le quatrième classificateur).

L'enregistrement DocumentText détermine la façon de formater le document textuel, avec la métadonnée Title ([Title]) insérée dans la balise HTML <h3> suivie par le texte du document ([Text]). Positionner la variable DocumentImages sur true entraîne l'affichage des images de couverture pour chaque document. La variable DocumentButtons permet l'affichage des boutons Expand Text, Expand Contents, Detach et Highlight avec chaque document.

La plupart des déclarations de format contiennent une chaîne spécifiée en HTML mise en valeur. Les noms de méta-données entre crochets (c\'et à dire [Title], [Creator]), donne la valeur de ces méta-données; [Text] donne le document texte. Un hyperlien au document peut être obtenu en utilisant [link] ... [/link]; une icône appropriée est générée par [icon]. Des chaînes de format peuvent inclure {If} {...,...} et {Or} {...,...}; les deux premières en donnent des exemples. Ces deux sont des déclarations de format assez complexes qui ne seront pas expliquées ici. Dans Greenstone, les changements dans les chaînes de format prennent effet immédiatement à moins que vous n\'utilisiez le serveur de la bibliothèque locale, auquel cas, le serveur à besoin d\'être réinitialisé. Cela rend facile l\'expérimentation de versions différentes d\'une déclaration de format et de voir ce qui se passe.

Méta-données de niveau collection. Les lignes collectionmeta dans le fichier de configuration sont aussi standard dans toutes les collections Greenstone. Elles donnent une information générale sur la collection par la définition de son nom, et par une description qui apparaît sur la page d\'accueil. La description (dans collectionextra) peut être vue sur la page d\'accueil de la collection (_text2_).

Traduction de langues. La dernière partie du fichier de configuration de la collection donne les méta-données de niveau collection en Français et en Espagnol respectivement. Les langues sont indiquées par des crochets:[fr] et [es]. Si aucune langue n\'est spécifiée, l\'Anglais est supposé par défaut. Le fichier de configuration montre des caractères mis en valeur (par exemple le \"é\" français). Ce fichier est en UTF-8, et ces caractères sont représentés par des séquences multi-octets (<C3><A9>) dans ce cas). Autrement, elles pourraient être représentées par leurs noms d\'entité (comme &eacute). Cela ne présente aucune différence: ils sont identiques à l\'écran. Cependant si les textes faisaient l\'objet d\'une recherche, une différence aurait été notée; Greenstone utilise Unicode de façon interne pour s\'assurer que le processus de recherche fonctionne comme prévu pour les langues autre que l\'anglais.

Etiquettes de description. Les étiquettes de description identifiées par \"HTMLPlugin\" sont insèrées dans le texte source HTML des documents pour délimiter le début et la fin des sections et pour spécifier les titres de section. Ils se présentent comme suit:

<!--\n
<Section>\n
<Description>\n
<Metadata name=\"Title\">\n
Realizing human rights for poor people: Strategies\n
for achieving the international development targets\n
</Metadata>\n
</Description>\n
-->\n
(text of section goes here)\n
<!--\n
</Section>\n
-->\n
Les marqueurs <!-- ... --> sont utilisés pour assurer que ces étiquettes sont indiquées comme commentaires dans HTML et par conséquent n\'ont aucun effet sur le formatage. Dans la partie Description, d\'autres types de méta-données peuvent être spécifiés mais ceci n\'est pas fait pour le style de collection décrit ici. La même spécification (y compris les marqueurs <!-- ... -->) peut être utilisée de façon tout à fait identique dans les documents Word.

Fichiers de méta-données. Les méta-données pour tous les documents de la collection DLS sont fournies dans le fichier metadata.xml. Le fichier metadata.xml pour le livre--Income generation and money management: training women as entrepreneurs --est un bloc de dix lignes comprises entre les étiquettes <FileSet> ... </FileSet>. Elle définit les méta-données dls.Title, dls.Language, dls.Subject et dls.AZList. Plus d\'une valeur peut être spécifiée pour n\'importe quel élément de méta-donnée. Par exemple, ce livre a deux classifications dls.Subject. Toutes les deux sont enregistrées comme comme valeurs de méta-donnée pour ce document particulier (parce que mode=accumulate est spécifié; autrement, le défaut est mode=override).

Fichiers d\'hiérarchie. Les fichiers de hiérarchie contiennent une succession de lignes qui comportent chacune trois éléments. Le premier élément est une chaîne de caractères pour laquelle une correspondance sera recherchée avec les métadonnées présentes dans le fichier metadata.xml décrit ci-dessus. Le second élément est un nombre qui détermine la position dans la hiérarchie. Le troisième élément est une chaîne de caractères qui décrit le noeud de la hiérarchie sur les pages que Greenstone génère.

Par exemple, ce qui suit représente trois lignes du fichier dls.Subject.txt qui organise la hiérarchie des sujets.

\"Animal Husbandry and Animal Product Processing\" 7 \"Animal Husbandry and Animal Product Processing\" \n
\"Animal Husbandry and Animal Product Processing|Cattle\" 7.1 \"Cattle\" \n
\"Animal Husbandry and Animal Product Processing|Other animals (micro-livestock, little known animals, \n      silkworms, reptiles, frogs, snails, game, etc.)\" 7.2 \"Other animals (micro-livestock, little known animals, \n      silkworms, reptiles, frogs, snails, game, etc.)\" \n

Ces trois lignes définissent une étagère située au plus haut niveau (à la position 7), intitulée \"Animal Husbandry and Animal Product Processing\", contenant deux étagères, intitulées respectivement \"Cattle\" et \"Other animals (micro-livestock, little known animals, silkworms, reptiles, frogs, snails, game, etc.)\".

Dans ce cas, les premières chaînes (et par conséquent les entrées dans le fichier metadata.xml) contiennent les valeurs de toute la hiérarchie. Les niveaux sont séparés dans la hiérarchie par \"|\". Elles peuvent être utilisées directement par un classificateur Hierarchy, sans passer par le fichier de hiérarchie. Cependant, les entrées seront ordonnées dans ce cas alphabétiquement, et non dans l'ordre défini dans le fichier.

Le fichier de hiérarchie dls.AZList.txt utilisé par le classificateur de titres obéit à une structure similaire. Normalement, un feuilletage des titres devrait utiliser un classificateur de List (ou de AZList). Dans ce cas, nous voulons prédéfinir les regroupements A-Z et inclure une entrée séparée pour les périodiques, comme cela se voit ici. " # -- Spanish text ---------------- collectionmeta collectionextra [l=es] " Las Bibliotecas sobre Aspectos Humanitarios y de Desarrollo representan una extensa colección de información práctica cuyo propósito es ayudar a reducir la pobreza, acrecentar el potencial humano y proveer una educación práctica y útil para todos. Este subconjunto comprende unas 25 publicaciones - documentos, informes técnicos y artículos de publicaciones periódicas - en varias áreas del desarrollo humano, desde prácticas agrícolas a políticas económicas, desde agua y saneamiento a sociedad y cultura, desde educación a manufactura, desde mitigación de desastres a microemprendimientos.\n

\nLos editores de esta colección son la ONG Human Info, HumanityCD Ltd y demás organizaciones participantes. Contáctenos en: Proyecto de Bibliotecas sobre Aspectos Humanitarios y de Desarrollo , Oosterveldiaan 196, B-2610 Antwerp, Bélgica, Tel 32-3-448.05.54, Fax 32-3-449.75.74, correo electrónico humanity@humaninfo.org.

Cómo trabaja esta colección

La colección DLS es bastante compleja. Si apenas está empezando a familiarizarse con su uso quizá fuera mejor que se fijara primero en alguna otra colección (como la Demostración en Word y PDF, los Archivos Greenstone o la colección de imágenes sencillas).

Al igual que todos los archivos de configuración de colecciones, el archivo de configuración de esta colección, empieza con una línea (\"creador\") que proporciona la dirección de correo electrónico del creador de la colección y otra (\"pública\") que determina si la colección aparecerá en la página principal del programa Greenstone. Note que configurando la opción \"public\" como \"false\" solo la quita de la página home, pero permanecerá accesible en la biblioteca para cualquiera que conozca la URL (a=p&p=about&c=coll-shortname).

Plugins. Las líneas \"plugin\" en el archivo de configuración indican los plugins usados en la colección. Los documentos en la colección DLS están en HTML, por lo que se deberá incluir HTMLPlugin. La opción description_tags procesa las etiquetas en el texto que definen secciones y títulos de secciones tal como se describe a continuación.

Los otros plugins, GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin, y DirectoryPlugin, son empleados por Greenstone con fines particulares y son estándar en casi todas las colecciones.

Índices de búsqueda. El bloque de líneas que empieza con índices especifica los índices de búsqueda que están disponibles. En esta colección hay tres, los cuales se pueden ver al momento de desplegar el menú \"Buscar\" en la página de búsqueda. El primer índice se llama \"capítulos\", el segundo \"títulos de sección\" y el tercero \"documentos enteros\". Los nombres de estos tres índices están dados por tres enunciados collectionmeta.

El contenido de los índices -- es decir, la especificación de lo que se va a buscar -- se define por medio de la línea que se encuentra al principio de este bloque. Esta especifica tres índices, dos a nivel de sección (los cuales empiezan con section:) y uno a nivel de documento (el cual empieza con document:). La diferencia está en que una consulta de varias palabras únicamente encontrará una correspondencia en un índice a nivel de sección si todos los términos de la consulta aparecen en la misma sección, mientras que encontrará la correspondencia en un índice a nivel de documento si los términos aparecen en cualquier parte del documento (el cual consiste normalmente de varias secciones). El primero y tercer índices son section:text y document:text, donde :text significa que se buscará en todo el texto de la sección o el documento, respectivamente. El segundo es section:Title, el cual indica que se buscarán metadatos de Título, en este caso títulos de secciones (más que títulos de documentos). Los tres índices aparecerán en el orden en que se especificaron en la línea de índices.

Clasificadores. El bloque de líneas con la etiqueta classifier define los índices de exploración, llamados \"clasificadores\" en Greenstone. Hay cuatro de ellos correspondientes a los cuatro botones en la barra de navegación que se encuentra en la parte superior de cada página de la colección (p. ej. la página de búsqueda): temas, títulos, organización y cómo. El botón de búsqueda aparece primero y a continuación los cuatro clasificadores en orden.

El primer clasificador le da acceso al asunto. Es un clasificador Hierarchy, el cual se define en el archivo dls.Subject.txt (el argumento hfile); este archivo se describe más adelante. El clasificador se basa en el metadato dls.Subject y cuando varios libros aparecen en una hoja de la jerarquía se ordenan por medio del metadato dls.Title (como se puede ver aquí). El segundo clasificador provee acceso por título. Es un clasificador Hierarchy también, pero esta vez basado en el metadato dls.AZList, cuya jerarquía está definida en dls.AZList.txt. Este archivo se describe abajo. El tercero le da acceso a la organización. Es un clasificador List basado en el metadato dls.Organization. La opción -bookshelf_type always crea un estante para cada organización, aún cuando un solo documento pertenezca a esa categoría. El cuarto provee acceso por el texto \"Howto\": es una clasificador List basado en el metadato dls.Keyword. La opción -bookshelf_type never previene la creación del estante aún cuando dos documentos compartan las mismas keywords.

Imágenes de Portada. Greenstone buscar una imágen de portada para cada documento cuyo nombre sea el mismo al documento pero con una extensión .jpg. Esta imágen está asociada con el documento, y puede ser mostrada en la página del documento (ver aqui abajo). Las imágenes de portada pueden ser apagadas al ajustar el -no_imágen_de_portada para cada entrada. \n Enunciados de formato. La líneas que comienzan con format, llamadas \"sentencias de formateo\", determinan la forma en la que deben mostrarse muchas de las partes de la colección. La sentencia de formato de VList se aplica a las listas de items mostrados verticalmente, como por ejemplo listas de títulos, temas y organizaciones y la tabla de contenidos de los documentos. Es omitida para la lista de resultados mediante la sentencia SearchVList, y también para el clasificador Howto a través de la sentencia CL4VList (CL4 especifica el cuarto clasificador).

La sentencia DocumentText determina el modo en el que se formatea el texto, con el metadato Title ([Title]) en formato HTML <h3> seguido por el texto del documento [Text]. Configurando la sentencia DocumentImages como true aseguramos que las imágenes de portada se visualicen en cada documento. DocumentButtons indica cuales botones se muestran en cada documento. Las opciones son: ExpandText, Expand Contents, Detach y Highlight.

La mayoría de los enunciados de formato contienen una cadena escrita en una forma aumentada de HTML. Los nombres de los metadatos entre corchetes (p. ej. [Title], [Creator]) dan el valor de dicho metadato. [Text] da el texto del documento. También se puede establecer un hipervínculo con el documento por medio de [link] ...[/link]. Un icono apropiado es producido por [icon]. Las cadenas de formato pueden incluir {If}{... , ...} y {Or}{... , ...}. Los primeros dos contienen ejemplos. Estos dos son enunciados de formato demasiado complejos, por lo que no los explicaremos aquí. En Greenstone los cambios en las cadenas de formato tienen efecto inmediatamente a menos que se esté usando el servidor local, en cuyo caso el servidor necesitará reiniciarse. Esto hace que sea fácil experimentar con diferentes versiones de un enunciado de formato y ver qué pasa.

Metadatos a nivel de colección. Las líneas de collectionmeta en el archivo de configuración también son estándar en todas las colecciones Greenstone. Contienen información general acerca de la colección definiendo su nombre, y una descripción que aparece en su página inicial. La descripción (en collectionextra) se puede ver en la página inicial de la colección DLS (este texto es parte de él).

Traducción de idioma. La última parte del archivo de configuración de la colección proporciona los metadatos a nivel de colección en francés y español, respectivamente. Estos idiomas se indican por medio de corchetes: [fr] y [es]. Si no hay ninguna especificación del idioma, entonces el inglés se asume por omisión. El archivo de configuración muestra los caracteres que se acentúan (p. ej. la é francesa). Este archivo está en UTF-8 y los caracteres se representan por medio de secuencias de varios bytes (<C3><A9> en este caso). De forma alternativa se pueden representar por medio de nombres de entes HTML (como &eacute). No hay ninguna diferencia y se ven igual en la pantalla. Sin embargo, esto sí representaría una diferencia en el caso de que el texto se buscara. Greenstone utiliza Unicode internamente para asegurarse que las búsquedas trabajen tal como se espera con idiomas diferentes al inglés.

Etiquetas de descripción. Las etiquetas de descripción reconocidas por HTMLPlugin se insertan en el texto fuente HTML de los documentos para definir el lugar en el que las secciones empiezan y terminan y para especificar los títulos de sección. Se ven de la siguiente manera:

<!--\n
<Section>\n
<Description>\n
<Metadata name=\"Title\">\n
Haciendo realidad los derechos humanos para la gente pobre: Estrategias\n
para lograr los objetivos de desarrollo mundial\n
</Metadata>\n
</Description>\n
-->\n
(el texto de la sección va aquí)\n
<!--\n
</Section>\n
-->\n

Los marcadores <!-- ... --> se utilizan para asegurarse que estas etiquetas estén marcadas como comentarios en HTML y por lo tanto que no afecten el formato del documento. En la parte de Descripción se pueden especificar otros tipos de metadatos, pero esto no se hace para el estilo de colección que estamos describiendo aquí. Exactamente la misma especificación (incluyendo los marcadores <!-- ... -->) se puede usar también en los documentos Word.

Archivos de metadatos. Los metadatos para todos los documentos de la colección DLS se proporcionan en documentos metadata.xml, un documento por folder. El documento metadata.xml para el libro--Income generation and money management: training women as entrepreneurs -- es un bloque de alrededor diez lineas encerradas en las etiquetas <FileSet> ... </FileSet>. El cual define los metadatos dls.Title, dls.Language, dls.Subject y dls.AZList. Se puede especificar más de un valor para cualquier ítem del metadato. Por ejemplo, este libro tiene dos clasificaciones dls.Subject. Ambos se almacenan como valores del metadato para este documento en particular (ya que se especifica mode=accumulate; la alternativa y el valor por omisión es mode=override).

Archivos de jerarquía. Los archivos de Hierarchy contienen una sucesión de líneas, cada una de las cuales tiene tres items. El primer item es una cadena de texto que es confrontada con el metadato que aparece en el archivo metadata.xml descrito arriba. El segundo item es un número que define la posición en la jerarquía. El tercer item es una cadena de texto que describe al nodo de la jerarquía de la página web que genera Greenstone.

Por ejemplo, las siguientes tres líneas pertenecen al archivo de jerarquia dls.Subject.txt.

\"Animal Husbandry and Animal Product Processing\" 7 \"Animal Husbandry and Animal Product Processing\" \n
\"Animal Husbandry and Animal Product Processing|Cattle\" 7.1 \"Cattle\" \n
\"Animal Husbandry and Animal Product Processing|Other animals (micro-livestock, little known animals, \n      silkworms, reptiles, frogs, snails, game, etc.)\" 7.2 \"Other animals (micro-livestock, little known animals, \n      silkworms, reptiles, frogs, snails, game, etc.)\" \n

Estas tres líneas definen un estante de nivel superior (en la posición 7), titulado \"Animal Husbandry and Animal Product Processing\", con dos estantes bajo él, \"Cattle\" y \"Other animals (micro-livestock, little known animals, silkworms, reptiles, frogs, snails, game, etc.)\" respectivamente.

En este caso, las primeras cadenas de texto (y por consiguiente las entradas en el archivo metadata.xml) contienen todos los valores de la jerarquía. Los niveles en una jerarquía se separan con \"|\". Estos niveles pueden usarse directamente con el clasificador Hierarchy sin tener que usar el archivo de jerarquía. Sin embargo, de esta manera las entradas serían ordenadas alfabéticamente, y no en el orden particular definido en el archivo.

El archivo de jerarquía dls.AZList.txt usado por el clasificador por títulos contiene una estructura similar. Ordinariamente, un navegador por títulos usaría un clasificador List (o AZList). En este caso, queremos predefinir el agrupamiento A-Z, e incluye una entrada separada para periódicos, como puede verse aquí. " # -- Russian text ---------------- collectionmeta collectionextra [l=ru] " Библиотеки гуманитарного развития представляют большую коллекцию практической информации, полезной при оказании помощи для уменьшения бедности, увеличения гуманитарного потенциала, а также обеспечения практичного и полезного образования для всех. Это подмножество содержит приблизительно 25 публикаций -- документов, сообщений и периодических статей -- в различных областях человеческого развития, от сельскохозяйственной практики до экономической политики, от воды и очистки до общества и культуры, от образования до производства, от уменьшения бедствий до малых предприятий.

Издатели этой коллекции -- Гуманитарная информационная неправительственная организация Human Info NGO, Humanity CD Ltd, и другие сотрудничающие организации. Контакты с ними возможны через Проект гуманитарных и развивающихся библиотек: Oosterveldiaan 196, B-2610 Antwerp, Belgium, Tel 32-3-448.05.54, Fax 32-3-449.75.74, email humanity@humaninfo.org.

Как работает коллекция

_text1_ если Вы являетесь только начинающим пользователем, то лучше вначале ознакомиться с некоторыми другими коллекциями (например, с msword и pdf демонстрациями или же с архивами или с простой графической коллекцией).

Конфигурационный файл коллекции, подобно всем конфигурационным файлам других коллекций, начинается со строки «Создатель» (\"Сreator\"), которая сообщает адрес электронной почты Создателя коллекции, и другой -- «Публика» (\"Public\"), которая определяет, появится ли коллекция на домашней странице установки Greenstone. _text3_

Плагины. Блок строк \"plugin\" в конфигурационном файле представляет плагины, используемые коллекцией. Документы в коллекции DLS представлены в HTML-формате, так что HTMLPlugin должен быть включен. Опция description_tags обрабатывает тэги (признаки) в тексте, которые определяют разделы и наименования разделов, как описано ниже.

Другие плагины GreenstoneXMLPlugin, MetadataXMLPlugin,ArchivesInfPlugin и DirectoryPlugin используются в Greenstone для внутренних целей и являются стандартными почти во всех коллекциях.

Индексы поиска. Блок строк, начинающийся с indexes, определяет, какие поисковые индексы будут доступны. В этой коллекции есть три индекса. Вы можете их видеть в ниспадающем меню «Поиск» на странице поиска. Первый индекс называется «Главы», второй -- «Названия разделов» и третий -- «Полные документы». Названия этих трех индексов даются тремя операторами collectionmeta.

Содержание индексов -- то есть описание того, что будет являться предметом поиска -- определяется строкой indexes в начале этого блока. Она определяет три индекса, два из них -- на уровне раздела (начинающиеся с section:) и один на уровне документа (начинающийся с document:). Различие состоит в том, что запрос, состоящий из нескольких слов, будет соответствовать только индексу уровня раздела, если все термины запроса появляются в том же самом разделе, тогда как он будет соответствовать уровню документа, если термины появляются где-либо в пределах документа, который обычно включает несколько разделов. Первый и третий индексы -- это section:text и document:text, где :text означает, что полный текст разделов и документов соответственно будет предметом поиска. Второй индекс -- section:Title означает, что метаданные Названия (Title) будут подвергнуты поиску. В этом случае названия разделов скорее, чем названия документов. Эти три индекса появляются в порядке, в котором они определены в строке indexes.

Классификаторы. Блок строк, помеченных classify, определяющие индексы просмотра, в Greenstone называются Классификаторами. Имеется четыре классификатора, соответствующие четырем кнопкам на навигационной линейке наверху каждой страницы в коллекции (например, поисковая страница): Указатель, Названия, Организации и Как. Первой является кнопка поиска, а затем по порядку эти четыре классификатора.

Первый классификатор обеспечивает доступ к предметам. Это иерархический классификатор, который определяет иерархию в файле dls.Subject.txt (параметр hfile); этот файл обсуждается ниже. Этот классификатор базируется на метаданных dls.Subject(Предмета). Когда несколько книг появляются в листе иерархии, они сортируются с помощью метаданных dls.Title (Названия) (как Вы можете видеть здесь). _text6_ Третий дает доступ по организациям: это классификатор Список основанный на метаданных dls.Organization. _text8_ _text9_

Изображения обложки. Гринстоун ищет изображения обложки для каждого документа, чье имя совпадает с названием документа, но имеет расширение .jpg. Это изображение ассоциируется с документом и может быть использоваться на страничке документа (смотри ниже). Изображения обложек можно выключить, используя флаг -no_cover_image в каждом плагине. \n

Операторы формата. _text10_

_text11_

Большинство операторов формата содержат строку, указанную в пополненной форме HTML. Имя метаданных в квадратных скобках (например, [Название], [Создатель]) дают значения этим метаданным. [Текст] дает текст документа. Гиперссылка к документу может быть создана, используя [link]...[/link]; соответствующее изображение обложки производится с помощью [icon]. Строки формата могут включать {If} {...,...}и {Or} {...,...}; для первых двух даются примеры. Эти два -- довольно сложные операторы формата. Мы не будем объяснять их здесь. В Greenstone изменения в строках формата вступают в силу немедленно, если Вы не используете местный сервер библиотеки, когда сервер должен быть повторно запущен. Это облегчит эксперименты с различными версиями оператора формата и наблюдение за тем, что при этом происходит.

Метаданные уровня коллекции. Строки collectionmeta в конфигурационном файле также стандартны во всех коллекциях Greenstone. Они дают общую информацию о коллекции, определяя ее название (имя), представляют краткое описание, которое появляется на ее домашней странице. Краткое описание (в collectionextra) можно видеть на домашней странице коллекции (_text2_)

Переводы с одного языка на другой. Последняя часть конфигурационного файла коллекции представляет метаданные на уровне коллекции на французском и испанском языках соответственно. Языки обозначены в квадратных скобках: [fr] и [es]. Если отсутствует указание спецификации языка, английский язык принят по умолчанию. Конфигурационный файл показывает характерные особенности знаков (например, во французском языке). Этот файл находится в UTF-8, где эти знаки представлены мультибайтным порядком следования (<C3><A9> в этом случае). Альтернативно они могут быть представлены их HTML названиями объекта (подобно &eacute). В этом нет никакого различия: они выглядят на экране одинаково. Однако, если бы текст был доступен для поиска, то различие имело бы место. Greenstone использует внутренний Unicode, чтобы гарантировать возможность поиска и для неанглийских языков.

Описание дескрипторов. Описание дескрипторов, распознаваемых HTMLPlugin, вставлены в HTML текста документов, чтобы определить, где начинаются и заканчиваются разделы, и определить названия разделов. Они выглядят таким образом:

<!--\n
<Section>\n
<Description>\n
<Metadata name=\"Title\">\n
Realizing human rights for poor people: Strategies\n
for achieving the international development targets\n
</Metadata>\n
</Description>\n
-->\n
(текст раздела идет сюда)\n
<!--\n
</Section>\n
-->\n

Маркеры <!-...-> используются, чтобы гарантировать, что эти дескрипторы отмечены как комментарии в HTML и поэтому затрагивают форматирование документа. В Описании могут быть определены другие виды метаданных, но это не сделано для стиля коллекции, которую мы описываем здесь. Точно такая же спецификация (включая и <!-...-> маркеры) могут использоваться также в документах Word.

Файлы метаданных. Метаданные для всех документов в DLS-коллекции расположены в файлах metadata.xml, по файлу в папке документа. Файл metadata.xml для книги -- Income generation and money management: training women as entrepreneurs -- представляет собой блок из 10 строк заключенных в тэгах <FileSet> ... <FileSet>. Они определяют dls.Title, dls.Language, dls.Subject и метаданные dls.AZList. Больше чем одно значение может быть определено для любых пунктов метаданных. _text5_ Оба сохранены в качестве метаданных для этого специфического документа, потому что состояние=накапливать (mode=accumulate) определено, а в качестве альтернативы - значение по умолчанию, которым является mode=override.

Иерархические файлы. _text12_

_text13_

\"Animal Husbandry and Animal Product Processing\" 7 \"Animal Husbandry and Animal Product Processing\" \n
\"Animal Husbandry and Animal Product Processing|Cattle\" 7.1 \"Cattle\" \n
\"Animal Husbandry and Animal Product Processing|Other animals (micro-livestock, little known animals, \n      silkworms, reptiles, frogs, snails, game, etc.)\" 7.2 \"Other animals (micro-livestock, little known animals, \n      silkworms, reptiles, frogs, snails, game, etc.)\" \n

_text14_

_text15_

_text16_ " # -- Simplified Chinese text ---------------- collectionmeta collectionextra [l=zh] " 人类发展图书馆是一个有大量实用信息的大型馆藏,旨在帮助减少贫困,提升人类潜能,以及为所以人提供一个实际且有用的教育。 这个子集包含25个出版物——文档、报告以及定期发表的文章——覆盖了人类发展的多个领域,从农业行为到经济政策,从水与 卫生到社会与文化,从教育到制造,从灾难恢复到微观企业。

本馆藏的编辑者是Human Info NGO,HumanityCD Ltd,以及参与的组织。我们的联系方式是:人类与发展图书馆项目 (Humanitarian and Development Libraries Project),Oosterveldiaan 196,B-2610 Antwerp,Belgium。 电话 32-3-448.05.54,传真 32-3-449.75.74,电邮 humanity@humaninfo.org.\n

本馆藏如何工作

\n

DLS馆藏比较复杂。如果你刚开始接触馆藏,其他一些馆藏可能更适合你 (比如Word与PDF演示,或者 Greenstone存档,或者 简单图像馆藏)。\n

本馆藏的配置文件跟其他配置文件一样,开始是给出馆藏创建者email地址的行 (\"creator\"),另外一行(\"public\")决定是否在Greenstone主页上显示本馆藏。 请注意将\"public\"设置成\"false\"只会将馆藏从主页显示上删除, 任何知道URL(a=p&p=about&c=coll-shortname)的人仍将能访问该馆藏。\n

插件配置文件中的\"plugin\"(插件)行给出了本馆藏用到的插件。 DLS馆藏里的文档是HTML,所以HTMLPlugin(HTML 插件)必须包括在内。description_tags选项处理文本中定义章节与章节标题的标签,如下所述。\n

另外的插件,GreenstoneXMLPlugin、MetadataXMLPlugin、ArchivesInfPlugin与DirectoryPlugin, 在Greenstone中被用于内部处理,并且在几乎所有馆藏中都是标准插件。

可检索的索引。这一段始于indexes配置,这一行指定了可检索的索引。在本馆藏中有三个可检索的索引: 你可在搜索页面中打开“搜索”下拉列表菜单时看到。 第一个索引称为\"章\",第二个\"节标题\",第三个是\"整个文档\"。这三个索引的名字由三个 collectionmeta定义。\n

索引的内容——即对可检索内容的指定——是由这段最开始的indexes(索引)行定义的。 这行定义了三个索引,两个在节级(以section:开始),另一个在文档级(以 document:开始)。区别在于当查询式有多个词时,若所有查询词都出现在同一节中, 这将只匹配节级别的索引,而若所有词出现在文档的任何部分(通常都由若干节组成),将匹配 一个文档级的索引。第一个和第三个索引是section:textdocument:text:text 意味着节与文档的全文将被搜索。第二个索引是section:Title,意味着Title(标题) 元数据将被检索——在这种情况下检索的是节标题(而不是文档标题)。这三个索引将按照indexes行中定义的顺序出现。\n

分类器classify行定义了浏览的索引,在Greenstone中称为\"分类器\"。本馆藏有四个分类器, 这与馆藏中每页最顶端浏览条中的四个按钮对应(比如,检索页面): 主题标题组织指南搜索按钮排在最前面,然后按顺序显示这四个分类器。\n

第一个分类器提供按主题的访问。这是一个层级分类器,dls.Subject.txt 文件(hfile参数)定义了这些层级,下面将讨论这个文件。这个分类器基于dls.Subject元数据, 而当多本书出现在层级中的一个叶子节点中时,它们将按dls.Title元数据排序(正如这里所示)。 第二个分类器提供按题名的访问。这也是一个层级分类器,是基于dls.AZList元数据,其层级定义在 dls.AZList.txt文件中。下面会讨论这个文件。 第三个分类器提供按组织的访问:它是基于dls.Organization元数据构建的List分类器。-bookshelf_type always选项 为每个组织创建一个新的书架,即使当只有一个文档属于那个目录时。 第四个分类器按\"指南\"提供访问:它是基于dls.Keyword元数据的List分类器。 -bookshelf_type never选项表明即使当两个文档拥有同样的关键词时,也不会为其创建书架。

封面图片。Greenstone检查每个文档的封面图片,该封面图片与该文档同名,但是是.jpg文件类型。这个图片将被链接到该文档, 而且可在文档页面(如下所示)中显示。通过设置每个插件的-no_cover_image标识可取消显示封面图片。\n

格式变量。这些行以format开头,称为\"格式变量\",控制馆藏的各个部分应如何显示。VList格式变量作用于所有竖向显示条目 的列表,比如题名列表、主题列表和组织列表,以及目标文档的内容大纲。对于搜索结果列表而言,这个格式变量被SearchVList格式变量所重写, 同样的指南分类器的格式由CL4VList变量重写(CL4指第四个分类器)。

DocumentText(文档文本)格式变量控制文档文本的格式,即HTML中<h3>中的题名元数据([Title]),接下来显示 文档文本[Text]。将DocumentImages格式变量设为true确保在每个文档中都显示封面图片。DocumentButtons变量确定在每个文档中显示显示所有文本、 扩展目录表、在新窗口显示本页以及突出显示查询项按钮。

多数格式变量本身包含修改后的HTML代码。方括号括起来的元数据名(比如[Title],[Creator]) 给出了该元数据的值。[Text](文本)代表文档文本。文档的链接可用[link]……[/link]指定, [icon]代表一个合适的图标。格式字串可包含{If}{... , ...}与{Or}{... , ...},最前面的两个给出了示例。 这两个格式变量相对比较复杂,在这里我们就不更多解释了。在Greenstone中,格式字串中的更改可以立即起效,除非 当前使用的是本地服务器,而在这种情况下需要重启服务器。这使得调试格式变量以及它们的效果变得相对比较容易。\n

馆藏级的元数据。配置文件中的collectionmeta行同样也是所有Greenstone馆藏中的标准化设置。它们 描述了馆藏的一般性信息,定义了馆藏的名字,以及在该馆藏主页上显示的描述。这里的描述信息(定义在collectionextra中) 可在DLS馆藏的主页上看到(这里的文本是其中的一部分)。\n

语言翻译馆藏配置文件的最后部分 分别给出了法语和西班牙语的馆藏级元数据。方括号中的内容指定语种:[fr]和[es]。如果没有指定语种, 则缺省假设是英语。配置文件中有带沉音字符(比如法语中的é)。这个文件是UTF-8编码的,因此这些字符由 多字节序列表示(这里是<C3><A9>)。或者它们可由其HTML实体名称所表示(比如&eacute)。 这两者没有任何差别:它们在屏幕上的显示都是一样的。然而,如果文本是可检索的,那么还是有一点不同, Greenstone内部使用Unicode来保证所有非英语语言而言搜索功能都能正常工作。

描述标签HTMLPlugin(HTML插件)识别的描述标签是被插入到文档的HTML源文本中, 用来定义每节的开头与结尾,以及每节的标题。比如:

 
<!--\n 
<Section>\n 
<Description>\n 
<Metadata name=\"Title\">\n 
Realizing human rights for poor people: Strategies\n 
for achieving the international development targets\n 
</Metadata>\n 
</Description>\n 
-->\n 
(text of section goes here)\n 
<!--\n 
</Section>\n 
-->\n 
<!-- ... -->标记用来保证这些标签在HTML中被认为是注释,因此不会影响到文档的格式。 在Description(描述)部分可以设置其他类型的元数据,但是在我们这里所描述的馆藏中 并没有这样的设置。同样的,这些设置(包括<!-- ... -->标签)也可用在Word文档中。\n

元数据文件。DLS馆藏中所有文档的元数据都在metadata.xml文件中,每个文件对应于一个文件夹。 这个metadata.xml文件是附属于这本书 ——Income generation and money management: training women as entrepreneurs (创收与金钱管理:将妇女训练为企业家)——其<FileSet>……</FileSet>标签中有大概十行。 它定义了dls.Titledls.Languagedls.Subjectdls.AZList元数据。每个元数据条目可以有多个值。比如,这本书 就有两个dls.Subject分类。这两个都将用作这个文档的元数据值(因为设置了mode=accumulate, 与之对立的是mode=override,这也是缺省值)。\n

层级文件。层级文件有若干行,每行由三个条目组成。第一个条目是字符串,它将匹配前面所描述 的metadata.xml 文件中的元数据。第二个条目是一个数字,它定义了层级中的位置。第三个条目是字符串, 它描述了所生成的网页中该层级节点的位置。

比如,下面显示了主题层级文件dls.Subject.txt中的三行。

\"Animal Husbandry and Animal Product Processing\" 7 \"Animal Husbandry and Animal Product Processing\" \n
\"Animal Husbandry and Animal Product Processing|Cattle\" 7.1 \"Cattle\" \n
\"Animal Husbandry and Animal Product Processing|Other animals (micro-livestock, little known animals, \n      silkworms, reptiles, frogs, snails, game, etc.)\" 7.2 \"Other animals (micro-livestock, little known animals, \n      silkworms, reptiles, frogs, snails, game, etc.)\" \n

这三行定义了一个顶层书架(位置7),题名为\"Animal Husbandry and Animal Product Processing\", 其下有两个书架,题名分别为\"Cattle\"和\"Other animals (micro-livestock, little known animals, silkworms, reptiles, frogs, snails, game, etc.)\"。

在这中情况下,第一个字符串(即metadata.xml文件中的条目)包含了整个层级值。层级中的各个层次由\"|\"分隔。它们可以直接使用一个 Hierarchy分类器而不用层级文件。然而,此时所有条目将按字符顺序排序,而不是以那个文件中定义的特别顺序。

这些标题分类器使用的dls.AZList.txt层级文件有着类似的结构。通常情况下, 题名浏览器会使用List(或AZList)分类器。在这种情况下,我们预先定义A到Z的分组,并为期刊专门设置一个独立的条目,如 这里所示。 "