creator greenstone@cs.waikato.ac.nz public true plugin HTMLPlugin -description_tags -input_encoding iso_8859_1 -OIDtype dirname plugin GreenstoneXMLPlugin plugin MetadataXMLPlugin plugin ArchivesInfPlugin plugin DirectoryPlugin indexes section:text section:Title document:text classify Hierarchy -metadata dls.Subject -sort Title -buttonname Subject -hfile dls.Subject.txt classify Hierarchy -hlist_at_top -metadata dls.AZList -sort Title -buttonname Title -hfile dls.AZList.txt classify Hierarchy -metadata dls.Organization -sort Title -buttonname Organization -hfile dls.Organization.txt classify Hierarchy -metadata dls.Keyword -sort Title -buttonname Howto -hfile dls.Keyword.txt format VList "[link][icon][/link] [highlight]{Or}{[Title],Untitled}[/highlight] {If}{[Date],
_textdate_[Date]}{If}{[NumPages],
_textnumpages_[NumPages]}{If}{[Source],
_textsource_[Source]}
" format SearchVList "[link][icon][/link] {If}{[parent(All\': \'):Title], [parent(All\': \'):Title]:} [link][Title][/link]" format DocumentText "

[Title]

\\n\\n

[Text]" format DocumentImages true format DocumentButtons "Expand Text|Expand Contents|Detach|Highlight" # -- English strings ---------------- collectionmeta collectionname [l=en] "Development Library Subset collection" collectionmeta .section:text [l=en] "chapters" collectionmeta .section:Title [l=en] "section titles" collectionmeta .document:text [l=en] "entire documents" # -- French strings ---------------- collectionmeta collectionname [l=fr] "Sous-ensemble de la collection Bibliothèque de Développement" collectionmeta .section:text [l=fr] "chapitres" collectionmeta .section:Title [l=fr] "titres des sections" collectionmeta .document:text [l=fr] "documents entiers" # -- Spanish strings ---------------- collectionmeta collectionname [l=es] "Subconjunto de la Biblioteca para el Desarrollo" collectionmeta .section:text [l=es] "capítulos" collectionmeta .section:Title [l=es] "títulos de las secciones" collectionmeta .document:text [l=es] "documentos completos" # -- Russian strings ---------------- collectionmeta collectionname [l=ru] "Субколлекция Библиотеки развития" collectionmeta .section:text [l=ru] "Главы" collectionmeta .section:Title [l=ru] "Названия разделов" collectionmeta .document:text [l=ru] "Полные документы" # -- English text ---------------- collectionmeta collectionextra [l=en] "The Humanitarian Development Libraries represent a large collection of practical information aimed at helping reduce poverty, increasing human potential, and providing a practical and useful education for all. This subset contains about 25 publications--documents, reports, and periodical articles--in various areas of human development, from agricultural practice to economic policies, from water and sanitation to society and culture, from education to manufacturing, from disaster mitigation to micro-enterprises.

The editors of this collection are Human Info NGO, HumanityCD Ltd, and participating organizations. Contact us at Humanitarian and Development Libraries Project, Oosterveldiaan 196, B-2610 Antwerp, Belgium, Tel 32-3-448.05.54, Fax 32-3-449.75.74, email humanity@humaninfo.org.\n

How the collection works

\n

The DLS collection is fairly complex. If you\'re just starting out you might prefer to look at some other collections first (e.g. Word and PDF demonstration, or the Greenstone Archives, or the Simple Image collection).\n

The collection configuration file, like all collection configuration files, begins with a line (\"creator\") that gives the email address of the collection\'s creator, and another (\"public\") that determines whether the collection will appear on the home page of the Greenstone installation.\n

Collection-level metadata. The collectionmeta lines in the configuration file are also standard in all Greenstone collections. They give general information about the collection, defining its name, and a description that appears on its home page. The description (in collectionextra) can be seen on the DLS collection\'s home page (this text is part of it).\n

Plugins. The third block of lines in the configuration file gives the plugins used by the collection. The documents in the DLS collection are in HTML, so HTMLPlugin must be included. The description_tags option processes tags in the text that define sections and section titles as described below. \n

The other plugins, GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin, and DirectoryPlugin, are used by Greenstone for internal purposes and are standard in almost all collections.

Searchable indexes. The block of lines starting with indexes specifies what searchable indexes will be available. In this collection there are three: you can see them when you pull down the \"Search for\" menu on the search page. The first index is called \"chapters\", the second \"section titles\", and the third \"entire documents\". The names of these three indexes are given by three collectionmeta statements.\n

The contents of the indexes -- that is, the specification of what it is that will be searched -- are defined by the indexes line at the beginning of this block. This specifies three indexes, two at the section level (beginning with section:) and one at the document level (beginning with document:). The difference is that a multi-word query will only match a section-level index if all query terms appear in the same section, whereas it will match a document-level index if the terms appear anywhere within the document (which typically comprises several sections). The first and third indexes are section:text and document:text, and the :text means that the full text of sections and documents respectively will be searched. The second is section:Title, which means that Title metadata will be searched -- in this case, section titles (rather than document titles). The three indexes appear in the order in which they are specified on the indexes line.\n

Classifiers. The block of lines labeled classify define the browsing indexes, called \"classifiers\" in Greenstone. There are four of them, corresponding to four buttons on the navigation bar at the top of each page in the collection (e.g. the search page): subjects, titles, organisations, and keywords The search button comes first, then come the four classifiers, in order.\n ******* updated to here*******

The first classifier provides access by subject. It is a Hierarchy classifier whose hierarchy is defined in the file dls.Subject.txt (the hfile argument); this file is discussed below. This classifier is based on Subject metadata, and when several books appear at a leaf of the hierarchy they are sorted by Title metadata (as you can see here). The second provides access by title: it is an AZList classifier based on Title metadata. The third provides access by organization: it is a Hierarchy classifier based on Organization metadata whose hierarchy is defined in dls.Organization.txt; this file is discussed below. Again, the leaves of the hierarchy are sorted by Title metadata. The fourth provides access by Keyword metadata: it also is a Hierarchy classifer (see below).\n

Cover images. Greenstone looks for a cover image for each document, whose name is the same as the document\'s but with a .jpg extension. This image is associated with the document, and may be displayed on the document page (see below). Cover images can be switched off by setting the -no_cover_image flag for each plugin. \n

Format statements. The next block contains five format statements. The first applies to Vlists. These are lists of items displayed vertically down the page, like the the lists displayed by the titles browser, those at the leaves of the subject and organisation hierarchies, and the tables of contents of the target documents themselves. However, for the search results page it is overridden by the second format statement (SearchVList). The third governs how the document text is formatted, with Title metadata ([Title]) in HTML <h3> format followed by the text of the document [Text]. The fourth ensures that cover images are shown with each document. The fifth calls for the Expand Text, Expand Contents, Detach and Highlight buttons to be shown with each document.\n

Most format statements contain a string specified in an augmented form of HTML. Metadata names in square brackets (e.g. [Title], [Creator]) give the value of that metadata; [Text] gives the document text. A hyperlink to the document can be made using [link] ...[/link]; an appropriate icon is produced by [icon]. Format strings can include {If}{... , ...} and {Or}{... , ...}; the first two give examples. These two are fairly complex format statements; we will not explain them here. In Greenstone, changes in format strings take effect immediately unless you are using the local library server, in which case the server needs to be restarted. This makes it easy to experiment with different versions of a format statement and see what happens.\n

Language translations. The last part of the collection configuration file gives the collection-level metadata in French and Spanish respectively. The languages are indicated by square brackets: [fr] and [es]. If there is no language specification, English is assumed by default. The configuration file shows accented characters (e.g. French é). This file is in UTF-8, and these characters are represented by multi-byte sequences (<C3><A9> in this case). Alternatively they could be represented by their HTML entity names (like &eacute). It makes no difference: they look the same on the screen. However, if the text were searchable it would make a difference; Greenstone uses Unicode internally to ensure that searching works as expected for non-English languages.\n

Description tags. The description tags recognized by HTMLPlug are inserted into the HTML source text of the documents to define where sections begin and end, and to specify section titles. They look like this:

<!--\n
<Section>\n
<Description>\n
<Metadata name=\"Title\">\n
Realizing human rights for poor people: Strategies\n
for achieving the international development targets\n
</Metadata>\n
</Description>\n
-->\n
(text of section goes here)\n
<!--\n
</Section>\n
-->\n
The <!-- ... --> markers are used to ensure that these tags are marked as comments in HTML and therefore do not affect document formatting. In the Description part other kinds of metadata can be specified, but this is not done for the style of collection we are describing here. Exactly the same specification (including the <!-- ... --> markers) can be used in Word documents too.\n

Metadata Files. Metadata for all documents in the DLS collection is provided in metadata.xml files, one per document folder. The metadata.xml file for one book -- Go Between 64, June-July 1997 -- is a block of about ten lines encased in <FileSet> ... </FileSet> tags. It defines Title, Language, Subject and AZList metadata. More than one value can be specified for any metadata item. For example, a little further down the file (in the fourth FileSet block) is a book called Animation skills which has two values for Subject. Both of these are stored as metadata values for this particular document (because mode=accumulate is specified; the alternative, and the default, is mode=override).\n

Title metadata is specified in the metadata file. However, in this collection it is also given in the text of each document, using description tags. Since it appears in both places, Greenstone uses the version defined in the documents in preference to that in the metadata.xml file.\n

Hierarchy files. The subject hierarchy file dls.Subject.txt contains a succession of lines each of which has three items. The first and last items are text strings, and they are the same. The middle item is a number that defines the position in the hierarchy. The first string is matched against the metadata that occurs in the metadata.xml file described above; the last one is the string that describes that node of the hierarchy on the web pages that Greenstone generates.\n

For example, the first line contains the three items \"Industry, Manufacture and Services\", 1, and \"Industry, Manufacture and Services\". The middle one, the numeral 1, indicates that this subject appears at the first position of the subject hierarchy). The first item, the string \"Industry, Manufacture and Services\", is what appears in the metadata.xml file as Subject metadata. The third item, which happens to be the same string, is what appears as the text in the first position of the subject hierarchy.

The organization hierarchy file dls.Organization.txt has exactly the same structure. Again, the first and last text strings on each line are the same because the metadata values in metadata.xml are exactly what should be shown on the Greenstone web pages. The number between defines the position in the hierarchy: in this case the hierarchy is flat and the position is simply an integer that determines the order of the list.\n

The Keyword classifier is also a hierarchy classifier, in this case based on Keyword metadata. This is to allow for the possibility that two different documents have the same keyword.\n " # -- French text ---------------- collectionmeta collectionextra [l=fr] "Les Bibliothèques humanitaires pour le Développement constituent une collection importante dont les objectifs sont d\'aider à réduire la pauvreté, de promouvoir l\'accroissement du potentiel humain, et d\'offrir une éducation pratique et utile à tous. Cette collection contient environ 25 publications -- documents, rapports, et articles de périodiques -- qui traitent de différents sujets liés au développement humain. On y trouve des informations concernant les pratiques agricoles aussi bien que les politiques économiques; les mesures d\'hygiène pour l\'eau et la société et la culture; l\'éducation et la petite industrie; la prévention des désastres et les micro-entreprises.

Les éditeurs de cette collection sont Human Info NGO, HumanityCD Ltd, and organisations ayant contribué. Vous pouvez nous contacter à Humanitarian and Development Libraries Project, Oosterveldiaan 196, B-2610 Antwerp, Belgium, Tel 32-3-448.05.54, Fax 32-3-449.75.74, courriel humanity@humaninfo.org.

Comment, marche la collection

La collection DLS est assez complexe. Pour un débutant, il serait préférable de consulter d\'abord d\'autres collections (par exemple Démonstration Word et PDF ou les Greenstone Archives ou la collection Simple Image).

Le fichier de configuration de la collection, comme tous les fichiers de configuration de collection, commence avec une ligne (\"creator\") qui donne l\'adresse e-mail du créateur de la collection et une autre ligne (\"public\") qui détermine la manière d\'apparition de la collection sur la page d\'accueil de Greenstone.

Méta-données de niveau collection. Les lignes collectionmeta dans le fichier de configuration sont aussi standard dans toutes les collections Greenstone. Elles donnent une information générale sur la collection par la définition de son nom, et par une description qui apparaît sur la page d\'accueil. La description (dans collectionextra) peut être vue sur la page d\'accueil de la collection (_text2_).

Plugins. Le troisième bloc de lignes dans le fichier de configuration donne les plugins utilisés par cette collection. Les documents dans la collection DLS sont en HTML, ainsi HTMLPlug doit être inclus. L\'option description_tags traite des onglets dans le texte qui définissent les sections et les titres de section comme décrit ci-dessous.

Les autres plugins, GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin et DirectoryPlugin sont utilisés par Greenstone pour des objectifs internes et sont des références dans presque toutes les collections.

Index recherchables. Le bloc de lignes qui commence avec index précise les type d\'index de recherche disponibles. Dans cette collection on en compte trois. Vous pouvez les voir en déroulant le menu \"Rechercher des\" sur la page de recherche. Le premier index est appelé \"chapitre\" , le second \"titres de section\" et le troisième \"documents entiers\". Les noms de ces trois index sont donnés par les trois déclarations collectionmeta.

Les contenus des trois index, à savoir la spécification de ce qui sera recherché, sont définies par la ligne des index au début de ce bloc. Trois index sont spécifiés, deux au niveau section (commençant par section:) et un autre au niveau document (commençant par document:.) La différence est qu\'une requête à mots multiples ne conviendra qu\'à un index de niveau section si tous les termes recherchés se trouvent dans la même section, tandis qu\'elle conviendra à un index de niveau document si les termes apparaissent n\'importe où dans le document (qui typiquement, comprend plusieurs sections). Le premier et le troisième index sont section:text et document:text, et :text signifie que le texte complet des sections et celui des documents seront respectivement recherchés. Le second est section:Title, qui signifie que la méta-donnée Title sera recherchée -- dans ce cas, les titres de section (plutôt que les titres de document). Les trois index apparaissent dans l\'ordre dans lequel ils sont précisés sur la ligne indexes.

Classificateurs. Le bloc de lignes libellé classify définit les index de navigation appelés \"classifiers\" dans Greenstone. Ils sont quatre, correspondant aux quatre boutons sur la barre de navigation en haut de chaque page dans la collection (c\'est à dire la page de recherche): thèmes, titres, organisation et comment faire. Le bouton de recherche vient en premier, les quatre classificateurs.

Le premier classificateur fournit un accès par sujet. C\'est un classificateur Hierarchy dont la hiérarchie est définie dans le fichier dls.Subject.txt (l\'argument \"hfile\"); ce fichier est présenté ci-dessous. Ce classificateur est basé sur la méta-donnée Subject et quand plusieurs livres apparaissent sur une feuille de la hiérarchie, ils sont triés suivant la méta-donnée Title (comme visible ici). Le second fournit un accès par titre: c\'est un classificateur AZList basé sur les méta-données Title. Le troisième fournit un accès par organisation: c\'est un classificateur Hierarchy basé sur les méta-données Organization dont la hiérarchie est définie dans dls.Organization.txt; ce fichier est présenté ci-dessous. De même, les feuilles de la hiérarchie sont triées suivant les meta-données Title. Le quatrième fournit un accès par méta-donnée Keyword: c\'est aussi un classificateur Hierarchy (voir ci-dessous).

Images Couverture. Greenstone cherche une image couverture pour chaque document, dont le nom est le même que le document\'s mais avec une extension .jpg. Cette image est associée avec le document et pourrais être visualisé sur la page du document (voir ce-dessous). Les images couverture peuvent-être éteintes en réglant le drapeau -no_cover_image pour chauqe plug-in. \n

Déclarations de format. Le bloc suivant contient cinq déclarations de format. La première s\'applique à Vlists. Ce sont des listes d\'articles affichés verticalement vers le bas de la page, comme les listes visualisées par le navigateur titres, celles qui sont sur les feuilles de hiérarchie thèmes et organisation, et les tables des matières des documents cibles eux-mêmes. Cependant, la page des résultats de recherche est écrasée par la seconde déclaration de format (SearchVList). La troisième gouverne le formatage du texte du document avec des méta-données Title ([Title]) au format HTML <h3> suivi du texte du document [Text]. La quatrième assure que les images de couverture sont affichées avec chaque document. La cinquième exige que les boutons Expand text, Expand contents, Detach et Highlight soient affichés avec chaque document.

La plupart des déclarations de format contiennent une chaîne spécifiée en HTML mise en valeur. Les noms de méta-données entre crochets (c\'et à dire [Title], [Creator]), donne la valeur de ces méta-données; [Text] donne le document texte. Un hyperlien au document peut être obtenu en utilisant [link] ... [/link]; une icône appropriée est générée par [icon]. Des chaînes de format peuvent inclure {If} {...,...} et {Or} {...,...}; les deux premières en donnent des exemples. Ces deux sont des déclarations de format assez complexes qui ne seront pas expliquées ici. Dans Greenstone, les changements dans les chaînes de format prennent effet immédiatement à moins que vous n\'utilisiez le serveur de la bibliothèque locale, auquel cas, le serveur à besoin d\'être réinitialisé. Cela rend facile l\'expérimentation de versions différentes d\'une déclaration de format et de voir ce qui se passe.

Traduction de langues. La dernière partie du fichier de configuration de la collection donne les méta-données de niveau collection en Français et en Espagnol respectivement. Les langues sont indiquées par des crochets:[fr] et [es]. Si aucune langue n\'est spécifiée, l\'Anglais est supposé par défaut. Le fichier de configuration montre des caractères mis en valeur (par exemple le \"é\" français). Ce fichier est en UTF-8, et ces caractères sont représentés par des séquences multi-octets (<C3><A9>) dans ce cas). Autrement, elles pourraient être représentées par leurs noms d\'entité (comme &eacute). Cela ne présente aucune différence: ils sont identiques à l\'écran. Cependant si les textes faisaient l\'objet d\'une recherche, une différence aurait été notée; Greenstone utilise Unicode de façon interne pour s\'assurer que le processus de recherche fonctionne comme prévu pour les langues autre que l\'anglais.

Etiquettes de description. Les étiquettes de description identifiées par \"HTMLPlug\" sont insèrées dans le texte source HTML des documents pour délimiter le début et la fin des sections et pour spécifier les titres de section. Ils se présentent comme suit:

<!--\n
<Section>\n
<Description>\n
<Metadata name=\"Title\">\n
Realizing human rights for poor people: Strategies\n
for achieving the international development targets\n
</Metadata>\n
</Description>\n
-->\n
(text of section goes here)\n
<!--\n
</Section>\n
-->\n
Les marqueurs <!-- ... --> sont utilisés pour assurer que ces étiquettes sont indiquées comme commentaires dans HTML et par conséquent n\'ont aucun effet sur le formatage. Dans la partie Description, d\'autres types de méta-données peuvent être spécifiés mais ceci n\'est pas fait pour le style de collection décrit ici. La même spécification (y compris les marqueurs <!-- ... -->) peut être utilisée de façon tout à fait identique dans les documents Word.

Fichiers de méta-données. Les méta-données pour tous les documents de la collection DLS sont fournies dans le fichier metadata.xml. Le fichier metadata.xml pour le livre--Go Between 64, June-July 1997 --est un bloc de dix lignes comprises entre les étiquettes <FileSet> ... </FileSet>. Les méta-données pour tous les documents de la collection DLS sont fournies dans un fichier unique metadata.xml du le répertoire import. L\'entrée pour le premier élément --le livre Go Between 64, June-July 1997 --est un bloc de dix lignes comprises entre les étiquettes <FileSet> ... </FileSet>. Elle définit les méta-données Title, Language, Subject et AZlist. Plus d\'une valeur peut être spécifiée pour n\'importe quel élément de méta-donnée. Par exemple, un peu plus bas dans le fichier (dans le quatrième bloc) il y a un livre appelé Animation skills qui a deux valeurs pour Subject. Toutes les deux sont enregistrées comme comme valeurs de méta-donnée pour ce document particulier (parce que mode=accumulate est spécifié; autrement, le défaut est mode=override).

La méta-donnée Title est spécifiée dans le fichier métadata. Cependant dans cette collection, elle est fournie dans le texte de chaque document, par le biais des étiquettes de description. Dans la mesure où elle apparaît en deux endroits, Greenstone utilise de préférence la version définie dans les documents plutôt que celle présente dans le fichier metadata.xml.

Fichiers d\'hiérarchie. Le fichier d\'hiérarchie de sujet dls.Subject.txt contient une suite de lignes dont chacune a trois éléments. Le premier et le dernier élément sont des chaînes de textes, et ils sont identiques. L\'élément du milieu est un nombre qui définit la position dans la hiérarchie. La première chaîne est ajustée sur la méta-donnée qui intervient dans le fichier metadata.xml décrit ci-dessus; la dernière est la chaîne qui décrit le n\'ud de la hiérarchie sur les pages web que Greenstone génère.

Par exemple, la première ligne contient les trois éléments \"Industry, Manufacture, and Services\", 1, et \"Industry, Manufacture and Services\". Celui du milieu, le nombre 1, indique que ce sujet apparaît en première position de subject Hierarchy). Le premier élément, la chaîne \"Industry, Manufacture and Services\", apparaît dans le fichier metadata.xml comme méta-donnée Subject. Le troisième élément qui se trouve être la même chaîne, apparaît dans le texte en première position de la hiérarchie de sujet.

Le fichier d\'hiérarchie d\'organisation dls.Organization.txt a exactement la même structure. De nouveau, les premières et dernières chaînes de texte sont les mêmes sur chaque ligne parce que les valeurs de méta-donnée dans metadata.xml sont exactement ce qui doit être affiché sur les pages d\'accueil de Greenstone. Le nombre intermédiaire définit la position dans la hiérarchie: dans ce cas-ci, la hiérarchie est plate et la position est tout simplement un entier qui détermine l\'ordre de la liste.

Le classificateur Keyword est aussi un classificateur de hiérarchie, basé dans ce cas-ci sur la méta-donnée Keyword. Ceci pour offrir la possibilité à deux documents différents d\'avoir le même mot-clé. " # -- Spanish text ---------------- collectionmeta collectionextra [l=es] " Las Bibliotecas sobre Aspectos Humanitarios y de Desarrollo representan una extensa colección de información práctica cuyo propósito es ayudar a reducir la pobreza, acrecentar el potencial humano y proveer una educación práctica y útil para todos. Este subconjunto comprende unas 25 publicaciones - documentos, informes técnicos y artículos de publicaciones periódicas - en varias áreas del desarrollo humano, desde prácticas agrícolas a políticas económicas, desde agua y saneamiento a sociedad y cultura, desde educación a manufactura, desde mitigación de desastres a microemprendimientos.\n

\nLos editores de esta colección son la ONG Human Info, HumanityCD Ltd y demás organizaciones participantes. Contáctenos en: Proyecto de Bibliotecas sobre Aspectos Humanitarios y de Desarrollo , Oosterveldiaan 196, B-2610 Antwerp, Bélgica, Tel 32-3-448.05.54, Fax 32-3-449.75.74, correo electrónico humanity@humaninfo.org.

Cómo trabaja esta colección

La colección DLS es bastante compleja. Si apenas está empezando a familiarizarse con su uso quizá fuera mejor que se fijara primero en alguna otra colección (como la Demostración en Word y PDF, los Archivos Greenstone o la colección de imágenes sencillas).

Al igual que todos los archivos de configuración de colecciones, el archivo de configuración de esta colección, empieza con una línea (\"creador\") que proporciona la dirección de correo electrónico del creador de la colección y otra (\"pública\") que determina si la colección aparecerá en la página principal del programa Greenstone.

Metadatos a nivel de colección. Las líneas de collectionmeta en el archivo de configuración también son estándar en todas las colecciones Greenstone. Contienen información general acerca de la colección definiendo su nombre, y una descripción que aparece en su página inicial. La descripción (en collectionextra) se puede ver en la página inicial de la colección DLS (_text2_).

Plugins. El tercer bloque de líneas en el archivo de configuración proporciona los plugins que usa esta colección. Los documentos en la colección DLS están en HTML, por lo que se deberá incluir HTMLPlug. La opción description_tags procesa las etiquetas en el texto que definen secciones y títulos de secciones tal como se describe a continuación.

Los otros plugins, GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin, y DirectoryPlugin, son empleados por Greenstone con fines particulares y son estándar en casi todas las colecciones.

Índices de búsqueda. El bloque de líneas que empieza con índices especifica los índices de búsqueda que están disponibles. En esta colección hay tres, los cuales se pueden ver al momento de desplegar el menú \"Buscar\" en la página de búsqueda. El primer índice se llama \"capítulos\", el segundo \"títulos de sección\" y el tercero \"documentos enteros\". Los nombres de estos tres índices están dados por tres enunciados collectionmeta.

El contenido de los índices -- es decir, la especificación de lo que se va a buscar -- se define por medio de la línea que se encuentra al principio de este bloque. Esta especifica tres índices, dos a nivel de sección (los cuales empiezan con section:) y uno a nivel de documento (el cual empieza con document:). La diferencia está en que una consulta de varias palabras únicamente encontrará una correspondencia en un índice a nivel de sección si todos los términos de la consulta aparecen en la misma sección, mientras que encontrará la correspondencia en un índice a nivel de documento si los términos aparecen en cualquier parte del documento (el cual consiste normalmente de varias secciones). El primero y tercer índices son section:text y document:text, donde :text significa que se buscará en todo el texto de la sección o el documento, respectivamente. El segundo es section:Title, el cual indica que se buscarán metadatos de Título, en este caso títulos de secciones (más que títulos de documentos). Los tres índices aparecerán en el orden en que se especificaron en la línea de índices.

Clasificadores. El bloque de líneas con la etiqueta clasificar define los índices de exploración, llamados \"clasificadores\" en Greenstone. Hay cuatro de ellos correspondientes a los cuatro botones en la barra de navegación que se encuentra en la parte superior de cada página de la colección (p. ej. la página de búsqueda): asuntos, títulos de la \"a\" a la \"z\", organizaciones y palabras clave. El botón de búsqueda aparece primero y a continuación los cuatro clasificadores en orden.

El primer clasificador le da acceso al asunto. Es un clasificador de Jerarquía, el cual se define en el archivo dls.Subject.txt (el argumento hfile); este archivo se describe más adelante. El clasificador se basa en el metadato Sujeto y cuando varios libros aparecen en una hoja de la jerarquía se ordenan por medio del metadato Título (como se puede ver aquí). El segundo le da acceso al título. Es un clasificador AZList basado en el metadato Título. El tercero le da acceso a la organización. Es un clasificador de Jerarquía basado en el metadato Organización, cuya jerarquía se define en dls.Organization.txt; este archivo se describe más adelante. Nuevamente, las hojas de la jerarquía se ordenan por medio del metadato Título. El cuarto le da acceso por medio del metadato de palabra clave. También es un clasificador de Jerarquía (véase más adelante).

Imágenes de Portada. Greenstone buscar una imágen de portada para cada documento cuyo nombre sea el mismo al documento pero con una extensión .jpg. Esta imágen está asociada con el documento, y puede ser mostrada en la página del documento (ver aqui abajo). Las imágenes de portada pueden ser apagadas al ajustar el -no_imágen_de_portada para cada entrada. \n Enunciados de formato. El siguiente bloque contiene cinco enunciados de formato. El primero es aplicable a las Vlists. Éstas son listas de ítems que se despliegan verticalmente en la página, al igual que las listas desplegadas por el explorador de títulos de la \"a\" a la \"z\", las que se encuentran en el último nodo de las jerarquías de asunto y organización, y las tablas de contenidos de los documentos mismos. Sin embargo, para la página de resultados de la búsqueda el segundo enunciado de formato (SearchVList) tiene la preferencia. El tercero rige la forma en que el texto del documento se formatea, con el metadato Título ([Title]) en formato HTML <h3>, seguido por el texto del documento [Text]. El cuarto asegura que las imágenes de la portada aparezcan con cada documento. El quinto hace que los botones Extender Texto, Extender Contenido, Separar y Resaltar aparezcan con cada documento.

La mayoría de los enunciados de formato contienen una cadena escrita en una forma aumentada de HTML. Los nombres de los metadatos entre corchetes (p. ej. [Title], [Creator]) dan el valor de dicho metadato. [Text] da el texto del documento. También se puede establecer un hipervínculo con el documento por medio de [link] ...[/link]. Un icono apropiado es producido por [icon]. Las cadenas de formato pueden incluir {If}{... , ...} y {Or}{... , ...}. Los primeros dos contienen ejemplos. Estos dos son enunciados de formato demasiado complejos, por lo que no los explicaremos aquí. En Greenstone los cambios en las cadenas de formato tienen efecto inmediatamente a menos que se esté usando el servidor local, en cuyo caso el servidor necesitará reiniciarse. Esto hace que sea fácil experimentar con diferentes versiones de un enunciado de formato y ver qué pasa.

Traducción de idioma. La última parte del archivo de configuración de la colección proporciona los metadatos a nivel de colección en francés y español, respectivamente. Estos idiomas se indican por medio de corchetes: [fr] y [es]. Si no hay ninguna especificación del idioma, entonces el inglés se asume por omisión. El archivo de configuración muestra los caracteres que se acentúan (p. ej. la é francesa). Este archivo está en UTF-8 y los caracteres se representan por medio de secuencias de varios bytes (<C3><A9> en este caso). De forma alternativa se pueden representar por medio de nombres de entes HTML (como &eacute). No hay ninguna diferencia y se ven igual en la pantalla. Sin embargo, esto sí representaría una diferencia en el caso de que el texto se buscara. Greenstone utiliza Unicode internamente para asegurarse que las búsquedas trabajen tal como se espera con idiomas diferentes al inglés.

Etiquetas de descripción. Las etiquetas de descripción reconocidas por HTMLPlug se insertan en el texto fuente HTML de los documentos para definir el lugar en el que las secciones empiezan y terminan y para especificar los títulos de sección. Se ven de la siguiente manera:

<!--\n
<Section>\n
<Description>\n
<Metadata name=\"Title\">\n
Haciendo realidad los derechos humanos para la gente pobre: Estrategias\n
para lograr los objetivos de desarrollo mundial\n
</Metadata>\n
</Description>\n
-->\n
(el texto de la sección va aquí)\n
<!--\n
</Section>\n
-->\n

Los marcadores <!-- ... --> se utilizan para asegurarse que estas etiquetas estén marcadas como comentarios en HTML y por lo tanto que no afecten el formato del documento. En la parte de Descripción se pueden especificar otros tipos de metadatos, pero esto no se hace para el estilo de colección que estamos describiendo aquí. Exactamente la misma especificación (incluyendo los marcadores <!-- ... -->) se puede usar también en los documentos Word.

Archivos de metadatos. Los metadatos para todos los documentos de la colección DLS se proporcionan en documentos metadata.xml, un documento por folder. El documento metadata.xml para el libro--Go Between 64, June-July 1997 -- es un bloque de alrededor diez lineas encerradas en las etiquetas <FileSet> ... </FileSet>. Los metadatos para todos los documentos de la colección DLS se proporcionan en un solo archivo metadata.xml que se encuentra en el directorio importar. La entrada para el primer ítem -- el libro Go Between 64, June-July 1997 -- es un bloque de aproximadamente diez líneas enmarcado por las etiquetas <FileSet> ... </FileSet>, el cual define los metadatos Título, Idioma, Asunto y AZList. Se puede especificar más de un valor para cualquier ítem del metadato. Por ejemplo, un poco más adelante en el archivo (en el cuarto bloque FileSet) se encuentra un libro llamado Animation skills que tiene dos valores para el Asunto. Ambos se almacenan como valores del metadato para este documento en particular (ya que se especifica mode=accumulate; la alternativa y el valor por omisión es mode=override).

El metadato de Título se especifica en el archivo de metadatos. Sin embargo, en esta colección también se da en el texto de cada documento por medio de etiquetas de descripción. Puesto que aparece en ambos lugares, Greenstone utiliza de preferencia la versión definida en los documentos en vez de la que se encuentra en el archivo metadata.xml.

Archivos de jerarquía. El archivo de jerarquía del asunto dls.Subject.txt contiene una serie de líneas cada una de las cuales tiene tres ítems. El primero y último son cadenas de texto y son iguales. El ítem intermedio es un número que define la posición en la jerarquía. La primer cadena corresponde al metadato que ocurre en el archivo metadata.xml que se describe arriba, mientras que la última describe el nodo de la jerarquía en las páginas Web que Greenstone genera.

Por ejemplo, la primera línea contiene los tres ítems \"Industria, Manufactura y Servicios\", 1 y finalmente \"Industria, Manufactura y Servicios\". El ítem intermedio con el numeral 1 indica que este asunto aparece en la primera posición de la jerarquía de asunto. El primer ítem con la cadena \"Industria, Manufactura y Servicios\" es lo que aparece en el archivo metadata.xml como Asunto. El tercer ítem es el mismo y es lo que aparece como texto en la primera posición de la jerarquía del asunto.

El archivo de jerarquía de la organización dls.Organization.txt tiene exactamente la misma estructura. Nuevamente la primera y última cadena de texto en cada línea son las mismas, ya que los valores de los metadatos que se encuentran en metadata.xml son exactamente lo que se va a mostrar en las páginas Web de Greenstone. El número entre ambas define la posición en la jerarquía: en este caso la jerarquía es plana y la posición es simplemente un número entero que determina el orden de la lista.

El clasificador de Palabras Clave también es un clasificador de jerarquía, en este caso basado en el metadato Palabra Clave. Esto permite la posibilidad de que dos documentos diferentes tengan la misma palabra clave. " # -- Russian text ---------------- collectionmeta collectionextra [l=ru] " Библиотеки гуманитарного развития представляют большую коллекцию практической информации, полезной при оказании помощи для уменьшения бедности, увеличения гуманитарного потенциала, а также обеспечения практичного и полезного образования для всех. Это подмножество содержит приблизительно 25 публикаций -- документов, сообщений и периодических статей -- в различных областях человеческого развития, от сельскохозяйственной практики до экономической политики, от воды и очистки до общества и культуры, от образования до производства, от уменьшения бедствий до малых предприятий.

Издатели этой коллекции -- Гуманитарная информационная неправительственная организация Human Info NGO, Humanity CD Ltd, и другие сотрудничающие организации. Контакты с ними возможны через Проект гуманитарных и развивающихся библиотек: Oosterveldiaan 196, B-2610 Antwerp, Belgium, Tel 32-3-448.05.54, Fax 32-3-449.75.74, email humanity@humaninfo.org.

Как работает коллекция

_text1_ если Вы являетесь только начинающим пользователем, то лучше вначале ознакомиться с некоторыми другими коллекциями (например, с msword и pdf демонстрациями или же с архивами или с простой графической коллекцией).

Конфигурационный файл коллекции, подобно всем конфигурационным файлам других коллекций, начинается со строки «Создатель» (\"Сreator\"), которая сообщает адрес электронной почты Создателя коллекции, и другой -- «Публика» (\"Public\"), которая определяет, появится ли коллекция на домашней странице установки Greenstone.

Метаданные уровня коллекции. Строки collectionmeta в конфигурационном файле также стандартны во всех коллекциях Greenstone. Они дают общую информацию о коллекции, определяя ее название (имя), представляют краткое описание, которое появляется на ее домашней странице. Краткое описание (в collectionextra) можно видеть на домашней странице коллекции (_text2_)

Плагины. Третий блок строк в конфигурационном файле представляет плагины, используемые коллекцией. Документы в коллекции DLS представлены в HTML-формате, так что HTMLPlug должен быть включен. Опция description_tags обрабатывает тэги (признаки) в тексте, которые определяют разделы и наименования разделов, как описано ниже.

Другие плагины GreenstoneXMLPlugin, MetadataXMLPlugin,ArchivesInfPlugin и DirectoryPlugin используются в Greenstone для внутренних целей и являются стандартными почти во всех коллекциях.

Индексы поиска. Блок строк, начинающийся с indexes, определяет, какие поисковые индексы будут доступны. В этой коллекции есть три индекса. Вы можете их видеть в ниспадающем меню «Поиск» на странице поиска. Первый индекс называется «Главы», второй -- «Названия разделов» и третий -- «Полные документы». Названия этих трех индексов даются тремя операторами collectionmeta.

Содержание индексов -- то есть описание того, что будет являться предметом поиска -- определяется строкой indexes в начале этого блока. Она определяет три индекса, два из них -- на уровне раздела (начинающиеся с section:) и один на уровне документа (начинающийся с document:). Различие состоит в том, что запрос, состоящий из нескольких слов, будет соответствовать только индексу уровня раздела, если все термины запроса появляются в том же самом разделе, тогда как он будет соответствовать уровню документа, если термины появляются где-либо в пределах документа, который обычно включает несколько разделов. Первый и третий индексы -- это section:text и document:text, где :text означает, что полный текст разделов и документов соответственно будет предметом поиска. Второй индекс -- section:Title означает, что метаданные Названия (Title) будут подвергнуты поиску. В этом случае названия разделов скорее, чем названия документов. Эти три индекса появляются в порядке, в котором они определены в строке indexes.

Классификаторы. Блок строк, помеченных classify, определяющие индексы просмотра, в Greenstone называются Классификаторами. Имеется четыре классификатора, соответствующие четырем кнопкам на навигационной линейке наверху каждой страницы в коллекции (например, поисковая страница): Предметы, Названия, Организации и Ключевые слова. Первой является кнопка поиска, а затем по порядку эти четыре классификатора.

Первый классификатор обеспечивает доступ к предметам. Это иерархический классификатор, который определяет иерархию в файле dls.Subject.txt (параметр hfile); этот файл обсуждается ниже. Этот классификатор базируется на метаданных Предмета. Когда несколько книг появляются в листе иерархии, они сортируются с помощью метаданных Названия (как Вы можете видеть здесь). Второй классификатор обеспечивает доступ к названиям: это классификатор AZList, базирующийся на метаданных Названия. Третий обеспечивает доступ к перечню организаций: это иерархический классификатор, использующий метаданные Организации, иерархия которых задана в dls.Organization.txt; этот файл обсуждается ниже. Еще раз листья иерархии сортируются по метаданным Названия. Четвертый обеспечивает доступ к метаданным Ключевых слов. Это также иерархический классификатор (см. ниже).

Изображения обложки. Гринстоун ищет изображения обложки для каждого документа, чье имя совпадает с названием документа, но имеет расширение .jpg. Это изображение ассоциируется с документом и может быть использоваться на страничке документа (смотри ниже). Изображения обложек можно выключить, используя флаг -no_cover_image в каждом плагине. \n

Операторы формата. Следующий блок содержит пять операторов формата. Первый из них обращается к Vlist. Здесь имеются списки пунктов, расположенных вертикально к низу таблицы, подобно тому, как размещаются списки для просмотра Названий, так же, как и иерархические списки Предметов и Организаций и Оглавлений самих целевых документов. Однако для страницы результатов поиска это отвергнуто вторым оператором формата (SearchVList). Третий управляет форматированием текста документа с метаданными Названия (Title) в HTML <h3> формате, сопровождаемом текстом документа [Text]. Четвертый гарантирует, что изображения обложек показываются с каждым документом. Пятый вызывает кнопки Расширенный текст (Expand text), Расширенное содержание (Expand Context), Отделить (Detach) и Подсвечивать (Highlight), которые показываются с каждым документом.

Большинство операторов формата содержат строку, указанную в пополненной форме HTML. Имя метаданных в квадратных скобках (например, [Название], [Создатель]) дают значения этим метаданным. [Текст] дает текст документа. Гиперссылка к документу может быть создана, используя [link]...[/link]; соответствующее изображение обложки производится с помощью [icon]. Строки формата могут включать {If} {...,...}и {Or} {...,...}; для первых двух даются примеры. Эти два -- довольно сложные операторы формата. Мы не будем объяснять их здесь. В Greenstone изменения в строках формата вступают в силу немедленно, если Вы не используете местный сервер библиотеки, когда сервер должен быть повторно запущен. Это облегчит эксперименты с различными версиями оператора формата и наблюдение за тем, что при этом происходит.

Переводы с одного языка на другой. Последняя часть конфигурационного файла коллекции представляет метаданные на уровне коллекции на французском и испанском языках соответственно. Языки обозначены в квадратных скобках: [fr] и [es]. Если отсутствует указание спецификации языка, английский язык принят по умолчанию. Конфигурационный файл показывает характерные особенности знаков (например, во французском языке). Этот файл находится в UTF-8, где эти знаки представлены мультибайтным порядком следования (<C3><A9> в этом случае). Альтернативно они могут быть представлены их HTML названиями объекта (подобно &eacute). В этом нет никакого различия: они выглядят на экране одинаково. Однако, если бы текст был доступен для поиска, то различие имело бы место. Greenstone использует внутренний Unicode, чтобы гарантировать возможность поиска и для неанглийских языков.

Описание дескрипторов. Описание дескрипторов, распознаваемых HTMLPlug, вставлены в HTML текста документов, чтобы определить, где начинаются и заканчиваются разделы, и определить названия разделов. Они выглядят таким образом:

<!--\n
<Section>\n
<Description>\n
<Metadata name=\"Title\">\n
Realizing human rights for poor people: Strategies\n
for achieving the international development targets\n
</Metadata>\n
</Description>\n
-->\n
(текст раздела идет сюда)\n
<!--\n
</Section>\n
-->\n

Маркеры <!-...-> используются, чтобы гарантировать, что эти дескрипторы отмечены как комментарии в HTML и поэтому затрагивают форматирование документа. В Описании могут быть определены другие виды метаданных, но это не сделано для стиля коллекции, которую мы описываем здесь. Точно такая же спецификация (включая и <!-...-> маркеры) могут использоваться также в документах Word.

Файлы метаданных. Метаданные для всех документов в DLS-коллекции расположены в файлах metadata.xml, по файлу в папке документа. Файл metadata.xml для книги -- Go Between 64, June-July 1997 -- представляет собой блок из 10 строк заключенных в тэгах <FileSet> ... <FileSet>. Метаданные для всех документов в DLS-коллекции расположены в файле metadata.xml в директории импорта. Вход к первому пункту - книге Go Between 64, June-July 1997 -- является блоком из приблизительно десяти строк, заключенных в тэгах . Они определяют Название, Язык, Предмет и метаданные AZList. Больше чем одно значение может быть определено для любых пунктов метаданных. Например, чуть далее вниз файла (в четвертом блоке FileSet находится книга с названием Навыки мультипликации, которая имеет два значения для Предмета. Оба сохранены в качестве метаданных для этого специфического документа, потому что состояние=накапливать (mode=accumulate) определено, а в качестве альтернативы - значение по умолчанию, которым является mode=override.

Метаданные Названия определены в файле метаданных. Однако, в данной коллекции оно также дается в тексте каждого документа, используя тэги описания. Так оно появляется в двух местах, поскольку Greenstone использует версию, определенную в документах, предпочтительную по отношению к файлу metadata.xml.

Иерархические файлы. Предмет иерархического файла dls.Subject.txt содержит последовательность строк, каждая из которых имеет три пункта. Первый и последний пункты являются текстовыми строками и они одинаковы. Средний пункт является числом, которое определяет позицию в иерархии. Первая строка соответствует метаданным, которые находятся в файле ,metadata.xml, описанном выше; последняя строка описывает тот узел иерархии на web-страницах сети, которые генерирует Greenstone.

Например, первая строка содержит три пункта «Промышленность, Изготовление и Услуги», 1, и «Промышленность, Изготовление и Услуги». Средний пункт, цифра 1, указывает, что этот предмет появляется на первой позиции в системе иерархии. Первый пункт, строка «Промышленность, Изготовление и Услуги» является тем, что появляется в файле metadata.xml как метаданные Предмета. Третий пункт, который представлен аналогичной строкой, - это то, что появляется в виде текста в первой позиции предмета иерархии.

Файл организации иерархии dls.Organization.txt имеет точно такую же структуру. Так же, первые и последние строки текста на каждой линии те же самые, потому что значения метаданных в metadata.xml -- точно те же, что должны быть показаны на web-страницах Greenstone. Число между этими строками определяет позицию в иерархии: в этом случае иерархия является плоской, и позиция -- просто целое число, которое определяет порядок в списке.

Классификатор Ключевое слово также является классификатором иерархии, в этом случае основанном на метаданных Ключевого слова. Это должно позволить учесть возможность того, что два различных документа содержат одинаковое ключевое слово. "