creator greenstone@cs.waikato.ac.nz maintainer greenstone@cs.waikato.ac.nz public true buildtype mgpp groupsize 200 format SearchTypes "form,plain" indexes text metadata plugin ZIPPlug plugin GAPlug plugin MetadataXMLPlug plugin BibTexPlug plugin ArcPlug plugin RecPlug classify AZList -metadata Title classify AZCompactList -metadata Author -buttonname Creator classify DateList -metadata Date classify Phind -text document:Title,document:Creator,document:Booktitle,document:Publisher format VList "[link][icon][/link] [Title] - {Or}{[Creator],[Editor]} {If}{[Year], - [Month] [Year]}" format HList "[link][highlight][ex.Title][/highlight][/link]" format DocumentHeading "

[Title]


{If}{[Creator],} {If}{[Title],} {If}{[Editor],} {If}{[EditorRole],} {If}{[Booktitle],} {If}{[Journal],} {If}{\\"[Volume][Number]\\",} {If}{[MeetingDate],} {If}{[MeetingPlace],} {If}{[PublicationPlace],} {If}{[Publisher],} {If}{[Year],} {If}{[Pages],} {If}{[DocType],} {If}{[Location],} {If}{[Notes],} {If}{[Abstract],} {If}{[Keywords],}
_AuthoredBy_:[Creator]
_PaperTitle_:[Title]
_Editors_:[Editor]
_EditorRole_:[EditorRole]
_BookJournalTitle_:[Booktitle]
_In_:[Journal]
} {If}{[Number], _Number_: [Number]} {If}{[Volume], _Vol_: [Volume]} {If}{\\"[Volume][Number]\\",
_MeetingDate_:[MeetingDate]
_MeetingPlace_:[MeetingPlace]
_PublicationPlace_:[PublicationPlace]
_Publisher_:[Publisher]
_PublicationDate_:[Month] [Year]
_Pages_:[Pages]
_DocType_:[DocType]
_LocationURL_:[Location]
_Annotations_:[Notes]
_Abstract_:[Abstract]
_Keywords_:[Keywords]

" format DocumentText "{If}{_cgiargshowrecord_, _BibTeXrecord_:
[Text]
_HideBibTeXrecord_
,
_ShowBibTeXrecord_
}" format DocumentButtons "" format CL2VList "[link][icon][/link] {If}{[numleafdocs],[Title], [Author] ([Creator]) -- [Title]} {If}{[Year], - [Month] [Year]}" format CL3DateList "[link][icon][/link] [Title] - {Or}{[Creator],[Editor]}" format DateList "[link][icon][/link] [highlight]{Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}[/highlight] {Or}{[dc.Date],[exp.Date],[ex.Date]}" collectionmeta collectionname [l=en] "Bibliography collection" collectionmeta .document:text [l=en] "text" collectionmeta .document:Title [l=en] "titles" collectionmeta .document:Source [l=en] "filenames" collectionmeta .text [l=en] "full records" collectionmeta .Title [l=en] "titles" collectionmeta .Source [l=en] "filenames" collectionmeta AuthoredBy [l=en] "Authored By" collectionmeta PaperTitle [l=en] "Paper Title" collectionmeta Editors [l=en] "Editor(s)" collectionmeta EditorRole [l=en] "Editor Role" collectionmeta BookJournalTitle [l=en] "Book/Journal Title" collectionmeta In [l=en] "In" collectionmeta Number [l=en] "Number" collectionmeta Vol [l=en] "Vol." collectionmeta MeetingDate [l=en] "Meeting Date" collectionmeta MeetingPlace [l=en] "Meeting Place" collectionmeta PublicationPlace [l=en] "Publication Place" collectionmeta Publisher [l=en] "Publisher" collectionmeta PublicationDate [l=en] "Publication Date" collectionmeta Pages [l=en] "Pages" collectionmeta DocType [l=en] "DocType" collectionmeta LocationURL [l=en] "Location/URL" collectionmeta Annotations [l=en] "Annotations" collectionmeta Abstract [l=en] "Abstract" collectionmeta Keywords [l=en] "Keywords" collectionmeta BibTeXrecord [l=en] "BibTeX Record" collectionmeta ShowBibTeXrecord [l=en] "Show BibTeX Record" collectionmeta HideBibTeXrecord [l=en] "Hide BibTeX Record" # -- French strings ---------------- collectionmeta collectionname [l=fr] "Collection bibliographie" collectionmeta .text [l=fr] "enregistrements complets" collectionmeta AuthoredBy [l=fr] "Nom de l'auteur" collectionmeta PaperTitle [l=fr] "Titre de l'article" collectionmeta Editors [l=fr] "Editeur(s)" collectionmeta EditorRole [l=fr] "Rôle de l'éditeur" collectionmeta BookJournalTitle [l=fr] "Titre de Livre/Journal" collectionmeta In [l=fr] "Dans" collectionmeta Number [l=fr] "Numéro" collectionmeta Vol [l=fr] "Vol." collectionmeta MeetingDate [l=fr] "Date de rencontre" collectionmeta MeetingPlace [l=fr] "Lieu de rencontre" collectionmeta PublicationPlace [l=fr] "Lieu de publication" collectionmeta Publisher [l=fr] "Editeur" collectionmeta PublicationDate [l=fr] "Date de publication" collectionmeta Pages [l=fr] "Pages" collectionmeta DocType [l=fr] "TypeDocument" collectionmeta LocationURL [l=fr] "Emplacement/URL" collectionmeta Annotations [l=fr] "Annotations" collectionmeta Abstract [l=fr] "Résumé" collectionmeta Keywords [l=fr] "Mots-clés" collectionmeta BibTeXrecord [l=fr] "Enregistrement BibTeX" collectionmeta ShowBibTeXrecord [l=fr] "Montrer Enregistrement BibTeX" collectionmeta HideBibTeXrecord [l=fr] "Cacher l'enregistrement BibTeX" # -- Spanish strings ---------------- collectionmeta collectionname [l=es] "Colección bibliográfica" collectionmeta .text [l=es] "registros completos" collectionmeta AuthoredBy [l=es] "Autor" collectionmeta PaperTitle [l=es] "Título del documento" collectionmeta Editors [l=es] "Editor(es)" collectionmeta EditorRole [l=es] "Papel del editor" collectionmeta BookJournalTitle [l=es] "Título del libro o revista" collectionmeta In [l=es] "En" collectionmeta Number [l=es] "Número" collectionmeta Vol [l=es] "Volumen" collectionmeta MeetingDate [l=es] "Fecha de la reunión" collectionmeta MeetingPlace [l=es] "Lugar de la reunión" collectionmeta PublicationPlace [l=es] "Lugar de la publicación" collectionmeta Publisher [l=es] "Editorial" collectionmeta PublicationDate [l=es] "Fecha de publicación" collectionmeta Pages [l=es] "Páginas" collectionmeta DocType [l=es] "Tipo de documento" collectionmeta LocationURL [l=es] "Ubicación/URL" collectionmeta Annotations [l=es] "Anotaciones" collectionmeta Abstract [l=es] "Resumen" collectionmeta Keywords [l=es] "Palabras clave" collectionmeta BibTeXrecord [l=es] "Registro BibTeX" collectionmeta ShowBibTeXrecord [l=es] "Mostrar registro BibTeX" collectionmeta HideBibTeXrecord [l=es] "Ocultar registro BibTeX" # -- Russian strings ---------------- collectionmeta collectionname [l=ru] "Библиографическая коллекция" collectionmeta .text [l=ru] "Полные записи" collectionmeta AuthoredBy [l=ru] "Автор" collectionmeta PaperTitle [l=ru] "Название статьи" collectionmeta Editors [l=ru] "Редактор (ы)" collectionmeta EditorRole [l=ru] "Роль редактора" collectionmeta BookJournalTitle [l=ru] "Название книги/журнала" collectionmeta In [l=ru] "В" collectionmeta Number [l=ru] "Число (Номер)" collectionmeta Vol [l=ru] "Том" collectionmeta MeetingDate [l=ru] "Дата встречи" collectionmeta MeetingPlace [l=ru] "Место встречи" collectionmeta PublicationPlace [l=ru] "Дата Публикации" collectionmeta Publisher [l=ru] "Издатель" collectionmeta PublicationDate [l=ru] "Дата Публикации" collectionmeta Pages [l=ru] "Страницы" collectionmeta DocType [l=ru] "Тип документа" collectionmeta LocationURL [l=ru] "Местоположение/URL" collectionmeta Annotations [l=ru] "Аннотации" collectionmeta Abstract [l=ru] "Резюме" collectionmeta Keywords [l=ru] "Ключевые слова" collectionmeta BibTeXrecord [l=ru] "Запись BibTeX" collectionmeta ShowBibTeXrecord [l=ru] "Показать запись BibTeX" collectionmeta HideBibTeXrecord [l=ru] "Скрытая запись BibTeX" # -- English text ---------------- collectionmeta collectionextra [l=en] "This collection, which contains _about:numdocs_ BibTeX entries, is a collection of working papers published from 1997 to 2006 at Department of Computer Science, the University of Waikato.\n \n

How the collection works

\n

The collection incorporates a form-based search interface that allows fielded searching. In Greenstone, this means that an enhanced search engine (called mgpp) must be used, rather than Greenstone\'s default search engine (called mg). There is an online help document for mgpp. The collection has an \"advanced\" form search interface, and also a plain single-field search page. These two variants can be selected from the collection\'s Preferences page.\n

The collection configuration file begins with the specification groupsize 200. This groups documents together into groups of 200. Bibliography collections typically have many small documents, and grouping them together prevents Greenstone\'s internal file structures from becoming bloated and occupying more disk space than necessary.\n

Apart for the standard ones, the plugins specified for this collection are ZIPPlug, which unzips compressed documents and archives, and BibTexPlug, which processes references in the BibTeX format (well known to computer scientists).\n

Fielded searching, with a form-based interface, is selected by format SearchTypes \"form,plain\" in the configuration file. In fact, a plain textual full-text search index is included in this collection as well (since form comes first, it is the default interface; you reach the plain search through the Preferences page).\n

The buildtype shows that the search engine mgpp is used, and for this indexes are specified in a slightly different way. Whereas Greenstone normally allows the various indexes to be specified to be at different \"levels\" (document, section, paragraph), with mgpp they are all at the same level -- document by default (as in this case). The level can be changed using a levels statement. Also, whereas in other collections indexes can be specified on text or on any metadata, here there are additional possibilities: you can specify indexes on every metadata field by using the single word metadata, and an index for all the metadata fields together by using the word allfields.\n

In this case the indexes line specifies searchable indexes on the full text and on every metadata field. Thus when the \"field\" menus in the search page are pulled down, they show full records followed by an entry for each metadata element. Collection-level metadata collectionmeta can be specified for any index to determine what it is called in the menu (except for metadata, which produces many menu items). In this case, the configuration file specifies that the text index should be named \"full records\" because it contains the original bibliographic record.\n

This collection contains Title, Author, and Date browsers, and a special kind of phrase index called \"Phind.\" The AZCompactList classifier used for the Author browser is like AZList but generates a bookshelf for duplicate items as shown here. The BibTeX plugin records each author as Author metadata; it also puts a list containing all authors into the Creator metadata element. Consequently the AZCompactList classifier is based on Author. However, Greenstone has a standard button reading authors a-z whose name is (confusingly) \"Creator\", so this button name is specified for the classifier.\n

The \"Phind\" classifier creates a phrase index like this. It contains a browsable list of phrases extracted from the material specified in the text argument of the classify Phind line in the configuration file. Here the specification is\n

  document:Title,document:Creator,document:Booktitle,\n
      document:Publisher
\n -- that is, the title, list of authors, title of the collected work (if any) in which this item appears, and publisher. Note that this specification follows the mg convention with level:field. Phind indexes are more usually based on the entire full text of a collection, using the specification document:text.\n

The best way to see what Phind does is to play with this index. You type a word in the search box, click Search, and a list of phrases containing that term appears in the top panel. Click on one of these phrases and a list of phrases containing that phrase appears in the bottom panel. You can continue doing this, expanding the phrase more and more. The lists can be lengthened using the get more phrases button. At the end of the list of phrases appears a list of documents containing that phrase, in blue text; you can lengthen this list by clicking get more documents.\n

The format statements for the search results list and the title browser are both determined by the VList specification. It gives a document icon that links to the document itself (which in this collection is the full reference); the title in bold; Creator metadata if there is any, otherwise Editor metadata; and Date metadata if there is any. Here is an example.\n

The format statement for the author browser (CL2VList) is more complex. The AZCompactList classifier generates a tree whose nodes are either leaf nodes, representing documents, or internal nodes. A metadata item called numleafdocs gives the total number of documents below an internal node. This format statement checks whether numleafdocs exists. If so the node must be an internal node, in which case the node is labeled by its Title. But beware: this classifier is generated on Author metadata, so its title -- the title of the classifier -- is actually the author\'s name! This means that the bookshelf nodes here are labeled by author\'s name. The leaf nodes, however, are labeled the same way as documents (i.e. references) are in the search results list.\n

The documents themselves (here is an example) are generated by two format statements, one (a long one) called DocumentHeading, and another called DocumentText. The DocumentHeading, which is the top two-thirds of the page, contains the document\'s Title followed by a table that gives all the metadata elements that the BibTeX plugin can generate. The role of all the If statements in the configuration file is to determine which elements are defined.\n

The DocumentText shows the BibTeX version of the reference. However, when the document is displayed initially, only a hyperlink reading Show BibTex Record appears -- this corresponds to the last part (that is, the \"else\" part) of the If statement in DocumentText. When this hyperlink is clicked, the href goes to the same URL but with showrecord=1, which generates a page like this. The If test succeeds, which shows the Text of the document. With the BibTeX plugin, the text of a document is its unadulterated BibTeX record.\n " # -- French text ---------------- collectionmeta collectionextra [l=fr] " Cette collection qui contient des entrées _about:numdocs_ BibTex, est working papers éditées de 1997 à 2006 au Département d'informatique, Université de Waikato.\n

Comment marche la collection?

Cette collection englobe une interface de recherche par formulaire qui permet une recherche par champ. Dans Greenstone, cela signifie qu'un moteur de recherche avancé (appelé mgpp) doit être utilisée plutôt que le moteur de recherche par défaut de Greenstone (mg). Il y a un document d'aide en ligne pour mgpp. Le document possède une interface de recherche avancée ainsi qu'une page de recherche simple par champ. Ces deux variantes peuvent être sélectionnées à partir de la page Préférences de la collection.

Le fichier de configuration de la collection commence par la spécification groupsize 200. Ceci regroupe les documents en groupe de 200. Les collections de bibliographies ont généralement beaucoup de petits documents; le fait de les regrouper empêche le gonflement des structures de fichiers internes et l'occupation inutile d'espace disque.

A part les Plugins standards, les modules qui sont spécifiés pour cette collection sont Zipplug qui ouvre les archives et les documents compressés, et Bibtext plug qui traite les références dans le format BibText (bien connu des informaticiens).

La recherche par champ à travers une interface basée sur un formulaire est sélectionnée par format SearchTypes \"form,plain\" dans le fichier de configuration. En fait, cette collection utilise format SearchTypes \"form,plain\" qui contient aussi un index de recherche de texte simple textuelle (puisque form vient en premier, c'est l'interface par defaut; vous accédez à la recherche plain a travers la page Préférences).

L'inclusion de buildtype signifie que le moteur de recherche mgpp est utilisé, et pour ceci les indexes sont spécifiés d'une manière légèrement différente. Tandis que Greenstone permet aux divers indexes qui vont être spécifiés d'être a des \"niveaux\" différents, (document, section, paragraph), avec mgpp ils sont tous au même niveau--- document par défaut (comme dans ce cas ci). Le niveau peut être changé en utilisant une déclaration Levels. De plus, alors que dans les autres collections des indexes peuvent être spécifiés sur du texte ou sur n'importe quelle méta-donnée, ici il y a des possibilités additionelles: vous pouvez spécifier les indexes sur chaque champ de méta-donnée en utilisant le mot metadata, et un index pour tous les champs de méta-données réunis en utilisant le mot allfields.

Dans ce cas la ligne des indexes spécifie les indexes qui peuvent être recherches par texte ou par champ de méta-donnée. Ainsi, quand les menus déroulants \"Field\" dans la page recherche sont sélectionnés, ils montrent Full records suivi par une entrée pour chaque élément de méta-donnée. Une méta-donnée collectionmeta de niveau collection peut être spécifiée pour tout index pour déterminer ce qui est appele dans le menu (exceptè pour metadata qui produit beaucoup d'éléments de menu). Dans ce cas,le fichier de configuration spécifie que l'index du texte devrait être appele \"full records\" parcequ'il contient l'enregistrement bibliographique original.

Cette collection contient les \"browsers\" Title, Author,et Date ainsi qu'un type special d'index de phrase appele \"Phind\". Le classificateur AZCompactList utilisé pour le browser Author est comme AZList mais produit un rayon pour les éléments dupliqués comme montré ici. Le plugin BibTEX enregistre chaque auteur comme méta-donnée Author; il met aussi une liste contenant tous les auteurs dans l'élément de méta-donnée Creator. Par conséquent, le classificateur AZCompact List est basé sur Author. Cependant, Greenstone a un bouton standard appelé authors a-z dont le nom (qui prête à confusion) est \"Creator\", ainsi le nom de ce bouton est spécifié pour le classificateur.

Le classificateur \"Phind\" crée un index d'expression comme ceci. Il contient une liste d'expressions qu'on peut parcourir extraite du materiel spécifié dans l'argument text de la ligne Classify Phind du fichier de configuration. Ici, la spécification est :

  document:Title,document:Creator,document:Booktitle,\n
      document:Publisher
-- c'est le titre, la liste des auteurs, le titre du travail recueilli (s'il y en a) dans lequel chaque article apparaît, et l'éditeur. Il faut noter que cette spécification suit la convention mg avec level:field. Les indexes Phind sont généralement plus basés sur le texte entier de la collection, en utilisant la spécification document:text.

La meilleure façon de voir ce que fait Phind est de jouer avec cet index. Vous tapez un mot dans la boîte recherche, cliquez Search, et une liste d'expressions contenant ce terme apparaît en haut du tableau. Cliquez sur une de ces expressions et une liste d'expressions contenant cette expression apparaît au bas du tableau. Vous pouvez continuer à faire ceci en allongeant l'expression de plus en plus. Ces listes peuvent être allongees en utilisant le bouton Get more phrases. A la fin de la liste d'expression une liste de document contenant cette expression apparaît dans un texte bleu, vous pouvez allonger cette liste en cliquant sur Get more documents.

Le format de déclaration pour la liste de résultats de recherche et le browser de titre sont tous les deux déterminés par la spécification VList. Elle donne une icône de document qui renvoie sur le document lui-même (qui est la référence complète dans cette collection); le titre en gras; la méta-donnée Creator s'il y en a, sinon la méta-donnée Editor; et la méta-donnée Date s'il y en a. En voici un exemple.

Le format de déclaration pour le browser auteur (CL2VList) est plus complexe. Le classificateur AZCompactList donne un arbre dont les nœuds sont soit des nœuds de feuilles représentant des documents ou des nœuds internes. Un élément de de méta-donnée appelé numleafdocs donne le nombre total de documents en dessous d'un nœud interne. La déclaration de format vérifie si numleafdocs existe. Si le nœud doit être un nœud interne, dans ce cas le nœud est catalogue par son Title. Mais attention : ce classificateur est produit sur la méta-donnée Author, donc son titre -- le titre du classificateur -- est en fait le nom de l'auteur! Ceci signifie que les nœuds des rayons sont catalogués ici suivant le nom de l'auteur. Les nœuds d'extrémité sont catalogués dans la liste des résultats de recherche de la même façon que les documents (c.-à-d. les références) .

Les documents eux-mêmes (voici un exemple) sont produits par deux déclarations de format, une (longue celle-la) appelée DocumentHeading, et une autre appelée DocumentText. Le Document Heading, qui est représente les deux tiers supérieurs de la page contient le Titre du document suivi d'une table qui donne tous les éléments de méta-donnée que le plugin BibTex peut générer. Le rôle de toutes les instructions If dans le fichier de configuration est de déterminer les éléments définis.

Le DocumentText montre la version BibTex de la référence. Cependant, quand le document est affiché la première fois, seul le lien ShowBibtexRecord apparaît --- ceci correspond à la dernière partie (c'est la partie \"else\") de l'instruction If dans DocumentText. Quand le lien est cliqué, href va vers la même URL mais avec showrecord=1, qui génère une page comme celle-ci. Le test If marche, ce qui affiche le Text du document. Avec le plugin BibTex, le texte d'un document est son enregistrement BibTEX pur. " # -- Spanish text ---------------- collectionmeta collectionextra [l=es] " Esta colección contiene entradas _about:numdocs_ BibTeX y ha sido creada a partir de la Bibliografía de la working papers published from 1997 to 2006 at Department of Computer Science, the University of Waikato.\n

Cómo trabaja esta colección

La colección incorpora una interfaz de búsqueda basada en formas que permite la búsqueda por campos. En el caso de Greenstone, esto significa que se debe usar un motor de búsqueda avanzada (llamado mgpp), en vez del motor de búsqueda por omisión de Greenstone (llamado mg). También existe un documento de ayuda en línea para mgpp. La colección tiene una interfaz de búsqueda \"avanzada\" de formas, así como una página de búsqueda sencilla por campos de sólo texto. Estas dos variantes se pueden seleccionar desde la página de Preferencias de la colección.

El archivo de configuración de la colección empieza con la especificación groupsize 200, la cual reúne a los documentos en grupos de 200. Por lo general las colecciones bibliográficas tienen muchos documentos pequeños y al agruparlos se evita que las estructuras de archivos internos de Greenstone se inflen demasiado y ocupen más espacio del necesario.

Aparte de los plugins estándar esta colección cuenta con ZIPPlug, que descomprime los documentos y archivos comprimidos, y BibTexPlug, que procesa las referencias en el formato BibTeX (bastante conocido por los especialistas en informática).

La búsqueda por campos con una interfaz basada en formas se selecciona por medio de la forma searchtype en el archivo de configuración. De hecho, esta colección también utiliza la forma searchtype de sólo texto, la cual incluye asimismo un índice de búsqueda de textos completos (ya que forma viene primero, ésta es la interfaz por omisión; la búsqueda de sólo texto se puede seleccionar por medio de la página de Preferencias).

La inclusión de searchtype significa que el motor de búsqueda mgpp se está usando y que estos índices se especifican de manera ligeramente diferente. En tanto que Greenstone normalmente le permite a los diferentes índices que se van a especificar estar a diferentes \"niveles\" (documento, sección, párrafo), con mgpp todos ellos están al mismo nivel, siendo documento el ajuste por omisión (como en este caso). El nivel se puede cambiar por medio de un enunciado de niveles. Asimismo, mientras que en otras colecciones los índices se pueden especificar sobre el texto o sobre cualquier metadato, aquí existen además otras posibilidades: se pueden especificar índices en cada campo del metadato utilizando solamente la palabra metadato y un índice para todos los campos del metadato juntos utilizando la palabra allfields.

En este caso la línea de índices especifica los índices que se pueden buscar en el texto completo y en cada campo del metadato. Así, cuando los menús de \"campo\" se despliegan en la página de búsqueda, muestran el registro completo seguido de una entrada para cada elemento del metadato. El metadato a nivel de colección collectionmeta se puede especificar para cualquier índice con el fin de determinar lo que se llama en el menú (excepto metadato, que produce varios ítems). En este caso el archivo de configuración especifica que el índice de texto debería llamarse \"registro completo\", debido a que contiene el registro bibliográfico original.

Esta colección contiene exploradores de Título, Autor y Fecha, así como un tipo especial de índice de frases llamado \"Phind\". El clasificador AZCompactList que se usa para el explorador de Autor es como AZList, pero genera un estante para los ítems duplicados tal como se muestra aquí. El plugin BibTeX registra a cada autor como metadato de Autor. También coloca una lista de todos los autores en el elemento del metadato Creador. Como resultado de ello, el clasificador AZCompactList se basa en el Autor. Sin embargo, Greenstone tiene un botón estándar que lee los autores de la \"a\" a la \"z\" y cuyo nombre es (de manera un tanto confusa) \"Creador\", por lo que el nombre de este botón ha sido especificado para el clasificador.

El clasificador \"Phind\" crea un índice de frases como este, el cual contiene una lista que se puede explorar de frases extraídas del material especificado en el argumento de texto de la línea clasificar Phind en el archivo de configuración. Aquí la especificación es

  document:Title,document:Creator,document:Booktitle,\n
      document:Publisher
\n

es decir, el título, la lista de autores, el título del trabajo (si es que hay alguno) en el que aparece este ítem y el editor. Recuerde que esta especificación sigue la convención mg con level:field. Los índices Phind se basan más comúnmente en el texto completo de una colección por medio de la especificación document:text.

La mejor forma de ver lo que hace Phind es practicar con este índice. Escriba una palabra en el cuadro de búsqueda, haga click en Buscar y una lista de frases con dicho término aparecerá en el panel de la parte superior. Haga click en una de estas frases y una lista de frases que contengan dicha frase aparecerá en el panel de la parte inferior. Usted puede continuar extendiendo la frase más y más. Las listas se pueden alargar utilizando el botón obtener más frases. Al final de la lista de frases aparece una lista de los documentos que contienen dicha frase en azul. Usted puede extender esta lista haciendo click en más documentos.

Los enunciados de formato para la lista de resultados de la búsqueda y el explorador de títulos se determinan por medio de la especificación VList. Ésta proporciona un icono de documento que lo vincula con el documento mismo (el cual es en esta colección la referencia completa), el título en negritas, el metadato Creador si es que hay alguno o en su defecto el metadato Editor, y el metadato de Fecha si es que hay alguno. He aquí un ejemplo.

El enunciado de formato para el explorador de autor (CL2VList) es más complejo. El clasificador AZCompactList genera un árbol cuyos nodos son hojas representando documentos o nodos internos. Un ítem de metadato llamado numleafdocs proporciona el número total de documentos debajo de un nodo interno. Este enunciado de formato comprueba si numleafdocs existe. En caso afirmativo se trata de un nodo interno, en cuyo caso el nodo se etiquetará por su Título. ¡Pero cuidado! Este clasificador se genera en el metadato Autor, por lo que su título -- el título del clasificador -- es realmente el nombre del autor, lo que significa que los nodos del estante que están aquí se etiquetan de acuerdo al nombre del autor. Las hojas se etiquetan de la misma manera que los documentos (es decir, referencias) en la lista de resultados de la búsqueda.

Los documentos mismos (he aquí un ejemplo) se generan por medio de dos enunciados de formato, uno llamado DocumentHeading, que es bastante largo, y otro llamado DocumentText. DocumentHeading ocupa los dos tercios superiores de la página y contiene el Título del documento seguido por una tabla de todos los elementos del metadato que el plugin BibTeX puede generar. El papel de todos los enunciados If en el archivo de configuración es determinar los elementos que se definen.

DocumentText muestra la versión BibTeX de la referencia. Sin embargo, cuando el documento se despliega por primera vez únicamente aparece un hipervínculo llamado Mostrar Registro BibTex. Este corresponde a la última parte (es decir, a la parte \"adicional\") del enunciado If en DocumentText. Cuando se hace click en este hipervínculo la href va al mismo URL pero con showrecord=1, que genera una página como ésta. A continuación sigue la prueba If, que muestra el Texto del documento. Con el plugin BibTeX el texto de un documento es su registro BibTeX no adulterado. " # -- Russian text ---------------- collectionmeta collectionextra [l=ru] " Эта коллекция, которая содержит элементы записи _about:numdocs_ BibTeX, is a collection of working papers published from 1997 to 2006 at Department of Computer Science, the University of Waikato.\n.

Как работает коллекция

\n

Коллекция включает интерфейс поиска на табличной основе, который позволяет осуществлять поиск по полям. В Greenstone это означает, что инструмент усовершенствованного поиска, называемый mgpp, должен использоваться предпочтительней, чем стандартная поисковая система поиска Greenstone, называемая mg. Имеется он-лайновое описание помощи для mgpp. Коллекция имеет «продвинутую» форму интерфейса поиска, а также простую одно-полевую страницу поиска. Эти два варианта могут быть выбраны из страницы предпочтений (Preferences) коллекции.

Файл конфигурации коллекции начинается с определения groupsize 200, которое объединяет документы в группы по 200. Библиографические коллекции обычно состоят из большого числа небольших документов, и группировка их вместе предотвращает внутренние файловые структуры Greenstone от увеличения объёма и занятия большего дискового пространства, чем необходимо.

В отличие от стандартных, специфичными плагинами для этой коллекции являются -- ZIPPlug, который распаковывают сжатые документы и архивы, и BibTexPlug, который обрабатывает ссылки в формате BibTex, хорошо известном для ученых.

Поиск по полям с интерфейсом на табличной основе осуществляется форматом searchtype form в конфигурационном файле. Фактически эта коллекция использует простой формат searchtype, который включает простой текстовый индекс для полнотекстового поиска, а также (так как form появляется сначала, это -- интерфейс по умолчанию). Вы можете выбрать простой плоский (plain) поиск из страницы Предпочтений (Preferences).

Включение searchtype означает, что используется поисковый инструмент mgpp и для этого индексы определены немного другим способом. Принимая во внимание, что в Greenstone обычно возможно определять специфичные индексы для различных \"уровней\" (документ, раздел, параграф), то при использовании mgpp они все находятся на одном уровне -- документ по умолчанию (как в этом случае). Уровень может быть изменен при использовании оператора levels. Также, принимая во внимание, что в других коллекциях индексы могут быть определены по тексту или по каким-либо метаданным, здесь предусмотрены дополнительные возможности. Вы можете определить индексы по каждому полю метаданных, используя отдельное слово metadata, и индекс для всех полей метаданных, используя слово allfields.

В этом случае строка индексов определяет доступные для поиска индексы во всём тексте и в каждом поле метаданных. Таким образом, когда на поисковой странице появляется спускающееся меню \"поле\", в нём показан полный список, сопровождающий при входе для каждого элемента метаданных. Метаданные на уровне коллекции collectionmeta могут быть заданы для любого индекса, чтобы определить, что это означает в меню (за исключением metadata, которое создает много пунктов меню). В этом случае конфигурационный файл определяет, что текстовый индекс должен быть назван \"full record\", потому что она содержит оригинальную библиографическую запись.

Эта коллекция содержит программы просмотра по Названию, Автору и Дате, и специальный вид индекса фразы, называемый \"Phind\". Классификатор AZCompactList, используемый для просмотра по Автору, похож на AZLIST, но генерирует книжную полку для дубликатов, как показано здесь. Плагин BibText составляет запись для каждого автора по метаданным Автор; он также помещает список, содержащий перечень всех авторов, в элемент метаданных Создатель (Сreator). Таким образом, классификатор AZCompactList базируется на поле Автор. Однако в Greenstone имеется стандартная кнопка, читающаяся как Авторы а-z, чье наименование отдаленно соответствует Сreator, так что название этой кнопки использовано для классификатора.

Классификатор \"Phind\" создает индекс фразы подобно показанному здесь. Он содержит список доступных для просмотра фраз, извлеченных из материала, указанного в аргументе text строки classify в Phind конфигурационного файла. Определениями здесь являются

  document:Title,document:Creator,document:Booktitle,\n
      document:Publisher
\n

(документ:Название, документ:Создатель, документ:Заголовок книги, документ: Издатель) то есть название, список авторов, название любого сборника работ, в котором этот пункт появляется, и издатель. Обратите внимание, что эти определения соответствуют обычному mg на уровне:поле (level:field). Индексы чаще базируются на основе полнотекстовой коллекции, используя спецификацию документа:text.

�учший способ увидеть, что Phind делает, состоит в том, чтобы поиграть с этим индексом. Вы напечатали слово в поле поиска, щелкнули Поиск, и список фраз, содержащих этот термин, появляется на верхней панели. Щелкните на одной из этих фраз, и список, содержащий эту фразу, появляется на нижней панели. Вы можете продолжать делать это, расширяя фразу все более. Списки могут быть увеличены, используя кнопку get more phrases. В конце списка фраз появляется список документов, содержащих эту фразу, окрашенный в синий цвет. Вы можете расширить этот список путем щелчка на more documents.

Операторы формата для списка результатов поиска и наименование браузера оба определены в спецификации Vlist. Они создают изображение (иконку) документа, которое связывается с самим документом (который в данной коллекции является полной ссылкой); Название выделено полужирным шрифтом; метаданные Создателя документа, если таковой имеется, или же метаданные Издателя и метаданные Даты, если она существует. Здесь приводится пример.

Оператор формата для показа автора (CL2Vlist) является более сложным. Классификатор AZCompactList генерирует дерево, узлы которого являются или узлами списка, представляя документы, или же внутренними узлами. Пункт метаданных, называемый numleafdocs, дает общее количество документов, расположенных ниже внутреннего узла. Этот оператор формата проверяет, существуют ли число листов документов numleafdocs. Если это так, то узел должен быть внутренним узлом. В этом случае имеет свою метку Название. Но имейте в виду, что этот классификатор произведен на основе метаданных Автора, так что его название - название классификатора -- является фактически именем автора. Это означает, что узлы книжной полки здесь названы именем автора. Узлы листа, однако, помечены таким же образом, как документы (то есть ссылки на них), находящиеся в списке результатов поиска.

Сами же Документы (здесь имеется пример), генерируются двумя операторами формата, один из которых (длинный) назван DocumentHeading, а другой - DocumentText. DocumentHeading, который составляет верхние две трети страницы, содержит Название документа, сопровождаемое таблицей, которая содержит все элементы метаданных, которые плагин BibTex может генерировать. Назначение всех операторов If в конфигурационном файле состоит в том, чтобы решить, какие элементы определены.

DocumentText показывает BibTex-версию ссылки. Однако, когда документ показан в первый раз, появляется только гиперссылка Show BibTex Record. Это соответствует последней части, то есть значению \"другой\" оператора If в DocumentText. Если щелкнуть на этой гиперссылке, href идет к тому же самому URL, но с Showrecord=1, который генерирует страницу подобно этой. Последующий тест If показывает Текст документа. Плагин BibTeX дает запись текста документа в формате BibTeX. "