creator greenstone@cs.waikato.ac.nz maintainer greenstone@cs.waikato.ac.nz public true buildtype mgpp indexes text dc.Title defaultindex text levels document plugin GreenstoneXMLPlugin plugin MARCPlugin plugin MetadataXMLPlugin plugin ArchivesInfPlugin plugin DirectoryPlugin classify AZList -metadata dc.Title -removesuffix \\s*(\\/|;|,|\\.).* classify AZCompactList -metadata dc.Creator -removesuffix (b\\.\\s+)?(\\d+(\\-?))(\\d+(\\.)?)? classify AZCompactList -metadata dc.Subject format VList "[link][icon][/link] {If}{[numleafdocs],[Title],[dc.Title]{If}{[dc.Creator], [sibling:dc.Creator]}{If}{[dc.Publisher], [dc.Publisher]}}{If}{[numleafdocs],([numleafdocs])}" #format CL2VList "[link][icon][/link]{If}{[numleafdocs],[Title],[dc.Creator]; [dc.Title]{If}{[dc.Publisher], [dc.Publisher]}}{If}{[numleafdocs],([numleafdocs])}" #format CL3VList "[link][icon][/link]{If}{[numleafdocs]{[Title],[dc.Title]{If}{[dc.Creator], [dc.Creator]}{If}{[dc.Publisher], [dc.Publisher]}}{If}{[numleafdocs],([numleafdocs])}" format HList "[link][highlight][ex.Title][/highlight][/link]" format DocumentHeading "[dc.Title]
" format DocumentText "[Text]" format DocumentButtons "" format SearchTypes "plain,form" collectionmeta .text [l=en] "_labeltext_" collectionmeta .Title [l=en] "_labelTitle_" collectionmeta .Source [l=en] "_labelSource_" # -- English strings ---------------- collectionmeta collectionname [l=en] "MARC example" # -- French strings ---------------- collectionmeta collectionname [l=fr] "Exemple MARC" # -- Spanish strings ---------------- collectionmeta collectionname [l=es] "Colección de muestra MARC" # -- Russian strings ---------------- collectionmeta collectionname [l=ru] "Пример MARC" # -- English text ---------------- collectionmeta collectionextra [l=en] "This collection, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by Computer Science Department at the University of Waikato. Here is a sample document in the collection.

How the collection works

\n

The configuration file uses MARCPlugin to process the MARC records, as well as the standard plugins. There are three classifiers, based on dc.Title, dc.Creator, and dc.Subject metadata. The Title classifier uses AZList, while the other two use AZCompactList, which groups items with the same metadata into a bookshelf. The -removesuffix argument for the Title and Creator classifiers removes suffixes from the metadata string (dc.Title and dc.Creator respectively). This is specified as a PERL regular expression, and trims characters (such as trailing punctuation) from the strings for display.

The VList format statement controls the display of search results and all classifiers. For bookshelves, the number of leaf documents is displayed on the right-hand side. For documents, dc.Title is displayed, along with dc.Creator and dc.Publisher. [sibling:dc.Creator] is used as dc.Creator has multiple values, and specifies that all values be output, not just the first one.

The MARC plugin uses a special file to map MARC field numbers to Greenstone-style metadata. This file resides in the greenstone/etc directory, and is called marc2dc.txt. It lists the correspondences between MARC field numbers and Greenstone metadata. Any MARC fields that are not listed simply do not appear as metadata, though they are still present in the Greenstone document. Each line in the file has the format

<MARC field number> -> GreenstoneMetadataName
Lines in the file that begin with \"\#\" are comments. \n

The standard version of this file is loosely based on the MARC to Dublin Core mapping found at http://www.loc.gov/marc/marc2dc.html (which assumes USMARC/MARC21).

Multiple MARC fields may map to a single Dublin Core field. For example, fields 720 (\"Uncontrolled name\"), 100 (\"Personal name\"), 110 (\"Corporate name\") and 111 (\"Meeting name\") all map to dc.Creator. Actual MARC records normally define only one of these fields, and anyway Greenstone allows multi-valued metadata.\n

Some mappings are dependent on subfields. For example, MARC field 260 contains information about publication and distribution. Subfields \"c\" (Date of Publication) and \"g\" (Date of manufacture) are mapped to dc.Date, using the following mapping line:

260$c$g -> dc.Date
Greenstone also provides a file for mapping MARC to qualified dublin core: greenstone/etc/marc2qdc.txt. This can be used by the MARC plugin by setting the -metadata_mapping_file option to \"marc2qdc.txt\". " # -- French text ---------------- collectionmeta collectionextra [l=fr] "Cette collection, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by Computer Science Department at the University of Waikato. Voici un document échantillon dans la collection.

Comment marche cette collection ?

Le fichier de configuration utilise ZipPlug et MarcPlug à coté des trois qui sont utilisés en standard. Il y a trois classificateurs basés sur les méta-données dc.Title, dc.Creator et dc.Subject. _text1_ Ceci est spécifié comme une expression régulière de PERL et ajuste pour l\'affichage des caractères (comme une ponctuation finale).

_text2_

Le module Marc utilise un fichier spécial pour la mise en correspondance des numéros de champ MARC avec les méta-donnée de type Greenstone. Ce fichier se trouve dans le répertoire gsdl/etc, et est appelé marc2dc.txt. Il liste les correspondences entre les numéros de champ MARC et les méta-données Greenstone. Tous les champs MARC qui ne sont pas listés ne vont pas apparaître comme méta-données, bien qu\'ils spient toujours présents dans le document Greenstone. Chaque ligne dans le fichier à le format:

<numéro de champ MARC> -> NonMetadonnéeGreenstone
Les lignes dans le fichier qui commence par \"\#\" sont des commentaires.

La version standard de ce fichier est approximativement basée sur la mise en correspondance MARC - Dublin Core trouvé à http://www.loc.gov/marc/marc2dc.html (qui suppose USMARC/MARC21). _text3_ " # -- Spanish text ---------------- collectionmeta collectionextra [l=es] "Esta colección, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by Computer Science Department at the University of Waikato. He aquí un documento muestra de la colección.

Cómo trabaja esta colección

El archivo de configuración utiliza MARCPlugin además de los tres plugins estándar. Existen tres clasificadores basados en los metadatos dc.Título, dc.Creador y dc.Asunto. _text1_ Esto se especifica como una expresión regular PERL y ordena los caracteres (como la puntuación que se encuentra al final) a partir de las cadenas para su presentación en pantalla.

_text2_

El plugin de MARC utiliza un archivo especial para mapear y convertir los números de campo MARC a metadatos estilo Greenstone. Este archivo reside en el directorio gsdl/etc y se llama marc2dc.txt. Incluye una lista de las correspondencias entre los números de campo MARC y los metadatos Greenstone. Cualquier campo MARC que no esté incluido en la lista simplemente no aparece como metadato, aunque siga estando presente en el documento Greenstone. Cada línea del archivo tiene el siguiente formato:

<MARC field number> -> GreenstoneMetadataName

Las líneas en el archivo que empiezan con \"\#\" son comentarios.

La versión estándar de este archivo se basa libremente en el mapeo de MARC a Dublin Core que se encuentra en http://www.loc.gov/marc/marc2dc.html (el cual asume USMARC/MARC21). _text3_ " # -- Russian text ---------------- collectionmeta collectionextra [l=ru] "This collection, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by Computer Science Department at the University of Waikato. Здесь представлен типовой документ данной коллекции.

Как работает коллекция

Конфигурационный файл использует плагины ZIPPlug и MARCPlug, помимо третьего стандарта. Имеются три классификатора, основанные на метаданных Названия (dc.Title), Создателя (dc.Creator) и Предмета (dc.Subject). _text1_ Это требует установки PERL для правильного выражения, и урезает знаки (типа конечных знаков препинания) из строки для отображения.

_text2_

Плагин MARC использует специальный файл для сопоставления номера поля в MARC и метаданных Greenstone. Этот файл находится в директории gsdl/etc и называется marc2dc.txt. Он представляет список соответствия между номерами полей системы MARC и метаданными Greenstone. �юбые поля MARC, которые не внесены в список, просто не появляются как метаданные, хотя они присутствуют в документе Greenstone. Каждая строка в этом файле имеет следующий формат.

<MARC field number> -> GreenstoneMetadataName
Строки в данном файле, которые начинаются со знака \"\#\", являются комментариями.

Стандартная версия этого файла свободно базируется на MARC в описании Dublin Core, которое воспринимает USMARC/MARC21 и которое можно найти на http://www.loc.gov/marc/marc2dc.html. _text3_ "