source: documented-examples/trunk/oai-e/etc/collect.cfg@ 36306

Last change on this file since 36306 was 36306, checked in by anupama, 22 months ago

Fixed up the GS2 oai-e DEC collection so that it works again.

  • Property svn:executable set to *
File size: 47.2 KB
Line 
1creator [email protected]
2public true
3
4
5acquire OAI -src rocky.dlib.vt.edu/~jcdlpix/cgi-bin/OAI1.1/jcdlpix.pl -getdoc
6
7indexes document:ex.dc.Description
8
9#levels document
10
11#defaultlevel document
12
13plugin OAIPlugin -default_language en -document_field ex.dc.Identifier -input_encoding iso_8859_1
14plugin ImagePlugin -screenviewsize 300 -OIDtype assigned -OIDmetadata ex.dc.Title
15plugin GreenstoneXMLPlugin
16plugin MetadataXMLPlugin
17plugin ArchivesInfPlugin
18plugin DirectoryPlugin
19
20classify AZCompactList -metadata ex.dc.Subject -buttonname Subjects -doclevel top
21classify AZCompactList -mingroup 10 -metadata ex.dc.Description -mincompact 5 -minnesting 7 -buttonname Captions -maxcompact 10
22
23format VList "<td>[link][thumbicon][/link]</td>
24<td valign=middle><i>[ex.dc.Description]</i></td>"
25
26format CL1VList "<td>{If}{[numleafdocs],[link][icon][/link],[link][thumbicon][/link]}</td><td valign=middle>{If}{[numleafdocs],[Title],<i>[ex.dc.Description]</i>}</td>"
27
28format CL2VList "<td>{If}{[numleafdocs],[link][icon][/link],[link][thumbicon][/link]}</td><td valign=middle>{If}{[numleafdocs],[Title],<i>[ex.dc.Description]</i>}</td>"
29
30format DocumentHeading "<h3>[ex.dc.Subject]</h3>"
31
32format DocumentText "<center><table width=_pagewidth_ border=1>
33<tr><td colspan=2 align=center>
34<a href=\"collect/[collection]/index/assoc/[assocfilepath]/[srclinkFile]\">[screenicon]</a></td></tr>
35<tr><td>_Caption_:</td><td> <i>[ex.dc.Description]</i> <br>
36(<a href=[ex.dc.OrigURL]>_original_ [ImageWidth]x[ImageHeight] [ImageType] _available_</a>)
37</td></tr>
38<tr><td>_Subject_:</td><td> [ex.dc.Subject]</td></tr>
39<tr><td>_Publisher_:</td><td> [ex.dc.Publisher]</td></tr>
40<tr><td>_Rights_:<td> [ex.dc.Rights]</td></tr>
41</table></center>"
42
43format HList "[link][highlight][ex.Title][/highlight][/link]"
44
45format DocumentButtons "Detach|Highlight"
46
47collectionmeta sampleoid [l=en] "01dle6"
48
49# -- English strings ----------------
50collectionmeta collectionname [l=en] "OAI demo"
51
52collectionmeta .document [l=en] "_textdocument_"
53collectionmeta .document:ex.dc.Description [l=en] "photo captions"
54
55collectionmeta Caption [l=en] "Caption"
56collectionmeta Subject [l=en] "Subject"
57collectionmeta Publisher [l=en] "Publisher"
58collectionmeta Rights [l=en] "Rights"
59collectionmeta original [l=en] "original"
60collectionmeta available [l=en] "available"
61
62
63# -- French strings ----------------
64collectionmeta collectionname [l=fr] "Démo OAI"
65
66collectionmeta .document:Description [l=fr] "Légendes de photos"
67
68collectionmeta Caption [l=fr] "Légende"
69collectionmeta Subject [l=fr] "Sujet"
70collectionmeta Publisher [l=fr] "Editeur"
71collectionmeta Rights [l=fr] "Droits"
72collectionmeta original [l=fr] "original"
73collectionmeta available [l=fr] "disponible"
74
75
76# -- Spanish strings ----------------
77collectionmeta collectionname [l=es] "Colección de muestra OAI"
78
79collectionmeta .document:Description [l=es] "leyendas de la foto"
80
81collectionmeta Caption [l=es] "Título de la ilustración"
82collectionmeta Subject [l=es] "Asunto"
83collectionmeta Publisher [l=es] "Editorial"
84collectionmeta Rights [l=es] "Derecho de autor"
85collectionmeta original [l=es] "original"
86collectionmeta available [l=es] "disponible"
87
88
89# -- Russian strings ----------------
90collectionmeta collectionname [l=ru] "Демонстраци-онная коллекция OAI"
91
92collectionmeta .document:Description [l=ru] "Заголовки фотографий"
93
94collectionmeta Caption [l=ru] "Заголовок (Надпись)"
95collectionmeta Subject [l=ru] "Предмет"
96collectionmeta Publisher [l=ru] "Издатель"
97collectionmeta Rights [l=ru] "Права"
98collectionmeta original [l=ru] "Оригинал"
99collectionmeta available [l=ru] "Доступный"
100
101# -- Simplified Chinese strings ----------------
102collectionmeta collectionname [l=zh] "OAI演示馆藏"
103
104collectionmeta .document:dc.Description [l=zh] "照片标题"
105
106collectionmeta Caption [l=zh] "标题"
107collectionmeta Subject [l=zh] "主题"
108collectionmeta Publisher [l=zh] "出版商"
109collectionmeta Rights [l=zh] "版权"
110collectionmeta original [l=zh] "原始"
111collectionmeta available [l=zh] "可用"
112
113
114# -- English text ----------------
115collectionmeta collectionextra [l=en] "This collection demonstrates Greenstone\'s
116<i>ImportFrom</i> feature. Using the <a href=http://www.openarchives.org>Open
117Archive Protocol</a> (version 1.1), it retrieves metadata from
118<a href=http://rocky.dlib.vt.edu/~jcdlpix>rocky.dlib.vt.edu/~jcdlpix</a>,
119a collection of photographs taken at the inaugural
120<a href=http://www.acm.org/jcdl/jcdl01/>Joint Conference on Digital
121Libraries</a>. A Greenstone collection is built from the records exported
122from this OAI data provider. The implementation is flexible enough to
123cope with the minor syntax differences between OAI 1.1 and OAI 2.0.\n
124
125<h3>How the collection works</h3>\n
126
127<p>
128The <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>collection
129configuration file</a> includes an <i>acquire</i> line that is
130interpreted by a special program called <i>importfrom.pl</i>. Like other
131Greenstone programs, this takes as argument the name of the collection, and
132provides a summary of other arguments when invoked with argument <i>-help</i>.
133It reads the collection configuration file, finds the acquire line, and
134processes it. In this case, it is run with the command:\n
135<pre>
136importfrom.pl oai-e
137</pre>\n
138
139<p>
140(the collection\'s name is <i>oai-e</i>).
141The <i>acquire</i> line in the configuration file specifies the OAI protocol
142and gives the base URL of an OAI repository. The <i>importfrom</i> program
143downloads all the metadata in that repository into the collection\'s
144<i>import</i> directory. The <i>getdoc</i> argument instructs it to also
145download the collection\'s source documents, whose URLs are given in each
146document\'s Dublin Core <i>Identifier</i> field (this is a common
147convention). The metadata files, which each contain an XML record for one
148source document, are placed in the <i>import</i> file structure along with the
149documents themselves, and the document filename is the same as the filename in
150the URL. The <i>Identifier</i> field is overridden to give the local filename,
151and its original value is retained in a new field called <i>OrigURL</i>.\n
152
153<p>
154<a href=\"_httpcollection_/etc/oai.txt\" target=oai.txt>Here</a>
155is an example of a downloaded metadata file.\n
156
157<p>
158Once the OAI information has been imported, the collection is processed in the
159usual way. Besides the four standard plugins (GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin and DirectoryPlugin),
160the configuration file specifies the OAI plugin, which processes OAI
161metadata, and the image plugin, because in this case the collection\'s source
162documents are image files. The OAI plugin has been supplied with an
163<i>input_encoding</i> argument because data in this archive contains extended
164characters. It also has a <i>default_language</i> argument. Greenstone normally
165determines the language of documents automatically, but these metadata records
166are too small for this to be done reliably: hence English is specified
167explicitly in the <i>language</i> argument. The OAI plugin parses the metadata
168and passes it to the appropriate source document file, which is then processed
169by an appropriate plugin -- in this case <i>ImagePlugin</i>. This plugin specifies
170the resolution for the screen versions of the images.\n
171
172<p>
173Extracted metadata from OAI records are mapped to Dublin Core Metadata Set by default.
174As a result, classifiers and indexes in this collection are built with Dublin meatadata elements.
175
176<p>
177The <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>collection
178configuration file</a> has a single full-text index containing
179<i>dc.Description</i> metadata. When a document is displayed, the
180<i>DocumentHeading</i> format statement puts out its <i>dc.Subject</i>. Then the
181<i>DocumentText</i> statement follows this with <i>screenicon</i>, which is
182produced by <i>ImagePlugin</i> and gives a screen-resolution version of the
183image; it is hyperlinked to the <i>dc.OrigURL</i> metadata -- that is, the original
184version of the image on the remote OAI site. This is followed by the image\'s
185<i>dc.Description</i>, also with a hyperlink; the image\'s size and type, again
186generated as metadata by <i>ImagePlugin</i>; and then <i>dc.Subject</i>,
187<i>dc.Publisher</i>,
188and <i>dc.Rights</i> metadata.
189<a href=_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&cl=search&d=_sampleoid_>This</a>
190is the result.\n
191
192<p>
193There are two browsing classifiers, one based on <i>dc.Subject</i> metadata and
194the other on <i>dc.Description</i> metadata (but with a button named
195\"captions\"). Recall that the <i>AZCompactList</i> classifier is like
196<i>AZList</i> but generates a bookshelf for duplicate items. In this
197collection there are a lot of images but only a few different values for
198<i>dc.Subject</i> metadata.\n
199
200<p>
201It\'s a little surprising that <i>AZCompactList</i> is used (instead of
202<i>AZList</i>) for the <i>dc.Description</i> index too, because <i>dc.Description</i>
203metadata is usually unique for each image. However, in this collection the same
204description has occasionally been given to several images, and some of the
205divisions in an <i>AZList</i> would contain a large number of images, slowing
206down transmission of that page. To avoid this, the compact version of the list
207is used with some arguments (<i>mincompact</i>, <i>maxcompact</i>,
208<i>mingroup</i>, <i>minnesting</i>) to control the display -- e.g. groups (represented by
209bookshelves) are not formed unless they have at least 5 (<i>mingroup</i>)
210items. To find out the meaning of the other arguments for this classifier,
211execute the command <i>classinfo.pl AZCompactList</i>. The programs
212<i>classinfo.pl</i> (for classifiers) and <i>pluginfo.pl</i> (for plugins) are
213useful tools for learning about the capabilities of Greenstone modules. Note
214incidentally the backslash in the configuration file, used to indicate a
215continuation of the previous line.\n
216
217<p>
218The <i>VList</i> format specification shows the image thumbnail, hyperlinked to
219the associated document, followed by <i>dc.Description</i> metadata; the result
220can be seen <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2\">here</a>. The <i>Vlists</i>
221for the classifiers use <i>numleafdocs</i> to switch between an icon
222representing several documents (which will appear as a bookshelf) and the
223thumbnail itself, if there is only one image.\n
224
225<h3>The Greenstone OAI server</h3>\n
226
227<p>
228Greenstone comes with a built-in OAI data provider.
229This runs as a CGI program called \"oaiserver.cgi\", and is installed
230in the Greenstone <i>cgi-bin</i> directory. It can be accessed via the same
231URL as the Greenstone library (replacing \"library.cgi\" with \"oaiserver.cgi\"). If you
232are using the Windows local library server, you must install a
233web server (such as Apache) to run the OAI server.\n
234
235<p>
236Configuration of the server is done via the <i>oai.cfg</i> file in the
237Greenstone <i>etc</i> directory. This file specifies general information
238about the repository, and lists collections to be made accessible to OAI
239clients. By default, collections are not accessible. To enable a
240collection, add its name to the <i>oaicollection</i> list. Collections built
241with versions of Greenstone earlier than 2.52 must be rebuilt before
242they can be served.\n
243
244<p>
245Greenstone's OAI server currently supports Dublin Core, qualified Dublin Core and rfc1807 metadata sets. The <i>oaimetadata</i> line specifies which sets should be used. For collections that use other metadata sets,
246metadata mapping rules should be provided to map the existing metadata
247to the sets in use. See the <i>oai.cfg</i> file for details.\n
248"
249
250
251# -- French text ----------------
252collectionmeta collectionextra [l=fr] "
253Cette collection montre la fonctionnalité <i>ImportFrom</i> de Greenstone. Par le biais de <a href=http://www.openarchives.org>Open Archive Protocol</a> (version 1.1), elle récupère des méta-données de <a href=\"http://rocky.dlib.vt.edu/~jcdlpix\">rocky.dlib.vt.edu/~jcdlpix</a>, une collection de photos prise lors de la cérémonie inaugurale de <a href=\"http://www.acm.org/jcdl/jcdl01/\">Joint Conference on Digital Libraries</a>. Une collection Greenstone est créée à partir d'articles exportés du pourvoyeur de données OAI. L'implémentation est assez flexible pour s'accomoder des différences négligeables de syntaxes entre OAI 1.1 et OAI 2.0.
254
255<h3>Comment fonctionne cette collection ?</h3>
256
257<p>
258Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration de la collection</a> comprend une ligne <i>acquire</i> (acquérir) qui est interprétée par un programme spécial appelé <i>importfrom.pl</i>. A l'instar des autres programmes Greenstone, celui-ci prend comme argument le nom de la collection et fournit un résumé des autres arguments quand ils sont appelés avec l'argument <i>-help</i>. Il lit le fichier de configuration de la collection, trouve la ligne <i>acquire</i> et en fait le traitement. Dans ce cas, il démarre avec la commande:
259
260<pre>
261importfrom.pl oai-e
262</pre>
263
264<p>
265(le nom de la collection est <i>oai-e</i>). La ligne <i>acquire</i> dans le fichier de configuration spécifie le protocole OAI et donne l'URL de base d'un répertoire OAI. Le programme <i>importfrom</i> télécharge toutes les méta-données de ce entrepôt dans le dossier <i>import</i> de la collection. L'argument <i>getdoc</i> lui donne les instructions de télécharger aussi les documents sources de la collection dont les URL sont données dans le champ Dublin Core <i>Identifier</i> (Identificateur) de chaque document (ceci est une convention générale). Les fichiers de méta-données, dont chacun contient un enregistrement XML pour un document source, sont placés dans la structure de fichiers <i>import</i> avec les documents eux-mêmes, et le nom de fichier du document est le même que le nom de fichier dans l'URL. Le champ <i>Identifier</i> est écrasé pour donner le nom de fichier local et sa valeur originale est retenue dans le nouveau champ appelé <i>OrigURL</i>.
266
267<p>
268<a href=\"_httpcollection_/etc/oai.txt\" target=oai.txt>Voici</a> un exemple de fichier de méta-données téléchargé.
269
270<p>
271Une fois que l'information OAI a été importée, la collection est traitée de façon usuelle. Le fichier de configuration précise le plugin OAI, qui traite la méta-donnée OAI et le plugin de l'image, car dans ce cas les documents source de la collection sont des fichiers d'images. En plus des quatre plugiciels de base (GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin and DirectoryPlugin), le fichier de configuration détermine le comportement du plugiciel OAI, qui traite les métadonnées OAI, ainsi que celui du plugiciel Image, puisque dans ce cas, les documents sources de la collection sont des fichiers images. Il a aussi un argument <i>default_language</i>. Normalement, Greenstone détermine automatiquement la langue des documents, mais ces enregistrements de méta-données sont très insuffisants pour que ceci soit fait de manière fiable: dès lors, l'anglais est spécifié explicitement dans l'argument <i>language</i>. Le plugin OAI analyse la méta-donnée et la transmet au fichier du document source approprié, qui est ainsi traité par un plugin approprié --- dans ce cas-ci par <i>ImagePlugin</i>. Ce plugin spécifie la résolution pour les versions écran des images.
272
273<p>
274Par défaut, les métadonnées extraites d'enregistrements OAI sont converties en métadonnées Dublin Core. Par conséquent, les classificateurs et les index de cette collection sont construits à partir des éléments de métadonnées Dublin Core.
275
276<p>
277Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration de la collection</a> a un index \"full-text\" unique contenant la méta-donnée <i>dc.Description</i>. Quand un document est affiché, la déclaration de format <i>DocumentHeading</i> révèle son <i>dc.Subject</i> (Sujet). Elle est ensuite suivie de la déclaration <i>DocumentText</i> avec <i>screenicon</i> produit par <i>ImagePlugin</i> et qui donne une version résolution d'écran de l'image; elle est liée à la méta-donnée <i>dc.OrigURL</i>, c'est à dire la version originale de
278l'image sur le site OAI distant. Elle est suivie par <i>dc.Description</i> de l'image, aussi avec un lien; le type et la taille de l'image, générés également comme méta-données par <i>ImagePlugin</i>; et enfin les méta-données <i>dc.Subject</i>, <i>dc.Publisher</i> et <i>dc.Rights</i>. <a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&cl=search&d=_sampleoid_\">Voici</a> le résultat.
279
280<p>
281Il y a deux classificateurs de navigation, l'un basé sur la méta-donnée <i>dc.Subject</i> et l'autre sur la méta-donnée <i>dc.Description</i> (mais avec un bouton dénommé \"légends\"). On rappelle que le classificateur <i>AZCompactList</i> est identique à <i>AZList</i> mais produit un rayon pour dupliquer les articles. Cette collection contient plusieurs images mais seulement peu de valeurs différentes pour la méta-donnée <i>dc.Subject</i>.
282
283<p>
284C'est un peu surprenant que <i>AZCompactList</i> soit utilisé (au lieu de <i>AZList</i>) pour l'index <i>dc.Description</i> aussi, car la méta-donnée <i>dc.Description</i> est usuellement unique pour chaque image. Cependant, dans cette collection, la même description a été occasionnellement donnée à plusieurs images, et certaines des divisions dans <i>AZList</i> contiendraient un grand nombre d'images, ralentissant la transmission de cette page. Pour éviter cela, la version compact de la liste est utilisée avec quelques arguments (<i>mincompact</i>, <i>maxcompact</i>, <i>mingroup</i>, <i>minnesting</i>) pour contrôler l'affichage ' c'est à dire des groupes (représentés par les rayons de bibliothèque) ne sont formés qu'à condition qu'il aient au moins cinq éléments (<i>mingroup</i>). Pour trouver la signification des autres arguments pour ce classificateur, il faut exécuter la commande <i>classinfo.pl AZCompactList</i>. Les programmes <i>classinfo.pl</i> (pour classificateurs) et <i>pluginfo.pl</i> (pour plugins) sont des outils précieux pour connaître les capacités des modules de Greenstone. Il faut noter que le \"backslash\" (\\\\) dans le fichier de configuration est généralement utilisé pour indiquer une continuation de la ligne précédente.
285
286<p>
287La spécification du format <i>Vlist</i> montre l'onglet de l'image, lié (hyperlien) au document associé, suivi de la méta-donnée <i>dc.Description</i>; le résultat peut être vu <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2\">ici</a>. <i>Vlist</i> pour les classificateurs utilise <i>numleafdocs</i> pour commuter d'une icône représentant plusieurs documents (ce qui apparaîtra dans le rayon de livres) à l'onglet lui-même, si une seule image est présente.
288
289<h3>Le serveur OAI de Greenstone</h3>
290
291<p>
292Greenstone inclus un fournisseur de donné de type OAI.
293Il fonctionne par le biais d'un programme CGI nommé \"oaiserver.cgi\" lequel se trouve dans le fichier <i>cgi-bin</i> de Greenstone. On peut y accéder au moyen de la même URL que la librairie de Greenstone (en remplacant \"library.cgi\" par \"oaiserver.cgi\"). Si vous utilisez le serveur local de librairie de windows, vous devez installer un serveur internet (tel qu'Apache) pour pouvoir utiliser ce serveur OAI.
294
295<p>
296La configuration du serveur est réalisée au moyen du fichier <i>oai.cfg</i> se trouvant dans le dossier <i>etc</i> de Greenstone. Ce fichier spécifie des informations générales sur le dossier et fait la liste des collections à rendre accessibles aux clients OAI. Par défaut, les collections ne sont pas accéssibles.
297Afin de rendre une collection accessible, ajoutez son nom à la liste <i>oaicollection</i>.
298Les collections construites avec des version de Greenstone antérieures à la version 2.52 doivent être recompilée avant de pouvoir être utilisée par le serveur.
299
300<p>
301A ce jour, le serveur OAI de Greenstone gère les jeux de métadonnées Dublin Core, Dublin Core qualifié, et rfc1807. La ligne <i>oaimetadata</i> définit les jeux de métadonnées à utiliser. Pour les collections utilisant d'autres jeux de métadonnées, des règles de correspondance des métadonnées peuvent être ajoutées pour faire correspondre les métadonnées existantes avec les jeux disponibles. Voir le fichier <i>oai.cfg</i> pour plus d'informations. \n
302"
303
304
305# -- Spanish text ----------------
306collectionmeta collectionextra [l=es] "
307Esta colección demuestra la función <i>ImportFrom</i> de Greenstone. Por medio del <a href=http://www.openarchives.org>Protocolo de Archivo Abierto</a> (versión 1.1) recupera metadatos de <a href=http://rocky.dlib.vt.edu/~jcdlpix>rocky.dlib.vt.edu/~jcdlpix</a>, una colección de fotografías tomadas durante la <a href=http://www.acm.org/jcdl/jcdl01/>Conferencia inaugural conjunta de Bibliotecas Digitales</a>. Se creó una colección Greenstone a partir de los registros exportados por este proveedor de datos OAI. La implementación es lo suficientemente flexible para enfrentar diferencias menores de sintaxis entre OAI 1.1 y OAI 2.0.
308<p>
309
310<h3>Cómo trabaja esta colección</h3>
311
312El <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>archivo de configuración de la colección</a> incluye una línea <i>acquire</i> (adquirir) que es interpretada por un programa especial llamado <i>importfrom.pl</i>. Al igual que otros programas Greenstone, este toma como argumento el nombre de la colección y proporciona un resumen de otros argumentos cuando se les llama con el argumento <i>-help</i>. El programa lee el archivo de configuración de la colección, busca la línea <i>acquire</i> y la procesa. En este caso, se ejecuta por medio del siguiente comando:
313<p>
314
315<pre>
316importfrom.pl oai-e
317</pre>\n
318<p>
319
320(donde el nombre de la colección es oai-e). La línea <i>acquire</i> en el archivo de configuración especifica el protocolo OAI y proporciona el URL base de un repositorio OAI. El programa <i>importfrom</i> baja todos los metadatos del repositorio en el directorio <i>importar</i> de la colección. El argumento <i>getdoc</i> lo instruye también para que baje los documentos fuente de la colección, cuyos URLs están dados en el campo <i>Identificador</i> de Dublin Core de cada documento (ésta es una convención). Los archivos de metadatos, cada uno de los cuales contiene un registro XML para un documento fuente, se colocan en la estructura de archivos <i>importar</i> junto con los documentos mismos y el nombre de archivo del documento es igual al nombre de archivo en el URL. El campo <i>Identificador</i> se sustituye por el nombre de archivo local y su valor original es conservado en un nuevo campo llamado <i>OrigURL</i>.
321<p>
322
323He <a href=\"_httpcollection_/etc/oai.txt\" target=oai.txt>aquí</a> un ejemplo de un archivo de metadatos bajados del repositorio.
324<p>
325
326Una vez que la información OAI se ha importado, la colección se procesa de forma normal. Además de los cuatro plugins estándar (GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin y DirectoryPlugin), el archivo de configuración especifica al plugin OAI, el cual procesa metadatos OAI, y también el plugin para imágenes, porque en este caso los documentos fuente de la colección son imágenes. El plugin OAI tiene una opción llamada
327<i>input_encoding</i> porque los datos del archivo contienen caracteres extendidos. También tiene un argumento <i>default_language</i>. Normalmente Greenstone determina el idioma de los documentos automáticamente, pero estos registros de metadatos son demasiado pequeños para poder hacerlo de manera confiable, por lo que el inglés se especifica de manera explícita en el argumento <i>language</i>. El plugin OAI descompone y analiza los metadatos y los pasa al correspondiente archivo de documento fuente, el cual es procesado a continuación por un plugin apropiado, que en este caso es <i>ImagePlugin</i>. Este plugin especifica la resolución de las imágenes en pantalla.
328
329<p>
330Los metadatos extractados de registros OAI son mapeados al esquema de metadatos Dublin Core por defecto.
331Como resultado, los clasificadores y los índices en esta colección son construídos con elementos de metadatos Dublin Core.
332
333<p>
334El <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>archivo de configuración de la colección</a> tiene un solo índice de texto completo, el cual contiene el metadato <i>dc.Descripción</i>. Cuando un documento se despliega en pantalla el enunciado de formato <i>DocumentHeading</i> muestra su <i>dc.Asunto</i>. A continuación le sigue el enunciado <i>DocumentText</i> con <i>screenicon</i>, el cual es producido por <i>ImagePlugin</i> y proporciona una versión en pantalla de la imagen. Ésta cuenta con un hipervínculo al metadato <i>dc.OrigURL</i>, es decir, a la versión original de la imagen en el sitio OAI remoto. Le sigue la <i>dc.Descripción</i> de la imagen, también con un hipervínculo, el tamaño y tipo de la imagen, nuevamente generados como metadatos por <i>ImagePlugin</i>, y finalmente los metadatos de <i>dc.Asunto</i>, <i>dc.Editorial</i> y <i>dc.Derechos de Autor</i>. <a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&cl=search&d=_sampleoid_\">Éste</a> es el resultado.
335<p>
336
337Existen dos clasificadores de exploración, uno basado en el metadato <i>dc.Asunto</i> y el otro en el metadato <i>dc.Descripción</i> (pero con un botón llamado \"pies de foto\"). Recuerde que el clasificador <i>AZCompactList</i> es como <i>AZList</i>, pero genera un estante para los ítems duplicados. En esta colección hay una gran cantidad de imágenes, pero sólo unos cuantos valores diferentes para el metadato <i>dc.Asunto</i>.
338<p>
339
340Resulta un tanto sorprendente que el clasificador <i>AZCompactList</i> también se utilice (en vez de <i>AZList</i>) para el índice de <i>dc.Descripción</i>, ya que por lo general el metadato <i>dc.Descripción</i> es exclusivo para cada imagen. Sin embargo, en esta colección la misma descripción se emplea en ocasiones para varias imágenes, por lo que algunas de las divisiones en una <i>AZList</i> contendrían un gran número de imágenes, haciendo que la transmisión de esa página fuera más lenta. Para evitarlo se utiliza la versión compacta de la lista con algunos argumentos (<i>mincompact, maxcompact, mingroup, minnesting</i>) para controlar la presentación en pantalla. Por ejemplo, los grupos (representados por estantes) no se forman a menos que tengan al menos 5 (<i>mingroup</i>) ítems. A fin de conocer el significado de los otros argumentos para este clasificador ejecute el comando <i>classinfo.pl AZCompactList</i>. Los programas <i>classinfo.pl</i> (para los clasificadores) y <i>pluginfo.pl</i> (para los plugins) son herramientas sumamente útiles para conocer las funciones de los módulos Greenstone. Fíjese además en la barra de directorios en el archivo de configuración, usada para indicar la continuación de la línea anterior.
341<p>
342
343La especificación de formato VList muestra la miniatura de la imagen con hipervínculos al documento asociado, seguida por el metadato <i>dc.Description</i>. El resultado se puede ver <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2\">aquí</a>. Las <i>Vlists</i> para los clasificadores utilizan <i>numleafdocs</i> para cambiar entre un icono que representa varios documentos (el cual aparecerá como un estante) y la miniatura, si sólo hay una imagen.
344
345<h3>El servidor OAI de Greenstone</h3>
346
347<p>
348Greenstone incorpora un servidor/proveedor de datos OAI.
349Se ejecuta mediante un programa CGI llamado \"oaiserver.cgi\", y se encuentra
350en el directorio <i>cgi-bin</i> de Greenstone. Se accede a él utilizando el mismo
351URL que para la biblioteca Greentone (reemplazando \"library.cgi\" por \"oaiserver.cgi\").
352Si usted está usando el servidor de biblioteca local, debe instalar un servidor
353web (como Apache) para poder ejecutar el servidor OAI.\n
354
355<p>
356La configuración del servidor se hace mediante el archivo <i>oai.cfg</i> que se
357encuentra en el directorio <i>etc</i> de Greenstone. Este fichero especifica la información
358general sobre el repositorio, e incluye un listado de las colecciones accesibles
359para los clientes OAI. En principio, las coleccciones no son accesibles. Para permitir
360el acceso a una colección, añada su nombre a la lista <i>oaicollection</i>. Las colecciones
361construidas con versiones de Greenstone anteriores a la 2.52 deben ser reconstruidas
362antes de que puedan ser accesibles.\n
363
364<p>
365El servidor OAI de Greenstone actualmente soporta Dublin Core, qualified Dublin Core y rfc1807. La línea <i>oaimetadata</i> especifica qué conjuntos deberían ser usados. Para las colecciones que usan otros conjuntos de metadatos, deben indicarse reglas de mapeo de metadatos para asociar los metadatos existentes con los esquemas utilizados. Vea el archivo <i>oai.cfg</i> para mayores detalles.\n
366"
367
368
369# -- Russian text ----------------
370collectionmeta collectionextra [l=ru] "
371Эта коллекция демонстрирует особенности <i>ImportFrom</i> Greenstone, используя <a href=http://www.openarchives.org>Открытый Архивный Протокол</a> OAI (версия 1.1). Она восстанавливает метаданные из <a href=http://rocky.dlib.vt.edu/~jcdlpix>rocky.dlib.vt.edu/~jcdlpix</a>, коллекцию фотографий, полученных при инаугурации <a href=http://www.acm.org/jcdl/jcdl01/>Объединенной Конференции по Цифровым Библиотекам</a>. Коллекция Greenstone построена по записям, экспортированным из этого OAI поставщика данных. Инструмент является достаточно гибким, чтобы справиться с незначительными синтаксическими различиями между версиями OAI 1.1 и OAI 2.0.
372<p>
373
374<h3>Как работает коллекция</h3>
375
376<a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>Конфигурационный файл</a> коллекции включает строку <i>импорт</i> (<i>acquire</i>), которая интерпретируется специальной программой, называемой <i>importfrom.pl</i>. Подобно другим программам Greenstone, она берет в качестве параметра название (имя) коллекции и использует резюме других параметров, когда запускается параметр <i>помощь</i> (<i>help</i>). Она считывает конфигурационный файл коллекции, находит строку импорта и обрабатывает её. В этом случае она запускается командой:
377<p>
378<pre>
379importfrom.pl oai-e
380</pre>\n
381где oai-e - имя коллекции.
382<p>
383
384
385Строка <i>acquire</i> в конфигурационном файле задает протокол OAI и выдает базовый адрес URL хранилища OAI. Программа <i>importfrom</i> выгружает все метаданные этого хранилища в директорию коллекции <i>import</i>. Параметр <i>getdoc</i> даёт команду выгружать документы из исходной коллекции, чьи URL приводятся в каждом поле документа идентификатора <i>Dublin Core</i> (это -- общее соглашение). Файлы метаданных, каждый из которых содержит XML-запись одного исходного документа, помещены в структуру файла <i>import</i> наряду с самими документами, и имя файла документа такое же, что и файла в URL. Поле <i>Identifier</i> переопределено, чтобы дать локальное имя файлу, а его первоначальное значение сохраняется в новом поле по имени <i>dc.OrigURL</i>.
386<p>
387
388<a href=\"_httpcollection_/etc/oai.txt\" target=oai.txt>Здесь</a> показан пример разгрузки файла метаданных.
389<p>
390
391Как только информация из ОAI импортирована, коллекция обрабатывается обычным способом. Конфигурационный файл определяет плагин OAI, который обрабатывает метаданные OAI, и плагин изображений, поскольку в этом случае документы исходной коллекции - это файлы изображений.
392<!-- _text1_ -->
393Besides the four standard plugins (GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin and DirectoryPlugin),
394the configuration file specifies the OAI plugin, which processes OAI
395metadata, and the image plugin, because in this case the collection\'s source
396documents are image files.
397Greenstone обычно определяет язык документов автоматически, но эти записи метаданных являются слишком небольшими для того, чтобы это сделать надежно: поэтому английский язык определен явно в параметре <i>языка</i> (<i>language</i>). Плагины ОAI анализируют метаданные и пересылают их к соответствующему файлу исходного документа, который затем обрабатывается соответствующим плагином -- в данном случае <i>ImagePlugin</i>. Этот плагин определяет различные версии разрешения изображения на экране.
398
399<p>
400<!--_text2_-->
401Extracted metadata from OAI records are mapped to Dublin Core Metadata Set by default.
402As a result, classifiers and indexes in this collection are built with Dublin meatadata elements.
403
404<p>
405<!-- _text4_ -->
406The <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>collection
407configuration file</a> has a single full-text index containing
408<i>dc.Description</i> metadata. When a document is displayed, the
409<i>DocumentHeading</i> format statement puts out its <i>dc.Subject</i>. Then the
410<i>DocumentText</i> statement follows this with <i>screenicon</i>, which is
411produced by <i>ImagePlugin</i> and gives a screen-resolution version of the
412image; it is hyperlinked to the <i>dc.OrigURL</i> metadata -- that is, the original
413version of the image on the remote OAI site. This is followed by the image\'s
414<i>dc.Description</i>, also with a hyperlink; the image\'s size and type, again
415generated as metadata by <i>ImagePlugin</i>; and then <i>dc.Subject</i>,
416<i>dc.Publisher</i>,
417and <i>dc.Rights</i> metadata.
418<a href=_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&cl=search&d=_sampleoid_>This</a>
419is the result.\n
420
421
422<p>
423Имеется два классификатора просмотра, один из которых основан на метаданных <i>Предмета</i>, а другой -- на метаданных <i>Описания</i>, но с иконкой, названной «Заголовки». Вспомните, что классификатор <i>AZCompactList</i> похож на <i>AZList</i>, но производит книжную полку для дубликатов элементов. В этой коллекции имеется много изображений, но лишь несколько из них имеют различные значения для метаданных <i>Предмета</i>.
424<p>
425
426Можно удивляться, что <i>AZCompactList</i> используется вместо <i>AZList</i> также для индекса <i>Описания</i> (<i>dc.Description</i>), потому что метаданные <i>Описания</i> обычно уникальны для каждого изображения. Однако в данной коллекции одно и то же описание иногда давалось нескольким изображениям, и некоторые из разделов <i>AZList</i> содержат большое число изображений, замедляя передачу этой страницы. Чтобы избежать этого, используется компактная версия списка с рядом параметров (<i>mincompact</i>, <i>maxcompact</i>, <i>mingroup</i>, <i>minnesting</i>), чтобы управлять показом -- Например, группы, (представленные книжными полками), не сформируются до тех пор, пока они не будут иметь по крайней мере 5 элементов (<i>mingroup</i>). Чтобы узнать значения других параметров для этого классификатора, выполните команду <i>classinfo.pl AZCompactList</i>. Программы <i>classinfo</i>.pl (для классификаторов) и <i>pluginfo.pl</i> (для плагинов) являются полезными инструментами, когда надо узнать о возможностях модулей Гринстоун. Обратите кстати внимание на обратный слеш в конфигурационном файле, используемый для указания на продолжение предыдущей строки.\n
427<p>
428
429Определение формата <i>VList</i> показывает уменьшенное изображение, имеющее гиперсвязь с исходным документом, в соответствии с метаданными <i>Описания</i>; результат чего можно видеть <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2\">здесь</a>. <i>Vlists</i> для классификаторов использует <i>numleafdocs</i> для переключения между иконками, представляющими несколько документов (который появится в виде книжной полки), и непосредственно уменьшенное изображение, если оно только одно.
430
431<h3>Greenstone OAI сервер</h3>
432
433<p>
434Greenstone отличается встроенным OAI поставщиком данных. Это запускается как CGI программа, называемая \"oaiserver.cgi\", и установлена в <i>cgi-bin</i> директории Greenstone. К этому можно обратиться через то же самый URL как библиотека Greenstone (заменяющий \"library.cgi\" с \"oaiserver.cgi\"). Если Вы используете Windows локальный сервер библиотеки, Вы должны установить web сервер (такой как Apache), чтобы управлять OAI сервером.
435
436<p>
437Конфигурация сервера сделана через <i>oai.cfg</i> файл в директории Greenstone. Этот файл определяет главную информацию о системе хранения, и списках коллекций, которые будут доступны для OAI клиентов. По умолчанию, коллекции не доступны. Чтобы включить колекцию, добавьте это название(имя) к списку <i>oaicollection</i>. Коллекции построенные с версиями Greenstone ранее чем 2.52 должны быть перестроены прежде они могут обслуживаться.
438
439<p>
440<!-- _text3_ -->
441<p>
442Greenstone's OAI server currently supports Dublin Core, qualified Dublin Core and rfc1807 metadata sets. The <i>oaimetadata</i> line specifies which sets should be used. For collections that use other metadata sets,
443metadata mapping rules should be provided to map the existing metadata
444to the sets in use. See the <i>oai.cfg</i> file for details.\n
445"
446
447# -- Simplified Chinese text ----------------
448collectionmeta collectionextra [l=zh] "
449本馆藏演示Greenstone的<i>ImportFrom</i>(导入)功能。通过使用
450<a href=http://www.openarchives.org>Open Archive Protocol(开放式存储协议)</a>(1.1版),Greenstone从
451<a href=http://rocky.dlib.vt.edu/~jcdlpix>rocky.dlib.vt.edu/~jcdlpix</a>检索元数据。这是一个关于照片的馆藏,这些照片
452摄于<a href=http://www.acm.org/jcdl/jcdl01/>Joint Conference on Digital Libraries(数字图书馆联合会员)</a>。
453在从OAI数据提供者导出的记录的基础上,构建一个Greenstone馆藏。这里的实现机制可以灵活地
454处理OAI 1.1与OAI 2.0之间细微的语法差别。\n
455
456<h3>本馆藏如何工作</h3>\n
457
458<p>
459<p>本馆藏的<a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>配置文件</a>包含一行<i>acquire</i>,
460这一行将由一个特别的程序<i>importfrom.pl</i>处理。与其他Greenstone程序类似,馆藏的名字将作为参数,
461而输入<i>-help</i>参数将显示其他参数的描述。该文件读入馆藏的配置文件,找到获取(acquire)行,并对其
462进行处理。此时它将运行以下命令\n
463<pre>
464importfrom.pl oai-e
465</pre>\n
466
467<p>
468(馆藏的名字是<i>oai-e</i>)。
469配置文件中的<i>acquire</i>行指定了OAI协议并给出了OAI存储的基准URL。<i>importfrom</i>程序
470下载该存储中的所有元数据并保存到馆藏的<i>import</i>目录。<i>getdoc</i>参数指定同时下载馆藏的
471源文档,而源文档的URL在文档都柏林核心元数据字段<i>Identifier</i>(标识符)中定义(这是约定俗成的
472设置)。每个元数据文件包含一个源文档的XML记录,这些元数据文件以及其源文件都保存在<i>import</i>
473文件目录中,而且源文档的文件名与URL中的文件名相同。<i>标识符</i>(Identifier)字段将被本地文件名重写,
474而其原始的值被保留在一个新的字段中:<i>OrigURL</i>字段。\n
475
476<p>
477<a href=\"_httpcollection_/etc/oai.txt\" target=oai.txt>这里</a>是一个已下载的元数据文件范例。\n
478
479<p>
480一旦OAI信息被成功导入,该馆藏将按通常的方式处理。在四个标准的插件
481(GreenstoneXMLPlugin、MetadataXMLPlugin、ArchivesInfPlugin与DirectoryPlugin)之外,
482配置文件还指定了用于处理OAI元数据的OAI插件,以及图片插件,因为此时馆藏的源文档是
483图片文件。OAI插件有一个<i>input_encoding</i>参数,因为本馆藏中包含扩展字符集。
484它还有一个<i>default_language</i>参数。Greenstone通常会自动判断文档的语种,但是这些元数据记录
485太小,不适合自动语种判断,因此用<i>language</i>参数来明确指定语种为英语。OAI插件处理这些元数据
486并将其传递给合适的源文档文件,而该文档文件又将被合适的插件所处理——此时是<i>ImagePlugin</i>。
487图像插件设置了图片屏幕版本的分辨率。\n
488
489<p>
490缺省情况下,从OAI记录中抽取出的元数据将被映射到都柏林核心元数据集。
491因此,馆藏中的分类器与索引都将基于都柏林元数据元素构建。
492
493<p>
494本馆藏的<a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>配置文件</a>
495只有一个包含了<i>dc.Description</i>(描述)元数据的全文索引。当显示一个文档时,
496<i>DocumentHeading</i>格式变量首先显示其<i>dc.Subject</i>。接下来其后的<i>DocumentText</i>
497变量中的<i>screenicon</i>给出了屏幕分辨率版本的图片,<i>screenicon</i>由<i>ImagePlugin</i>创建,
498且在此链接到<i>dc.OrigURL</i>元数据——也就是说,远程OAI网站上的原始版本图片。接下来是该图片的
499<i>dc.Description</i>,同样也有一个链接,图片的大小与类型,同样也是由<i>ImagePlugin</i>生成的元数据;
500以及然后的<i>dc.Subject</i>、<i>dc.Publisher</i>和<i>dc.Rights</i>元数据。
501<a href=_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&cl=search&d=_sampleoid_>这里</a>是格式后的例子。\n
502
503<p>
504这里有两个浏览分类器,一个以<i>dc.Subject</i>元数据为基础,另一个以<i>dc.Description</i>元数据为基础(但它对应的按钮名
505为\"标题\")。<i>AZCompactList</i>分类器与<i>AZList</i>相似,但会为重复条目创建一个书架。这个馆藏有很多图片,但只有几个不同的
506<i>dc.Subject</i>元数据值。\n
507
508<p>
509<i>AZCompactList</i>的使用(而不是<i>AZList</i>)让人感到有点惊讶,同样的对于<i>dc.Description</i>索引,因为<i>dc.Description</i>
510元数据通常对每个图片都是唯一的。然而,在这个馆藏中,有时候多个图片有着同一个描述,因此 <i>AZList</i>中的一些分组将包含很多图片,
511这降低了页面的传输速度。为了避免这一点,这里使用列表的压缩版,并为其设置了一些参数(<i>mincompact</i>、<i>maxcompact</i>、
512<i>mingroup</i>、<i>minnesting</i>)来控制显示——比如只有在超过5个条目(<i>mingroup</i>)的情况下创建分组(显示为书架)。若要了解
513本分类器其他选项的含义,可执行<i>classinfo.pl AZCompactList</i>命令。<i>classinfo.pl</i>程序(对于分类器)和<i>pluginfo.pl</i>程序(对于插件 )
514是了解Greenstone模块功能的由于工具。请注意配置文件中的反斜线,它们说明本行与前一行是一体的。
515
516<p>
517<i>VList</i>格式指定显示图片的缩略图,并链接到与之对应的文档上,接着显示<i>dc.Description</i>元数据,如
518<a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2\">这里</a>所示。分类器的<i>Vlists</i>使用<i>numleafdocs</i>来在表示多个
519文档的图标(即书架图标)与缩略图之间的切换,当只有一个图片时将显示缩略图。\n
520
521<h3>Greenstone OAI服务器</h3>\n
522
523<p>
524Greenstone有一个内置的OAI数据提供者。这是由一个称为\"oaiserver.cgi\"的CGI程序运行,并安装
525在Greenstone的<i>cgi-bin</i>目录中。它可通过与Greenstone图书馆相同的URL来访问(将\"library.cgi\"替换成\"oaiserver.cgi\")。如果你使用的
526是Windows本地服务器,则你必须安装一个web服务器(比如Apache)才能运行OAI服务器。\n
527
528<p>
529服务器的配置是通过Greenstone<i>etc</i>目录下的<i>oai.cfg</i>文件完成的。
530这个文件设置了存储的基本信息,并列出了OAI客户端可访问的馆藏。缺省情况下,馆藏是不可访问的。
531要使某个馆藏可通过OAI访问,将其名称添加到<i>oaicollection</i>列表中。Greenstone 2.52之前版本构建的馆藏
532必须在重新构建之后才可提供服务。\n
533
534<p>
535<p>服务器的配置是通过Greenstone<i>etc</i>目录下的<i>oai.cfg</i>文件完成的。
536这个文件设置了存储的基本信息,并列出了OAI客户端可访问的馆藏。缺省情况下,馆藏是不可访问的。
537要使某个馆藏可通过OAI访问,将其名称添加到<i>oaicollection</i>列表中。Greenstone 2.52之前版本构建的馆藏
538必须在重新构建之后才可提供服务。\n
539
540<p>Greenstone的OAI服务器目前支持都柏林核心元数据,限定性都柏林核心元数据以及rfc1807元数据集。
541<i>oaimetadata</i>行指定应被使用的元数据集。对于使用其他元数据集的馆藏,应该提供元数据映射规则将
542现有的元数据映射到使用的元数据集上。详细信息请参见<i>oai.cfg</i>文件。\n
543"
544
Note: See TracBrowser for help on using the repository browser.