source: collections/documented-examples/trunk/marc-e/etc/collect.cfg@ 19691

Last change on this file since 19691 was 19691, checked in by anna, 12 years ago

Added French translations. Many thanks to Guillaume Hatt and John Rose.

  • Property svn:executable set to *
File size: 18.7 KB
Line 
1creator greenstone@cs.waikato.ac.nz
2maintainer greenstone@cs.waikato.ac.nz
3public true
4
5buildtype mgpp
6
7indexes text dc.Title
8defaultindex text
9
10levels document
11
12plugin GreenstoneXMLPlugin
13plugin MARCPlugin -OIDtype incremental
14plugin MetadataXMLPlugin
15plugin ArchivesInfPlugin
16plugin DirectoryPlugin
17
18classify AZList -metadata dc.Title -removesuffix \\s*(\\/|;|,|\\.).*
19classify AZCompactList -metadata dc.Creator -removesuffix (b\\.\\s+)?(\\d+(\\-?))(\\d+(\\.)?)?
20classify AZCompactList -metadata "dc.Subject"
21
22format VList "<td>[link][icon][/link]</td>
23<td>{If}{[numleafdocs],[Title],<b>[dc.Title]</b>{If}{[dc.Creator], [sibling:dc.Creator]}{If}{[dc.Publisher], <i>[dc.Publisher]</i>}}</td>{If}{[numleafdocs],<td><i>([numleafdocs])</i></td>}"
24
25#format CL2VList "<td>[link][icon][/link]</td><td>{If}{[numleafdocs],[Title],[dc.Creator]; <i>[dc.Title]</i>{If}{[dc.Publisher], <i>[dc.Publisher]</i>}}</td><td>{If}{[numleafdocs],<i>([numleafdocs])</i>}</td>"
26#format CL3VList "<td>[link][icon][/link]</td><td>{If}{[numleafdocs]{[Title],[dc.Title]{If}{[dc.Creator], [dc.Creator]}{If}{[dc.Publisher], [dc.Publisher]}}</td><td>{If}{[numleafdocs],<i>([numleafdocs])</i>}</td>"
27
28format HList "[link][highlight][ex.Title][/highlight][/link]"
29
30format DocumentHeading "[dc.Title]<br>"
31
32format DocumentText "[Text]"
33
34format DocumentButtons ""
35
36format SearchTypes "plain,form"
37
38collectionmeta .text [l=en] "_labeltext_"
39collectionmeta .Title [l=en] "_labelTitle_"
40collectionmeta .Source [l=en] "_labelSource_"
41
42collectionmeta sampleoid [l=en] "D0s156"
43
44# -- English strings ----------------
45collectionmeta collectionname [l=en] "MARC example"
46
47# -- French strings ----------------
48collectionmeta collectionname [l=fr] "Exemple MARC"
49
50# -- Spanish strings ----------------
51collectionmeta collectionname [l=es] "Colección de muestra MARC"
52
53# -- Russian strings ----------------
54collectionmeta collectionname [l=ru] "ПрОЌер MARC"
55
56# -- Simplified Chinese strings ----------------
57collectionmeta collectionname [l=zh] "MARC瀺䟋銆藏"
58
59# -- English text ----------------
60collectionmeta collectionextra [l=en] "This collection, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by
61<a href=\"http://www.cs.waikato.ac.nz\">Computer Science Department</a> at <a href=\"http://www.waikato.ac.nz\">the University of Waikato</a>.
62<a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&d=_sampleoid_\">Here</a> is a sample document in the collection.
63
64<h3>How the collection works</h3>\n
65
66<p>
67The <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>configuration file</a> uses <i>MARCPlugin</i> to process the MARC records, as well as the
68standard plugins. There are three classifiers, based on <i>dc.Title</i>,
69<i>dc.Creator</i>, and <i>dc.Subject</i> metadata. The <i>Title</i> classifier uses AZList, while the other two use AZCompactList, which groups items with the same metadata into a bookshelf. The <i>-removesuffix</i> argument for the <i>Title</i> and <i>Creator</i>
70classifiers removes suffixes from the metadata string (<i>dc.Title</i> and
71<i>dc.Creator</i> respectively). This is specified as a PERL regular
72expression, and trims characters (such as trailing punctuation)
73from the strings for display.
74<p>
75The <i>VList</i> format statement controls the display of search results and all classifiers. For bookshelves, the number of leaf documents is displayed on the right-hand side. For documents, <i>dc.Title</i> is displayed, along with <i>dc.Creator</i> and <i>dc.Publisher</i>. <i>[sibling:dc.Creator]</i> is used as dc.Creator has multiple values, and specifies that all values be output, not just the first one.
76<p>
77
78The MARC plugin uses a special file to map MARC field numbers to
79Greenstone-style metadata. This file resides in the
80<i>greenstone/etc</i> directory, and is called
81<a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>marc2dc.txt</a>.
82It lists the correspondences between MARC field numbers and Greenstone
83metadata. Any MARC fields that are not listed simply do not
84appear as metadata, though they are still present in the
85Greenstone document. Each line in the file has the format
86<blockquote>
87&lt;MARC field number&gt; -&gt; GreenstoneMetadataName
88</blockquote>
89Lines in the file that begin with \"\#\" are comments. \n
90<p>
91The standard version of this file is loosely based on
92the MARC to Dublin Core mapping found at <a
93href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>
94(which assumes USMARC/MARC21).
95<p>
96Multiple MARC fields may map to a single Dublin Core field.
97For example, fields 720 (\"Uncontrolled name\"), 100 (\"Personal name\"),
98110 (\"Corporate name\") and 111 (\"Meeting name\") all map to
99<i>dc.Creator</i>. Actual MARC records normally
100define only one of these fields, and anyway Greenstone allows
101multi-valued metadata.\n
102<p>
103Some mappings are dependent on subfields. For example, MARC field 260 contains
104information about publication and distribution. Subfields \"c\" (Date of Publication) and \"g\" (Date of manufacture) are mapped to <i>dc.Date</i>, using the following mapping line:
105<blockquote>
106260$c$g -&gt; dc.Date
107</blockquote>
108
109Greenstone also provides a file for mapping MARC to <b>qualified</b> dublin core: <a href=\"_httpprefix_/etc/marc2qdc.txt\" target=marc2qdc>greenstone/etc/marc2qdc.txt</a>. This can be used by the MARC plugin by setting the <i>-metadata_mapping_file</i> option to \"marc2qdc.txt\".
110"
111
112# -- French text ----------------
113collectionmeta collectionextra [l=fr] "Cette collection, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by
114<a href=\"http://www.cs.waikato.ac.nz\">Computer Science Department</a> at <a href=\"http://www.waikato.ac.nz\">the University of Waikato</a>.
115<a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&d=_sampleoid_\">Voici</a> un document échantillon dans la collection.
116
117<h3>Comment marche cette collection ?</h3>
118
119<p>
120Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration</a> utilise <i>ZipPlug</i> et <i>MarcPlug</i> à coté des trois qui sont utilisés en standard.
121Il y a trois classificateurs basés sur les méta-données <i>dc.Title</i>, <i>dc.Creator</i> et <i>dc.Subject</i>. Le classificateur <i>dc.Title</i> est une liste AZList, alors que les deux autres sont des listes AZCompactList, qui regroupent les documents avec les mêmes métadonnées dans une étagÚre. L'argument <i>-removesuffix</i> pour les classificateurs <i>Title</i> et <i>Creator</i> supprime les suffixes de la chaîne des métadonnées (respectivement pour <i>dc.Title</i> et <i>dc.Creator</i>).
122Ceci est spécifié comme une expression
123réguliÚre de PERL et ajuste pour l\'affichage des caractÚres (comme une ponctuation finale).
124<p>
125La déclaration de format <i>VList</i> contrÎle l'affichage des résultats de recherche et de tous les classificateurs. Pour les étagÚres, le nombre de pages de documents est affiché sur le cÎté droit. Pour chaque document, <i>dc.Title</i> est affiché, ainsi que <i>dc.Creator</i> and <i>dc.Publisher</i>. <i>[sibling:dc.Creator]</i> est utilisé lorsque dc.Creator a plusieurs valeurs, et précise que toutes les valeurs doivent être affichées, et pas seulement la premiÚre.
126
127<p>
128Le module Marc utilise un fichier spécial pour la mise en correspondance des numéros de champ MARC avec les méta-donnée de type Greenstone. Ce fichier se trouve dans le répertoire <i>gsdl/etc</i>,
129et est appelé <a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>marc2dc.txt</a>. Il liste les correspondences entre les numéros de champ MARC et les méta-données Greenstone. Tous les champs MARC qui ne sont pas listés ne vont pas apparaître comme méta-données, bien qu\'ils spient toujours présents dans le document Greenstone. Chaque ligne dans le fichier à le format:
130
131<blockquote>
132&lt;numéro de champ MARC&gt; -&gt; NonMetadonnéeGreenstone
133</blockquote>
134
135Les lignes dans le fichier qui commence par \"\#\" sont des commentaires.
136
137<p>
138La version standard de ce fichier est approximativement basée sur la mise en correspondance MARC - Dublin Core trouvé à <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>
139(qui suppose USMARC/MARC21).
140Plusieurs champs MARC peuvent correspondre à un seul champ Dublin Core. Par exemple, les champs USMARC 720 (\"Uncontrolled name\"), 100 (\"Personal name\"), 110 (\"Corporate name\") et 111 (\"Meeting name\") correspondent tous à <i>dc.Creator</i>. Les notices MARC actuelles remplissent normalement un seul de ces champs, et dans tous les cas, Greenstone autorise ds champs de métadonnées à plusieurs valeurs. Certaines correspondances dépendent des sous-champs. Par exemple, le champs MARC 260 contient des informations sur la publication et la distribution des ouvrages. Les sous-champs \"c\" (Date de Publication) and \"g\" (Date de fabrication) sont mis en correspondance avec <i>dc.Date</i>, en utilisant la ligne suivante: <blockquote> 260$c$g -&gt; dc.Date </blockquote> Greenstone fournit également un fichier pour établir la correspondance entre MARC et le Dublin Core <b>qualifié</b> : <a href=\"_httpprefix_/etc/marc2qdc.txt\" target=marc2qdc>greenstone/etc/marc2qdc.txt</a>. Cela peut être utilisé avec le plugiciel MARC en donnant la valeur \"marc2qdc.txt\" à l'option <i>-metadata_mapping_file</i>.
141"
142
143# -- Spanish text ----------------
144collectionmeta collectionextra [l=es] "Esta colección, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by
145<a href=\"http://www.cs.waikato.ac.nz\">Computer Science Department</a> at <a href=\"http://www.waikato.ac.nz\">the University of Waikato</a>. He <a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&d=_sampleoid_\">aquí</a> un documento muestra de la colección.
146<p>
147
148<h3>Cómo trabaja esta colección</h3>
149<p>
150
151El <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>archivo de configuración</a> utiliza <i>MARCPlugin</i> además de los tres plugins estándar. Existen tres clasificadores basados en los metadatos <i>dc.Título</i>, <i>dc.Creador</i> y <i>dc.Asunto</i>. El clasificador <i>dc.Title</i> es una AZList, mientras que los otros dos son AZCompactList, que agrupa items con el mismo metadato en un \"estante\". El argumento <i>-removesuffix</i> para el clasificador por <i>Title</i> y por <i>Creator</i> remueve los sufijos de la cadena de caracteres (<i>dc.Title</i> y <i>dc.Creator</i> respectivamente). Esto se especifica como una expresión regular PERL y ordena los caracteres (como la puntuación que se encuentra al final) a partir de las cadenas para su presentación en pantalla.
152<p>
153La cadena de formateo <i>VList</i> controla la forma en la que se muestran los resultados y todos los clasificadores. Para los estantes, el número de documentos contenidos se muestra en la parte derecha. Para los documentos, se muestra el metadato <i>dc.Title</i>, junto al <i>dc.Creator</i> y el <i>dc.Publisher</i>. <i>[sibling:dc.Creator]</i> se utiliza debido a que dc.Creator tiene múltiples valores, y especifica que se deben mostrar todos los valores, no solamente el primero.
154
155<p>
156
157El plugin de MARC utiliza un archivo especial para mapear y convertir los números de campo MARC a metadatos estilo Greenstone. Este archivo reside en el directorio <i>gsdl/etc</i> y se llama <a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>marc2dc.txt</a>. Incluye una lista de las correspondencias entre los números de campo MARC y los metadatos Greenstone. Cualquier campo MARC que no esté incluido en la lista simplemente no aparece como metadato, aunque siga estando presente en el documento Greenstone. Cada línea del archivo tiene el siguiente formato:
158<p>
159
160<blockquote>
161&lt;MARC field number&gt; -&gt; GreenstoneMetadataName
162</blockquote>
163<p>
164
165Las líneas en el archivo que empiezan con \"\#\" son comentarios.
166<p>
167
168La versión estándar de este archivo se basa libremente en el mapeo de MARC a Dublin Core que se encuentra en <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a> (el cual asume USMARC/MARC21).
169
170Múltiples campos MARC pueden mapearse a un mismo campo Dublin Core.
171Por ejemplo, los campos 720 (\"Uncontrolled name\"), 100 (\"Personal name\"),
172110 (\"Corporate name\") y 111 (\"Meeting name\") mapean todos a <i>dc.Creator</i>. Los registros actuales de MARC normalmente definen solo uno de esos campos, pero de cualquier manera Greenstone permite metadatos multivalor. \n
173<p>
174Algunos mapeos dependen de los subcampos. Por ejemplo, el campo MARC 260 contiene información sobre la publicación y la distribución. Subcampos \"c\" (Date of Publication) y \"g\" (Date of manufacture) son mapeados a <i>dc.Date</i>, usando la siguiente linea de configuración:
175<blockquote>
176260$c$g -&gt; dc.Date
177</blockquote>
178
179Greenstone también provee un archivo para el mapeo de MARC a Dublin Core <b>cualificado</b>: <a href=\"_httpprefix_/etc/marc2qdc.txt\" target=marc2qdc>greenstone/etc/marc2qdc.txt</a>. Puede ser usado por el plugin de MARC configurando el parámetro <i>-metadata_mapping_file</i> con \"marc2qdc.txt\".
180"
181
182# -- Russian text ----------------
183collectionmeta collectionextra [l=ru] "This collection, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by
184<a href=\"http://www.cs.waikato.ac.nz\">Computer Science Department</a> at <a href=\"http://www.waikato.ac.nz\">the University of Waikato</a>. <a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&d=_sampleoid_\">ЗЎесь</a> преЎставлеМ тОпПвПй ЎПкуЌеМт ЎаММПй кПллекцОО.
185
186<h3>Как рабПтает кПллекцОя</h3>
187<p>
188
189<a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>КПМфОгурацОПММый файл</a> ОспПльзует плагОМы <i>ZIPPlug</i> О <i>MARCPlug</i>, пПЌОЌП третьегП стаМЎарта. ИЌеются трО классОфОкатПра, ПсМПваММые Ма ЌетаЎаММых
190 <i>НазваМОя (dc.Title)</i>, <i>СПзЎателя (dc.Creator)</i> О <i>ПреЎЌета (dc.Subject)</i>. <!-- _text1_ --> ЭтП требует устаМПвкО PERL Ўля правОльМПгП выражеМОя, О урезает зМакО (тОпа кПМечМых
191 зМакПв препОМаМОя) Оз стрПкО Ўля ПтПбражеМОя.
192<p>
193<!-- _text2_ -->
194<p>
195
196ПлагОМ MARC ОспПльзует спецОальМый файл Ўля сПпПставлеМОя МПЌера пПля в MARC О ЌетаЎаММых
197 Greenstone. ЭтПт файл Мах
198ПЎОтся в ЎОректПрОО <i>gsdl/etc</i> О Мазывается <a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>marc2dc.txt</a>. ОМ преЎставляет спОсПк сППтветствОя ЌежЎу МПЌераЌО пПлей сОстеЌы MARC О ЌетаЎаММыЌО Greenstone. ᅵюбые пПля MARC, кПтПрые Ме вМесеМы в спОсПк, прПстП Ме пПявляются как ЌетаЎаММые, х
199Птя ПМО прОсутствуют в ЎПкуЌеМте Greenstone. КажЎая стрПка в этПЌ файле ОЌеет слеЎующОй фПрЌат.
200
201<blockquote>
202&lt;MARC field number&gt; -&gt; GreenstoneMetadataName
203</blockquote>
204СтрПкО в ЎаММПЌ файле, кПтПрые МачОМаются сП зМака \"\#\", являются кПЌЌеМтарОяЌО.
205<p>
206
207СтаМЎартМая версОя этПгП файла свПбПЎМП базОруется Ма MARC в ПпОсаМОО Dublin Core, кПтПрПе вПспрОМОЌает USMARC/MARC21 О кПтПрПе ЌПжМП МайтО Ма <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>.
208
209<!-- _text3_ -->
210"
211
212# -- Simplified Chinese text ----------------
213collectionmeta collectionextra [l=zh] "
214本銆藏包
215含_about:numdocs_条MARC记圕是圚<a href=\"http://www.waikato.ac.nz\">怀卡托倧孊</a>
216<a href=\"http://www.cs.waikato.ac.nz\">计算机系</a>发衚的工䜜论文基础䞊构建的。
217<a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&d=HASH0127daf20f8b3eec5c5db834s9\">这里</a>是本銆藏䞭的䞀䞪瀺范文档。
218
219<h3>本銆藏劂䜕工䜜</h3>\n
220
221<p>本銆藏的<a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>é…
222çœ®æ–‡ä»¶</a>䜿甚<i>MARCPlugin</i>来倄理MARC记圕
223还䜿甚了䞀些标准的插件。本銆藏有䞉䞪分类噚分别基于<i>dc.Title</i><i>dc.Creator</i>和<i>dc.Subject</i>å…
224ƒæ•°æ®ã€‚<i>题名</i>
225分类噚䜿甚AZList而å…
226¶ä»–䞀䞪䜿甚AZCompactListAZCompactList将有着盞同å…
227ƒæ•°æ®å€Œçš„记圕集䞭到䞀䞪乊架䞭。<i>题名</i>和<i>䜜者
228
229</i>分类噚的<i>-removesuffix</i>参数将删陀å…
230ƒæ•°æ®å­—䞲䞭的前猀分别对应于<i>dc.Title</i>和<i>dc.Creator</i>字段。这是䞀䞪
231PERL正则衚蟟匏它将删陀掉䞀些字笊比劂结尟的标点笊号。
232
233<p><i>VList</i>栌匏化参数控制搜玢结果和所有分类噚的倖观。对于乊架å…
234¶äž­åŒ…
235含的文档数目将被星瀺圚右䟧。对于文档将星瀺<i>dc.Title</i>
236以及<i>dc.Creator</i>和<i>dc.Publisher</i>。<i>[sibling:dc.Creator]</i>甚于dc.Creator有倚䞪倌的情
237况它衚明星瀺所有倌而䞍仅
238仅
239是第䞀䞪倌。
240
241<p>MARC插件䜿甚特殊的文件将MARC字段猖号映射到Greenstone栌匏的å…
242ƒæ•°æ®ã€‚这䞪文件圚<i>greenstone/etc</i>目圕䞭叫做
243<a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>marc2dc.txt</a>。该文件列出了MARC字段猖号䞎Greenstoneå…
244ƒæ•°æ®å­—段闎的
245对应å…
246³ç³»ã€‚任䜕没有列出的MARC字段郜䞍䌚映射䞺å…
247ƒæ•°æ®ïŒŒå°œç®¡å®ƒä»¬ä»å°†å‡ºçŽ°åœšGreenstone文档䞭。这䞪文件䞭的每䞀行郜遵埪以䞋栌匏
248<blockquote>
249&lt;MARC field number&gt; -&gt; GreenstoneMetadataName
250</blockquote>
251所有以\"\#\"匀始的行郜是泚释行。\n
252
253<p>这䞪文件以<a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>的MARC到郜柏林栞心å…
254ƒæ•°æ®
255映射假讟USMARC/MARC21䞺倧臎基础。
256
257<p>倚䞪MARC字段可胜需芁映射到䞀䞪郜柏林栞心å…
258ƒæ•°æ®å­—段䞊。䟋劂字段720\"非受控题名\"100\"人名\"110\"机构名\"以及111
259\"䌚议名\"郜被映射䞺<i>dc.Creator</i>。实际
260MARC记圕通垞只定义这些䞭的䞀䞪字段而Greenstone也å…
261è®žäœ¿ç”šå€šå€Œçš„å…
262ƒæ•°æ®ã€‚\n
263
264<p>有些映射取决于子字段。比劂MARC字段260包
265含å…
266³äºŽå‡ºç‰ˆäžŽå‘垃的信息。子字段\"c\"出版日期和\"g\"制造商日期郜映射到<i>dc.Date</i>
267通过䜿甚以䞋的映射行
268<blockquote>
269260$c$g -&gt; dc.Date
270</blockquote>
271Greenstone还提䟛MARC到<b>限定的</b>郜柏林栞心å…
272ƒæ•°æ®é›†çš„映射
273<a href=\"_httpprefix_/etc/marc2qdc.txt\" target=marc2qdc>greenstone/etc/marc2qdc.txt</a>。这需芁将MARC插件的
274<i>-metadata_mapping_file</i>选项讟定䞺\"marc2qdc.txt\"。
275"
Note: See TracBrowser for help on using the repository browser.