root/collections/documented-examples/trunk/marc-e/etc/collect.cfg @ 19786

Revision 19786, 20.3 KB (checked in by anna, 10 years ago)

display English text where translations are missing.

  • Property svn:executable set to *
Line 
1creator     greenstone@cs.waikato.ac.nz
2maintainer  greenstone@cs.waikato.ac.nz
3public      true
4
5buildtype   mgpp
6
7indexes     text dc.Title
8defaultindex    text
9
10levels  document
11
12plugin  GreenstoneXMLPlugin
13plugin  MARCPlugin -OIDtype incremental
14plugin  MetadataXMLPlugin
15plugin  ArchivesInfPlugin
16plugin  DirectoryPlugin
17
18classify    AZList -metadata dc.Title -removesuffix \\s*(\\/|;|,|\\.).*
19classify    AZCompactList -metadata dc.Creator -removesuffix (b\\.\\s+)?(\\d+(\\-?))(\\d+(\\.)?)?
20classify    AZCompactList -metadata "dc.Subject"
21
22format VList "<td>[link][icon][/link]</td>
23<td>{If}{[numleafdocs],[Title],<b>[dc.Title]</b>{If}{[dc.Creator], [sibling:dc.Creator]}{If}{[dc.Publisher], <i>[dc.Publisher]</i>}}</td>{If}{[numleafdocs],<td><i>([numleafdocs])</i></td>}"
24
25#format CL2VList "<td>[link][icon][/link]</td><td>{If}{[numleafdocs],[Title],[dc.Creator]; <i>[dc.Title]</i>{If}{[dc.Publisher], <i>[dc.Publisher]</i>}}</td><td>{If}{[numleafdocs],<i>([numleafdocs])</i>}</td>"
26#format CL3VList "<td>[link][icon][/link]</td><td>{If}{[numleafdocs]{[Title],[dc.Title]{If}{[dc.Creator], [dc.Creator]}{If}{[dc.Publisher], [dc.Publisher]}}</td><td>{If}{[numleafdocs],<i>([numleafdocs])</i>}</td>"
27
28format HList "[link][highlight][ex.Title][/highlight][/link]"
29
30format DocumentHeading "[dc.Title]<br>"
31
32format DocumentText "[Text]"
33
34format DocumentButtons ""
35
36format SearchTypes "plain,form"
37
38collectionmeta  .text [l=en] "_labeltext_"
39collectionmeta  .Title [l=en] "_labelTitle_"
40collectionmeta  .Source [l=en] "_labelSource_"
41
42collectionmeta  sampleoid [l=en] "D0s156"
43
44# -- English strings ----------------
45collectionmeta  collectionname [l=en] "MARC example"
46
47# -- French strings ----------------
48collectionmeta  collectionname [l=fr] "Exemple MARC"
49
50# -- Spanish strings ----------------
51collectionmeta  collectionname [l=es] "Colección de muestra MARC"
52
53# -- Russian strings ----------------
54collectionmeta  collectionname [l=ru] "ПрОЌер MARC"
55
56# -- Simplified Chinese strings ----------------
57collectionmeta  collectionname [l=zh] "MARC瀺䟋銆藏"
58
59# -- English text ----------------
60collectionmeta  collectionextra [l=en] "This collection, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by
61<a href=\"http://www.cs.waikato.ac.nz\">Computer Science Department</a> at <a href=\"http://www.waikato.ac.nz\">the University of Waikato</a>.
62<a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&d=_sampleoid_\">Here</a> is a sample document in the collection.
63
64<h3>How the collection works</h3>\n
65
66<p>
67The <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>configuration file</a> uses <i>MARCPlugin</i> to process the MARC records, as well as the
68standard plugins. There are three classifiers, based on <i>dc.Title</i>,
69<i>dc.Creator</i>, and <i>dc.Subject</i> metadata. The <i>Title</i> classifier uses AZList, while the other two use AZCompactList, which groups items with the same metadata into a bookshelf. The <i>-removesuffix</i> argument for the <i>Title</i> and <i>Creator</i>
70classifiers removes suffixes from the metadata string (<i>dc.Title</i> and
71<i>dc.Creator</i> respectively). This is specified as a PERL regular
72expression, and trims characters (such as trailing punctuation)
73from the strings for display.
74<p>
75The <i>VList</i> format statement controls the display of search results and all classifiers. For bookshelves, the number of leaf documents is displayed on the right-hand side. For documents, <i>dc.Title</i> is displayed, along with <i>dc.Creator</i> and <i>dc.Publisher</i>. <i>[sibling:dc.Creator]</i> is used as dc.Creator has multiple values, and specifies that all values be output, not just the first one.
76<p>
77
78The MARC plugin uses a special file to map MARC field numbers to
79Greenstone-style metadata. This file resides in the
80<i>greenstone/etc</i> directory, and is called
81<a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>marc2dc.txt</a>.
82It lists the correspondences between MARC field numbers and Greenstone
83metadata. Any MARC fields that are not listed simply do not
84appear as metadata, though they are still present in the
85Greenstone document. Each line in the file has the format
86<blockquote>
87&lt;MARC field number&gt; -&gt; GreenstoneMetadataName
88</blockquote>
89Lines in the file that begin with \"\#\" are comments. \n
90<p>
91The standard version of this file is loosely based on
92the MARC to Dublin Core mapping found at <a
93href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>
94(which assumes USMARC/MARC21).
95<p>
96Multiple MARC fields may map to a single Dublin Core field.
97For example, fields 720 (\"Uncontrolled name\"), 100 (\"Personal name\"),
98110 (\"Corporate name\") and 111 (\"Meeting name\") all map to
99<i>dc.Creator</i>. Actual MARC records normally
100define only one of these fields, and anyway Greenstone allows
101multi-valued metadata.\n
102<p>
103Some mappings are dependent on subfields. For example, MARC field 260 contains
104information about publication and distribution. Subfields \"c\" (Date of Publication) and \"g\" (Date of manufacture) are mapped to <i>dc.Date</i>, using the following mapping line:
105<blockquote>
106260$c$g -&gt; dc.Date
107</blockquote>
108
109Greenstone also provides a file for mapping MARC to <b>qualified</b> dublin core: <a href=\"_httpprefix_/etc/marc2qdc.txt\" target=marc2qdc>greenstone/etc/marc2qdc.txt</a>. This can be used by the MARC plugin by setting the <i>-metadata_mapping_file</i> option to \"marc2qdc.txt\".
110"
111
112# -- French text ----------------
113collectionmeta  collectionextra [l=fr] "Cette collection, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by
114<a href=\"http://www.cs.waikato.ac.nz\">Computer Science Department</a> at <a href=\"http://www.waikato.ac.nz\">the University of Waikato</a>.
115<a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&d=_sampleoid_\">Voici</a> un document échantillon dans la collection.
116
117<h3>Comment marche cette collection ?</h3>
118
119<p>
120Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration</a> utilise <i>ZipPlug</i> et <i>MarcPlug</i> à coté des trois qui sont utilisés en standard.
121Il y a trois classificateurs basés sur les méta-données <i>dc.Title</i>, <i>dc.Creator</i> et <i>dc.Subject</i>. Le classificateur <i>dc.Title</i> est une liste AZList, alors que les deux autres sont des listes AZCompactList, qui regroupent les documents avec les mêmes métadonnées dans une étagÚre. L'argument <i>-removesuffix</i> pour les classificateurs <i>Title</i> et <i>Creator</i> supprime les suffixes de la chaîne des métadonnées (respectivement pour <i>dc.Title</i> et <i>dc.Creator</i>).
122Ceci est spécifié comme une expression
123réguliÚre de PERL et ajuste pour l\'affichage des caractÚres (comme une ponctuation finale).
124<p>
125La déclaration de format <i>VList</i> contrÎle l'affichage des résultats de recherche et de tous les classificateurs. Pour les étagÚres, le nombre de pages de documents est affiché sur le cÎté droit. Pour chaque document, <i>dc.Title</i> est affiché, ainsi que <i>dc.Creator</i> and <i>dc.Publisher</i>. <i>[sibling:dc.Creator]</i> est utilisé lorsque dc.Creator a plusieurs valeurs, et précise que toutes les valeurs doivent être affichées, et pas seulement la premiÚre.
126
127<p>
128Le module Marc utilise un fichier spécial pour la mise en correspondance des numéros de champ MARC avec les méta-donnée de type Greenstone. Ce fichier se trouve dans le répertoire <i>gsdl/etc</i>,
129et est appelé <a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>marc2dc.txt</a>. Il liste les correspondences entre les numéros de champ MARC et les méta-données Greenstone. Tous les champs MARC qui ne sont pas listés ne vont pas apparaître comme méta-données, bien qu\'ils spient toujours présents dans le document Greenstone. Chaque ligne dans le fichier à le format:
130
131<blockquote>
132&lt;numéro de champ MARC&gt; -&gt; NonMetadonnéeGreenstone
133</blockquote>
134
135Les lignes dans le fichier qui commence par \"\#\" sont des commentaires.
136
137<p>
138La version standard de ce fichier est approximativement basée sur la mise en correspondance MARC - Dublin Core trouvé à <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>
139(qui suppose USMARC/MARC21).
140Plusieurs champs MARC peuvent correspondre à un seul champ Dublin Core. Par exemple, les champs USMARC 720 (\"Uncontrolled name\"), 100 (\"Personal name\"), 110 (\"Corporate name\") et 111 (\"Meeting name\") correspondent tous à <i>dc.Creator</i>. Les notices MARC actuelles remplissent normalement un seul de ces champs, et dans tous les cas, Greenstone autorise ds champs de métadonnées à plusieurs valeurs. Certaines correspondances dépendent des sous-champs. Par exemple, le champs MARC 260 contient des informations sur la publication et la distribution des ouvrages. Les sous-champs \"c\" (Date de Publication) and \"g\" (Date de fabrication) sont mis en correspondance avec <i>dc.Date</i>, en utilisant la ligne suivante: <blockquote> 260$c$g     -&gt; dc.Date </blockquote> Greenstone fournit également un fichier pour établir la correspondance entre MARC et le Dublin Core <b>qualifié</b> : <a href=\"_httpprefix_/etc/marc2qdc.txt\" target=marc2qdc>greenstone/etc/marc2qdc.txt</a>. Cela peut être utilisé avec le plugiciel MARC en donnant la valeur \"marc2qdc.txt\" à l'option <i>-metadata_mapping_file</i>.
141"
142
143# -- Spanish text ----------------
144collectionmeta  collectionextra [l=es] "Esta colección, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by
145<a href=\"http://www.cs.waikato.ac.nz\">Computer Science Department</a> at <a href=\"http://www.waikato.ac.nz\">the University of Waikato</a>. He <a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&d=_sampleoid_\">aquí</a> un documento muestra de la colección.
146<p>
147
148<h3>Cómo trabaja esta colección</h3>
149<p>
150
151El <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>archivo de configuración</a> utiliza <i>MARCPlugin</i> además de los tres plugins estándar. Existen tres clasificadores basados en los metadatos <i>dc.Título</i>, <i>dc.Creador</i> y <i>dc.Asunto</i>. El clasificador <i>dc.Title</i> es una AZList, mientras que los otros dos son AZCompactList, que agrupa items con el mismo metadato en un \"estante\". El argumento <i>-removesuffix</i> para el clasificador por <i>Title</i> y por <i>Creator</i> remueve los sufijos de la cadena de caracteres (<i>dc.Title</i> y <i>dc.Creator</i> respectivamente). Esto se especifica como una expresión regular PERL y ordena los caracteres (como la puntuación que se encuentra al final) a partir de las cadenas para su presentación en pantalla.
152<p>
153La cadena de formateo <i>VList</i> controla la forma en la que se muestran los resultados y todos los clasificadores. Para los estantes, el número de documentos contenidos se muestra en la parte derecha. Para los documentos, se muestra el metadato <i>dc.Title</i>, junto al <i>dc.Creator</i> y el <i>dc.Publisher</i>. <i>[sibling:dc.Creator]</i> se utiliza debido a que dc.Creator tiene múltiples valores, y especifica que se deben mostrar todos los valores, no solamente el primero.
154
155<p>
156
157El plugin de MARC utiliza un archivo especial para mapear y convertir los números de campo MARC a metadatos estilo Greenstone. Este archivo reside en el directorio <i>gsdl/etc</i> y se llama <a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>marc2dc.txt</a>. Incluye una lista de las correspondencias entre los números de campo MARC y los metadatos Greenstone. Cualquier campo MARC que no esté incluido en la lista simplemente no aparece como metadato, aunque siga estando presente en el documento Greenstone. Cada línea del archivo tiene el siguiente formato:
158<p>
159
160<blockquote>
161&lt;MARC field number&gt; -&gt; GreenstoneMetadataName
162</blockquote>
163<p>
164
165Las líneas en el archivo que empiezan con \"\#\" son comentarios.
166<p>
167
168La versión estándar de este archivo se basa libremente en el mapeo de MARC a Dublin Core que se encuentra en <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a> (el cual asume USMARC/MARC21).
169
170Múltiples campos MARC pueden mapearse a un mismo campo Dublin Core.
171Por ejemplo, los campos 720 (\"Uncontrolled name\"), 100 (\"Personal name\"),
172110 (\"Corporate name\") y 111 (\"Meeting name\") mapean todos a <i>dc.Creator</i>. Los registros actuales de MARC normalmente definen solo uno de esos campos, pero de cualquier manera Greenstone permite metadatos multivalor. \n
173<p>
174Algunos mapeos dependen de los subcampos. Por ejemplo, el campo MARC 260 contiene información sobre la publicación y la distribución. Subcampos \"c\" (Date of Publication) y \"g\" (Date of manufacture) son mapeados a <i>dc.Date</i>, usando la siguiente linea de configuración:
175<blockquote>
176260$c$g -&gt; dc.Date
177</blockquote>
178
179Greenstone también provee un archivo para el mapeo de MARC a Dublin Core <b>cualificado</b>: <a href=\"_httpprefix_/etc/marc2qdc.txt\" target=marc2qdc>greenstone/etc/marc2qdc.txt</a>. Puede ser usado por el plugin de MARC configurando el parámetro <i>-metadata_mapping_file</i> con \"marc2qdc.txt\".
180"
181
182# -- Russian text ----------------
183collectionmeta  collectionextra [l=ru] "This collection, which contains _about:numdocs_ MARC entries, is based on the MARC records of working papers published by
184<a href=\"http://www.cs.waikato.ac.nz\">Computer Science Department</a> at <a href=\"http://www.waikato.ac.nz\">the University of Waikato</a>. <a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&d=_sampleoid_\">ЗЎесь</a> преЎставлеМ тОпПвПй ЎПкуЌеМт ЎаММПй кПллекцОО.
185
186<h3>Как рабПтает кПллекцОя</h3>
187<p>
188
189<a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>КПМфОгурацОПММый файл</a> ÐžÑÐ¿ÐŸÐ»ÑŒÐ·ÑƒÐµÑ‚ плагОМы <i>ZIPPlug</i> О <i>MARCPlug</i>, пПЌОЌП третьегП стаМЎарта. ИЌеются трО классОфОкатПра, ПсМПваММые Ма ЌетаЎаММых <i>НазваМОя (dc.Title)</i>, <i>СПзЎателя (dc.Creator)</i> О <i>ПреЎЌета (dc.Subject)</i>. <!-- _text1_ -->The <i>dc.Title</i> classifier is an AZList, while the other two are AZCompactList, which groups items with the same metadata into a bookshelf. The <i>-removesuffix</i> argument for the <i>Title</i> and <i>Creator</i>
190classifiers removes suffixes from the metadata string (<i>dc.Title</i> and
191<i>dc.Creator</i> respectively). ЭтП требует устаМПвкО PERL Ўля правОльМПгП выражеМОя, О урезает зМакО (тОпа кПМечМых Ð·ÐœÐ°ÐºÐŸÐ² препОМаМОя) Оз стрПкО Ўля ПтПбражеМОя.
192<p>
193<!-- _text2_ -->
194The <i>VList</i> format statement controls the display of search results and all classifiers. For bookshelves, the number of leaf documents is displayed on the right-hand side. For documents, <i>dc.Title</i> is displayed, along with <i>dc.Creator</i> and <i>dc.Publisher</i>. <i>[sibling:dc.Creator]</i> is used as dc.Creator has multiple values, and specifies that all values be output, not just the first one.
195<p>
196
197ПлагОМ MARC ОспПльзует спецОальМый файл Ўля сПпПставлеМОя МПЌера пПля в MARC О ЌетаЎаММых Greenstone. ЭтПт файл МахПЎОтся в ЎОректПрОО <i>gsdl/etc</i> О Мазывается <a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>marc2dc.txt</a>. ОМ преЎставляет спОсПк сППтветствОя ЌежЎу МПЌераЌО пПлей сОстеЌы MARC О ЌетаЎаММыЌО Greenstone. ᅵюбые пПля MARC, кПтПрые Ме вМесеМы в спОсПк, прПстП Ме пПявляются как ЌетаЎаММые, хПтя ПМО прОсутствуют в ЎПкуЌеМте Greenstone. КажЎая стрПка в этПЌ файле ОЌеет слеЎующОй фПрЌат.
198
199<blockquote>
200&lt;MARC field number&gt; -&gt; GreenstoneMetadataName
201</blockquote>
202СтрПкО в ЎаММПЌ файле, кПтПрые МачОМаются сП зМака \"\#\", являются кПЌЌеМтарОяЌО.
203<p>
204
205СтаМЎартМая версОя этПгП файла свПбПЎМП базОруется Ма MARC в ПпОсаМОО Dublin Core, кПтПрПе вПспрОМОЌает USMARC/MARC21 О кПтПрПе ЌПжМП МайтО Ма <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>.
206
207<!-- _text3_ -->
208Multiple MARC fields may map to a single Dublin Core field.
209For example, fields 720 (\"Uncontrolled name\"), 100 (\"Personal name\"),
210110 (\"Corporate name\") and  111 (\"Meeting name\") all map to
211<i>dc.Creator</i>. Actual MARC records normally
212define only one of these fields, and anyway Greenstone allows
213multi-valued metadata.\n
214<p>
215Some mappings are dependent on subfields. For example, MARC field 260 contains
216information about publication and distribution. Subfields \"c\" (Date of Publication) and \"g\" (Date of manufacture) are mapped to <i>dc.Date</i>, using the following mapping line:
217<blockquote>
218260$c$g     -&gt; dc.Date
219</blockquote>
220
221Greenstone also provides a file for mapping MARC to <b>qualified</b> dublin core: <a href=\"_httpprefix_/etc/marc2qdc.txt\" target=marc2qdc>greenstone/etc/marc2qdc.txt</a>. This can be used by the MARC plugin by setting the <i>-metadata_mapping_file</i> option to \"marc2qdc.txt\".
222"
223
224# -- Simplified Chinese text ----------------
225collectionmeta  collectionextra [l=zh] "
226本銆藏包含_about:numdocs_条MARC记圕是圚<a href=\"http://www.waikato.ac.nz\">怀卡托倧孊</a>
227<a href=\"http://www.cs.waikato.ac.nz\">计算机系</a>发衚的工䜜论文基础䞊构建的。
228<a href=\"_gwcgi_?l=_cgiargl_&a=d&c=_cgiargc_&d=HASH0127daf20f8b3eec5c5db834s9\">这里</a>是本銆藏䞭的䞀䞪瀺范文档。
229 
230<h3>本銆藏劂䜕工䜜</h3>\n
231 
232<p>本銆藏的<a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>配眮文件</a>䜿甚<i>MARCPlugin</i>来倄理MARC记圕
233还䜿甚了䞀些标准的插件。本銆藏有䞉䞪分类噚分别基于<i>dc.Title</i><i>dc.Creator</i>和<i>dc.Subject</i>元数据。<i>题名</i>
234分类噚䜿甚AZList而其他䞀䞪䜿甚AZCompactListAZCompactList将有着盞同元数据倌的记圕集䞭到䞀䞪乊架䞭。<i>题名</i>和<i>䜜者
235</i>分类噚的<i>-removesuffix</i>参数将删陀元数据字䞲䞭的前猀分别对应于<i>dc.Title</i>和<i>dc.Creator</i>字段。这是䞀䞪
236PERL正则衚蟟匏它将删陀掉䞀些字笊比劂结尟的标点笊号。
237 
238<p><i>VList</i>栌匏化参数控制搜玢结果和所有分类噚的倖观。对于乊架其䞭包含的文档数目将被星瀺圚右䟧。对于文档将星瀺<i>dc.Title</i>
239以及<i>dc.Creator</i>和<i>dc.Publisher</i>。<i>[sibling:dc.Creator]</i>甚于dc.Creator有倚䞪倌的情况它衚明星瀺所有倌而䞍仅仅是第䞀䞪倌。
240 
241<p>MARC插件䜿甚特殊的文件将MARC字段猖号映射到Greenstone栌匏的元数据。这䞪文件圚<i>greenstone/etc</i>目圕䞭叫做
242<a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>marc2dc.txt</a>。该文件列出了MARC字段猖号䞎Greenstone元数据字段闎的
243对应关系。任䜕没有列出的MARC字段郜䞍䌚映射䞺元数据尜管它们仍将出现圚Greenstone文档䞭。这䞪文件䞭的每䞀行郜遵埪以䞋栌匏
244<blockquote> 
245&lt;MARC field number&gt; -&gt; GreenstoneMetadataName
246</blockquote>
247所有以\"\#\"匀始的行郜是泚释行。\n
248 
249<p>这䞪文件以<a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>的MARC到郜柏林栞心元数据
250映射假讟USMARC/MARC21䞺倧臎基础。
251 
252<p>倚䞪MARC字段可胜需芁映射到䞀䞪郜柏林栞心元数据字段䞊。䟋劂字段720\"非受控题名\"100\"人名\"110\"机构名\"以及111
253\"䌚议名\"郜被映射䞺<i>dc.Creator</i>。实际MARC记圕通垞只定义这些䞭的䞀䞪字段而Greenstone也允讞䜿甚倚倌的元数据。\n
254 
255<p>有些映射取决于子字段。比劂MARC字段260包含关于出版䞎发垃的信息。子字段\"c\"出版日期和\"g\"制造商日期郜映射到<i>dc.Date</i>
256通过䜿甚以䞋的映射行
257<blockquote> 
258260$c$g     -&gt; dc.Date
259</blockquote>
260Greenstone还提䟛MARC到<b>限定的</b>郜柏林栞心元数据集的映射
261<a href=\"_httpprefix_/etc/marc2qdc.txt\" target=marc2qdc>greenstone/etc/marc2qdc.txt</a>。这需芁将MARC插件的
262<i>-metadata_mapping_file</i>选项讟定䞺\"marc2qdc.txt\"。
263"
Note: See TracBrowser for help on using the browser.