Changeset 19249 for collections


Ignore:
Timestamp:
2009-04-24T10:17:58+12:00 (15 years ago)
Author:
kjdon
Message:

updated description for 2.82

File:
1 edited

Legend:

Unmodified
Added
Removed
  • collections/documented-examples/trunk/marc-e/etc/collect.cfg

    r19209 r19249  
    8383<MARC field number> -> GreenstoneMetadataName
    8484</blockquote>
    85 Lines in the file that begin with \"\#\" are comments (however, comments
    86 have been stripped out of the listing below).\n
     85Lines in the file that begin with \"\#\" are comments. \n
    8786<p>
    8887The standard version of this file is loosely based on
     
    9089href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>
    9190(which assumes USMARC/MARC21).
    92 
    93 ** delete the rest and talk about
    94 multiple marc fields map to one dc. eg creator
    95 some deoendent on subfields
    96 mar2qdc
    97 write own and put in collection
    98 
    99 , and contains these lines:\n
    10091<p>
    101 <a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>greenstone/etc/marc2dc.txt</a>
    102 <br>\n
    103 651, 662 -&gt; dc.Coverage
    104 <br>\n
    105 751, 752 -&gt; dc.Coverage
    106 <br>\n
    107 720 -&gt; dc.Creator
    108 <br>\n
    109 100, 110, 111   -&gt; dc.Creator
    110 <br>\n
    111 700, 710, 711 -&gt; dc.Creator
    112 <br>\n
    113 260$c$g     -&gt; dc.Date
    114 <br>\n
    115 500-505, 507-529 -&gt; dc.Description
    116 <br>\n
    117 531-539, 541-545, 547-599 -&gt; dc.Description
    118 <br>\n
    119 340 -&gt; dc.Format
    120 <br>\n
    121 856$q -&gt; dc.Format
    122 <br>\n
    123 020$a, 022$a, 024$a  -&gt; dc.Identifier
    124 <br>\n
    125 856$q -&gt; dc.Identifier
    126 <br>\n
    127 041$a$b$d$e$f$g$h$j -&gt; dc.Language
    128 <br>\n
    129 546 -&gt; dc.Language
    130 <br>\n
    131 260$a$b -&gt; dc.Publisher
    132 <br>\n
    133 787$o$t -&gt; dc.Relation
    134 <br>\n
    135 530, 760-785 -&gt; dc.Relation
    136 <br>\n
    137 506, 540 -&gt; dc.Rights
    138 <br>\n
    139 786$o$t -&gt; dc.Source
    140 <br>\n
    141 534$t -&gt; dc.Source
    142 <br>\n
    143 600, 610, 611, 630, 650, 653 -&gt; dc.Subject
    144 <br>\n
    145 245, 246    -&gt; dc.Title
    146 <br>\n
    147 655 -&gt; dc.Type
    148 \n
    149 
    150 <p>
    151 
    152 Several different MARC fields are mapped on to Dublin Core <i>dc.Creator</i>.
    153 Field 720 is \"Uncontrolled name,\" 100 is \"Personal name,\" 110 is
    154 \"Corporate name,\" 111 is \"Meeting name.\" Actual MARC records normally
     92Multiple MARC fields may map to a single Dublin Core field.
     93For example, fields 720 (\"Uncontrolled name\"), 100 (\"Personal name\"),
     94110 (\"Corporate name\") and  111 (\"Meeting name\") all map to
     95<i>dc.Creator</i>. Actual MARC records normally
    15596define only one of these fields, and anyway Greenstone allows
    15697multi-valued metadata.\n
    15798<p>
    158 MARC field 520 (\"Summary, note\") is mapped to
    159 Dublin Core <i>Description</i>; field 856 (\"Electronic location\") is mapped to
    160 <i>URL</i>; field 787 (\"Nonspecific relationship note\") to Relation; field 540
    161 (\"Reproduction note\") to <i>Rights</i>; field 245 (\"Title statement\") to
    162 <i>dc.Title</i>; field 655 (\"Index term - genre/form\") to <i>Type</i>. Both fields 650
    163 (\"Subject: topical term\") and 653 (\"Index term: uncontrolled\") are
    164 mapped to <i>dc.Subject</i>.\n
    165 <p>
    166 MARC field 024 (\"Identifier\") is not mapped to Greenstone metadata,
    167 because Greenstone uses its own <i>Identifier</i> metadata; instead it is
    168 mapped to a different Greenstone metadata element called
    169 <i>MarcIdentifier</i>. Likewise field 786 (\"Data source entry\") is not mapped
    170 to <i>Source</i>, because Greenstone has <i>Source</i> metadata, but to a new
    171 metadata field called <i>MarcSource</i> instead; and field 546 (\"Language\") is
    172 mapped to <i>MarcLanguage</i>.\n
    173 <p>
    174 Some MARC fields with Dublin Core
    175 counterparts are simply ignored, e.g. 620 (<i>Contributor</i>) and 500
    176 (<i>Coverage</i>). MARC field 260 is called \"Publication, etc\") and is mapped
    177 in its entirety to <i>Publisher</i>. In fact, field 260c (a subfield) is
    178 supposed to be publication date, but is not mapped as such.\n
    179 <p>
    180 Of course, different mappings can be defined by altering the above
    181 file-which allows the MARC plugin to support other variants of the MARC
    182 format. The plugin does not recognize individual MARC subfields: it
    183 simply concatenates them together. However, enhancing it to deal
    184 appropriately with subfields would not be a difficult job: it would
    185 involve altering a couple of pages of PERL code in the MARC plugin.
     99Some mappings are dependent on subfields. For example, MARC field 260 contains
     100information about publication and distribution. Subfields \"c\" (Date of Publication) and \"g\" (Date of manufacture) are mapped to <i>dc.Date</i>, using the following mapping line:
     101<blockquote>
     102260$c$g     -&gt; dc.Date
     103</blockquote>
     104
     105Greenstone also provides a file for mapping MARC to <b>qualified</b> dublin core: <a href=\"_httpprefix_/etc/marc2qdc.txt\" target=marc2qdc>greenstone/etc/marc2qdc.txt</a>. This can be used by the MARC plugin by setting the <i>-metadata_mapping_file</i> option to \"marc2qdc.txt\".
    186106"
    187107
     
    209129</blockquote>
    210130
    211 Les lignes dans le fichier qui commence par \"\#\" sont des commentaires (cependant, les commentaires ont été enlevées du listing ci-dessous).
     131Les lignes dans le fichier qui commence par \"\#\" sont des commentaires.
    212132
    213133<p>
    214134La version standard de ce fichier est approximativement basée sur la mise en correspondance MARC - Dublin Core trouvé à <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>
    215 (qui suppose USMARC/MARC21), et contient ces lignes :
    216 <p>
    217 <a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>gsdl/etc/marc2dc.txt</a>
    218 <br>
    219 720 -&gt; dc.Creator
    220 <br>
    221 100 -&gt; dc.Creator
    222 <br>
    223 110 -&gt; dc.Creator
    224 <br>
    225 111 -&gt; dc.Creator
    226 <br>
    227 520 -&gt; Description
    228 <br>
    229 856 -&gt; URL
    230 <br>
    231 260 -&gt; Publisher
    232 <br>
    233 787 -&gt; Relation
    234 <br>
    235 540 -&gt; Rights
    236 <br>
    237 024 -&gt; MarcIdentifier
    238 <br>
    239 786 -&gt; MarcSource
    240 <br>
    241 546 -&gt; MarcLanguage
    242 <br>
    243 650 -&gt; dc.Subject
    244 <br>
    245 653 -&gt; dc.Subject
    246 <br>
    247 245 -&gt; dc.Title
    248 <br>
    249 655 -&gt; Type
    250 
    251 <p>
    252 Plusieurs champs MARC mis en correspodance avec <i>dc.Creator</i> de Dublin Core. Le champ 720 est \"Uncontrolled name,\" 100 est \"Personal Name,\" 110 est \"Corporate Name,\" 111 est \"Meeting Name.\" Les enregistrements MARC actuels définissent normallement seulement un de ces champs, et de toutes les façons Greenstone permet des méta-données à valeurs multiples.
    253 
    254 <p>
    255 Le champ MARC520 (\"Summary note\") est mis en correspodance avec <i>Description</i> de Dublin Core; le champ 856 (\"Electronic location\") mis en correspondance avec <i>URL</i>; champ 787 (\"Nonspecific relationship note\") avec <i>Relation</i>; le champ 540 (\"Reproduction note\") avec <i>Rights</i>; le champ 245 (\"Title statement\") avec <i>dc.Title</i> ; le champ 655 (\"Index term-genre/form\") avec <i>Type</i>. Les deux champs 650 (\"Subject: topical term\") et 653 (\"Index term: incontrolled\")
    256 sont mis en correspondance avec <i>dc.Subject</i>.
    257 
    258 <p>
    259 Le champ MARC 024 (\"Identifier\") n\'est pas mis en correspondance avec avec des méta-données Greenstone parce que Greenstone utilise sa propre méta-donnée <i>Identifier</i>; à la place il est mis en correspondance avec autre méta-donnée Greenstone appelée <i>MarcIdentifier</i>. De même, le champ 786 (\"Data source entry\") n\'est pas mis en correspodance avec <i>Source</i>, parce que Greenstone a une méta-donnée <i>Source</i>, mais avec un nouveau champ de méta-donnée applelé <i>MarcSource</i>; et le champ 546 (\"Language\") est mis en correspondance avec <i>MarcLanguage</i>.
    260 
    261 <p>
    262 Quelques champs MARC avec des correspondances Dublin Core sont tout simplement ignorés, p. ex: 620 (<i>Contributor</i>) et 500 (<i>Coverage</i>). Le champ MARC 260 est appelé \"Publication, etc\"
    263 et est mis en correspondance dans sa globalité avec <i>Publisher</i>. En fait, le champ 260c (un \"sous-champ\") est supposé être une date de publication mais n\'est pas mis en correspondance comme tel.
    264 
    265 <p>
    266 Naturellement, plusieurs mises en correspondances peuvent être définies en modifiant les fichiers ci-dessus, ce qui permet au plugin MARC de supporter les autres variantes du format MARC.
    267 Le plugin ne reconnaît pas les sous-champs MARC: Il les concatÚne tout simplement.
    268 Cependant, l\'améliorer pour traiter convenablement avec les sous-champs ne devrait pas être un travail difficile: cela impliquerait la modification de quelques pages de code PERL dans
    269 le plugin Marc.
     135(qui suppose USMARC/MARC21).
     136_text3_
    270137"
    271138
     
    292159<p>
    293160
    294 Las líneas en el archivo que empiezan con \"\#\" son comentarios. (Los comentarios no han sido incluidos en la lista que aparece más abajo).
     161Las líneas en el archivo que empiezan con \"\#\" son comentarios.
    295162<p>
    296163
    297 La versión estándar de este archivo se basa libremente en el mapeo de MARC a Dublin Core que se encuentra en <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a> (el cual asume USMARC/MARC21) y contiene las siguientes líneas:
    298 <p>
     164La versión estándar de este archivo se basa libremente en el mapeo de MARC a Dublin Core que se encuentra en <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a> (el cual asume USMARC/MARC21).
    299165
    300 <a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>gsdl/etc/marc2dc.txt</a>
    301 <br>\n
    302 720 -&gt; dc.Creator
    303 <br>\n
    304 100 -&gt; dc.Creator
    305 <br>\n
    306 110 -&gt; dc.Creator
    307 <br>\n
    308 111 -&gt; dc.Creator
    309 <br>\n
    310 520 -&gt; Description
    311 <br>\n
    312 856 -&gt; URL
    313 <br>\n
    314 260 -&gt; Publisher
    315 <br>\n
    316 787 -&gt; Relation
    317 <br>\n
    318 540 -&gt; Rights
    319 <br>\n
    320 024 -&gt; MarcIdentifier
    321 <br>\n
    322 786 -&gt; MarcSource
    323 <br>\n
    324 546 -&gt; MarcLanguage
    325 <br>\n
    326 650 -&gt; dc.Subject
    327 <br>\n
    328 653 -&gt; dc.Subject
    329 <br>\n
    330 245 -&gt; dc.Title
    331 <br>\n
    332 655 -&gt; Type\n
    333 <p>
    334 
    335 
    336 Varios campos MARC diferentes han sido mapeados hacia el metadato <i>dc.Creator</i> (Creador) de Dublin Core. El campo 720 es \"nombre no controlado\", el 100 es \"nombre de la persona\", el 110 es \"nombre de la compañía\" y el 111 es \"nombre de la reunión\". Por lo general los registros MARC únicamente definen uno de estos campos y de cualquier manera Greenstone permite metadatos con múltiples valores.
    337 <p>
    338 
    339 El campo 520 de MARC (\"Resumen, nota\") ha sido mapeado hacia el metadato <i>Description</i> (Descripción) de Dublin Core; el campo 856 (\"Dirección electrónica\") ha sido mapeado hacia URL; el campo 787 (\"Nota de relación no específica\") hacia <i>Relation</i> (Relación); el campo 540 (\"nota sobre la reproducción\") hacia <i>Rights</i> (Derechos de autor); el campo 245 (\"enunciado del título\") hacia <i>dc.Title</i> (Título); el campo 655 (\"término del índice - género/forma\") hacia <i>Type</i> (Tipo). Los campos 650 (\"Asunto: tópico\") y 653 (\"término del índice: no controlado\") han sido mapeados hacia <i>dc.Subject</i> (Asunto).
    340 <p>
    341 
    342 El campo 024 de MARC (\"Identificador\") no ha sido mapeado hacia un metadato de Greenstone, ya que Greenstone utiliza su propio metadato <i>Identificador</i>. En vez de eso ha sido mapeado hacia un elemento de metadato Greenstone diferente llamado <i>MarcIdentifier</i>. Del mismo modo el campo 786 (\"Entrada de la fuente del dato\") no ha sido mapeado hacia <i>Source</i> (Fuente), ya que Greenstone tiene su propio metadato <i>Fuente</i>, sino a un nuevo campo llamado <i>MarcSource</i>; y el campo 546 (\"Idioma\") ha sido mapeado hacia <i>MarcLanguage</i>.
    343 <p>
    344 
    345 Algunos campos MARC con contraparte en Dublin Core simplemente se han ignorado, p. ej. el 620 (<i>Colaborador</i>) y 500 (<i>Cobertura</i>). El campo 260 de MARC se llama \"Publicación, etc.\" y ha sido mapeado en su totalidad hacia <i>Editorial</i>. De hecho, se supone que el campo 260c (un subcampo) es la fecha de publicación, pero no se ha mapeado como tal.
    346 <p>
    347 
    348 Sin duda se pueden definir diferentes mapeos alterando los archivos que se indican arriba y que le permiten al plugin de MARC dar soporte a otras variantes del formato MARC. El plugin no reconoce subcampos MARC individuales, simplemente los concatena. Sin embargo, mejorarlo para que trate de forma adecuada los subcampos no debería ser una tarea difícil. Esto implicaría alterar un par de páginas de código PERL en el plugin de MARC.
     166_text3_
    349167"
    350168
     
    371189&lt;MARC field number&gt; -&gt; GreenstoneMetadataName
    372190</blockquote>
    373 Ð¡Ñ‚рПкО в ЎаММПЌ файле, кПтПрые МачОМаются сП зМака \"\#\", являются кПЌЌеМтарОяЌО (ПЎМакП, кПЌЌеМтарОО ЌПгут быть уЎалеМы Оз распечаткО, ЎаММПй МОже).
     191СтрПкО в ЎаММПЌ файле, кПтПрые МачОМаются сП зМака \"\#\", являются кПЌЌеМтарОяЌО.
    374192<p>
    375193
    376 Ð¡Ñ‚аМЎартМая версОя этПгП файла свПбПЎМП базОруется Ма MARC в ПпОсаМОО Dublin Core, кПтПрПе вПспрОМОЌает USMARC/MARC21 О кПтПрПе ЌПжМП МайтО Ма <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>. ОМ сПЎержОт слеЎующОе стрПкО:
    377 <p>
     194СтаМЎартМая версОя этПгП файла свПбПЎМП базОруется Ма MARC в ПпОсаМОО Dublin Core, кПтПрПе вПспрОМОЌает USMARC/MARC21 О кПтПрПе ЌПжМП МайтО Ма <a href=\"http://www.loc.gov/marc/marc2dc.html\">http://www.loc.gov/marc/marc2dc.html</a>.
    378195
    379 <a href=\"_httpprefix_/etc/marc2dc.txt\" target=marc2dc>gsdl/etc/marc2dc.txt</a>
    380 <br>\n
    381 720 -&gt; СПзЎатель
    382 <br>\n
    383 100 -&gt; СПзЎатель
    384 <br>\n
    385 110 -&gt; СПзЎатель
    386 <br>\n
    387 111 -&gt; СПзЎатель
    388 <br>\n
    389 520 -&gt; ОпОсаМОе
    390 <br>\n
    391 856 -&gt; URL
    392 <br>\n
    393 260 -&gt; ИзЎатель
    394 <br>\n
    395 787 -&gt; ОтМПшеМОе
    396 <br>\n
    397 540 -&gt; Права
    398 <br>\n
    399 024 -&gt; ИЎеМтОфОкатПр MARC
    400 <br>\n
    401 786 -&gt; ИстПчМОк MARC
    402 <br>\n
    403 546 -&gt; Язык MARC
    404 <br>\n
    405 650 -&gt; ПреЎЌет
    406 <br>\n
    407 653 -&gt; ПреЎЌет
    408 <br>\n
    409 245 -&gt; НазваМОе
    410 <br>\n
    411 655 -&gt; ТОп
    412 <p>
    413 
    414 ÐÐµÑÐºÐŸÐ»ÑŒÐºÐŸ разлОчМыÑ
    415  Ð¿ÐŸÐ»ÐµÐ¹ фПрЌата MARC вМесеМы в <i>dc.Creator</i> Dublin Core. ППле 720 -- «НекПМтрПлОруеЌПе ОЌя», 100 -- «ПерсПМальМПе МазваМОе», 110 -- «КПрпПратОвМПе МазваМОе», 111 -- «НазваМОе встреч». ЀактОческОе запОсО в фПрЌате MARC ПбычМП ПпреЎеляют тПлькП ПЎМП Оз этОÑ
    416  Ð¿ÐŸÐ»ÐµÐ¹, теЌ бПлее, чтП Greenstone ЎПпускает ЌМПгПзМачМые ЌетаЎаММые.
    417 <p>
    418 
    419 ÐŸÐŸÐ»Ðµ MARC 520 («РезюЌе, ПбратОте вМОЌаМОе»), вМесеМП в <i>ОпОсаМОе (Description)</i> Dublin Core, пПле 856 («ЭлектрПММПе ЌестПпПлПжеМОе») сППтМесеМП к <i>URL</i>; пПле 787 («НеспецОфОческая запОсь ПтМПшеМОй») к ОтМПшеМОю; пПле 540 («ПрОЌечаМОе П вПспрПОзвеЎеМОО») к <i>ПраваЌ</i>; пПле 245 («ОператПр <i>НазваМОя</i>») к <i>НазваМОю</i>; пПле 655 («ИМЎексМый терЌОМ -- жаМр/фПрЌа») к <i>ТОпу</i>. Оба пПля 650 («ПреЎЌет: теЌатОческОй терЌОМ») О 653 (« ИМЎексМый терЌОМ: МекПМтрПлОруеЌый») ПтМесеМ к <i>ПреЎЌету</i>.
    420 <p>
    421 
    422 ÐŸÐŸÐ»Ðµ MARC 024 («ИЎеМтОфОкатПр») Ме сПпПставлеМП с ЌетаЎаММыЌО Greenstone, пПтПЌу чтП в Greenstone ОспПльзуются сПбствеММые ЌетаЎаММые. <i>ИЎеМтОфОкатПр</i>; вЌестП этПгП разлОчМыЌ ЌетаЎаММыЌ Greenstone сПпПставлеМ элеЌеМт MARC, МазываеЌый <i>MarcIdentifier</i>. АМалПгОчМыЌ ПбразПЌ пПле 786 («Дата ввПЎа ОстПчМОка») Ме ПтМесеМа к <i>ИстПчМОку</i>, пПтПЌу чтП Greenstone ОЌеет ЌетаЎаММые <i>ИстПчМОк</i>, МП взаЌеМ этПгП ввеЎеМП МПвПе пПле ЌетаЎаММыÑ
    423 , МазваММПе <i>MarcSource</i>, а также О пПле 546 («Язык») ПбПзМачеМП как <i>MarcLanguage</i>.
    424 <p>
    425 
    426 ÐÐµÐºÐŸÑ‚Прые пПля MARC c эквОвалеМтаЌО Dublin Core прПстП ОгМПрОруются, МапрОЌер 620 (<i>УчастМОк</i>) О 500 (<i>ОÑ
    427 Ð²Ð°Ñ‚</i>). ППле 260 в MARC Мазывают «ПублОкацОей» О т.ÐŽ.» О еЌу в сППтветствОе пПставлеМП <i>ИзЎатель</i>. ЀактОческО пПле 260 с (пПЎпПле) ЎПлжМП ПзМачать Ўату публОкацОО, МП в такПЌ вОЎе ПМП Ме включеМП.
    428 <p>
    429 
    430 ÐšÐŸÐœÐµÑ‡ÐœÐŸ, разлОчМые сППтветствОя ЌПгут быть ПпреЎелеМы путеЌ ОзЌеМеМОя вышеупПЌяМутПгП файла, чтП пПзвПляет плагОМаЌ пПЎЎержОвать ЎругОе варОаМты фПрЌата MARC. ПлагОМ Ме распПзМает ОМЎОвОЎуальМые пПЎпПля MARC: ПМ прПстП связывает ОÑ
    431  Ð²ÐŒÐµÑÑ‚е. ОЎМакП, ЎПвеЎеМОе егП ЎП такПгП урПвМя, чтПбы ОЌеть ЎелП МепПсреЎствеММП с пПЎпПляЌО, Ме былП бы труЎМПй рабПтПй: МаЎП былП бы ОзЌеМОть МескПлькП страМОц прПграЌЌы PERL в плагОМаÑ
    432  MARC."
     196_text3_
     197"
Note: See TracChangeset for help on using the changeset viewer.