Ignore:
Timestamp:
2009-05-11T14:20:52+12:00 (15 years ago)
Author:
kjdon
Message:

opened and closed in GLI. minor formatting changes to file

File:
1 edited

Legend:

Unmodified
Added
Removed
  • collections/documented-examples/trunk/wrdpdf-e/etc/collect.cfg

    r19359 r19378  
    22public      true
    33
    4 plugin      WordPlugin
    5 plugin      RTFPlugin
    6 plugin      PDFPlugin
    7 plugin      PostScriptPlugin
    8 plugin      GreenstoneXMLPlugin
    9 plugin      MetadataXMLPlugin
    10 plugin      ArchivesInfPlugin
    11 plugin      DirectoryPlugin
     4buildtype   mg
     5
     6plugin  WordPlugin
     7plugin  RTFPlugin
     8plugin  PDFPlugin
     9plugin  PostScriptPlugin
     10plugin  GreenstoneXMLPlugin
     11plugin  MetadataXMLPlugin
     12plugin  ArchivesInfPlugin
     13plugin  DirectoryPlugin
    1214
    1315indexes     document:text
     
    1820format DocumentButtons ""
    1921
     22format VList "<td valign=\"top\">[link][icon][/link]</td>
     23<td valign=\"top\">[ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]</td>
     24<td valign=\"top\">[highlight]
     25{Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}
     26[/highlight]{If}{[ex.Source],<br><i>([ex.Source])</i>}</td>"
     27
     28format HList "[link][highlight][ex.Title][/highlight][/link]"
     29
     30format DocumentText "[Text]"
    2031
    2132# -- English strings ----------------
     
    2435collectionmeta  .document:text [l=en] "documents"
    2536
    26 
    2737# -- French strings ----------------
    2838collectionmeta  collectionname [l=fr] "Démonstration MSWord et PDF"
     
    3040collectionmeta  .document:text [l=fr] "documents"
    3141
    32 
    3342# -- Spanish strings ----------------
    3443collectionmeta  collectionname [l=es] "Demostración en MSWord y PDF"
     
    3645collectionmeta  .document:text [l=es] "documentos"
    3746
    38 
    3947# -- Russian strings ----------------
    4048collectionmeta  collectionname [l=ru] "ДеЌПМстрацОя MSWord О PDF"
     
    4250collectionmeta  .document:text [l=ru] "ДПкуЌеМты"
    4351
    44 
    4552# -- English text ----------------
    4653collectionmeta  collectionextra [l=en] "This collection demonstrates Greenstone\'s
    47     ability to build collections from documents provided in different formats.
    48     It contains a number of papers written by various members of the NZDL
    49     project in PDF, MSWord, RTF, and Postscript formats.\n
    50 <p>
    51 The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato.
    52 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 
     54ability to build collections from documents provided in different formats.
     55It contains a number of papers written by various members of the NZDL
     56project in PDF, MSWord, RTF, and Postscript formats.\n
     57<p>
     58The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato.
     59The University of Waikato holds copyright. They may be distributed freely, without any restrictions.
    5360
    5461<h3>How the collection works</h3>\n
     
    6370<p>
    6471Greenstone contains third-party software that is used to convert
    65 Word, RTF, PDF and PostScript files into HTML.  The Greenstone team does not
    66 maintain these modules, although we do try to include the latest versions 
     72Word, RTF, PDF and PostScript files into HTML. The Greenstone team does not
     73maintain these modules, although we do try to include the latest versions
    6774with each
    6875Greenstone release. Bugs arise with unusual Word documents (e.g. from older
     
    7380can either remove the offending documents from your collection, or try using
    7481some of the advanced plugin options to process the documents in different ways.
    75 For more information, see the Enhanced PDf and Word tutorials on the 
     82For more information, see the Enhanced PDf and Word tutorials on the
    7683<a href=\'http://wiki.greenstone.org/wiki/index.php/Tutorial_exercises\'>Greenstone wiki</a>.
    7784
     
    7986The <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>configuration
    8087file</a> includes a single index, based on document text, and one classifier,
    81 an <i>AZList</i> based on <i>Title</i> metadata, shown 
     88an <i>AZList</i> based on <i>Title</i> metadata, shown
    8289<a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">here</a> (the alphabetic
    8390selector is suppressed automatically because the collection contains only a few
     
    105112
    106113<pre>
    107 format VList \"&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n
    108               &lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n
    109               &lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n
    110 </pre>
    111 "
    112 
     114format VList \"
     115&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n
     116&lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n
     117&lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n
     118</pre>
     119"
    113120
    114121# -- French text ----------------
     
    116123<p>
    117124The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato.
    118 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 
     125The University of Waikato holds copyright. They may be distributed freely, without any restrictions.
    119126
    120127<p>
     
    124131Le <a href=\"_httpcollection_/etc/collect.cfg\"
    125132target=collect.cfg>fichier de configuration</a> de cette collection contient quatre plugins, <i>WordPlugin</i>, <i>RTFPlugin</i>,
    126  <i>PDFPlugin</i> et <i>PostScriptPlugin</i> (ensemble avec les quatre plugins standards <i>GreenstoneXMLPlugin</i>, <i>MetadataXMLPlugin</i>, <i>ArchivesInfPlugin</i> et <i>DirectoryPlugin</i>).
    127  Tous ces quatre modules extraient les méta-données <i>Titre</i> et <i>Source</i> (c.-a-d. nom de fichier).
    128 
    129 <p>
    130 Greenstone contient des logiciels de tierces parties utilisés pour convertir des fichiers Word, RTF, PDF et PostScript en HTML. L'équipe Greenstone ne maintient pas ces modules bien que nous incluons les derniÚres versions dans chaque édition de Greenstone. Des coquilles apparaissent avec les documents
    131 inhabituels de Word (par exemple à partir de vieux systÚmes Macintosh) et des fois, le texte est mal extrait. Certains fichiers PDF n'ont pas du tout une forme lisible directement par les machines, mais sont représentés par une séquence de pages d'<i>images</i> à partir desquelless le texte ne peut être extrait que par une reconnaissance optique de caractÚres (ROC), ce que
     133<i>PDFPlugin</i> et <i>PostScriptPlugin</i> (ensemble avec les quatre plugins standards <i>GreenstoneXMLPlugin</i>, <i>MetadataXMLPlugin</i>, <i>ArchivesInfPlugin</i> et <i>DirectoryPlugin</i>).
     134Tous ces quatre modules extraient les méta-données <i>Titre</i> et <i>Source</i> (c.-a-d. nom de fichier).
     135
     136<p>
     137Greenstone contient des logiciels de tierces parties utilisés pour convertir des fichiers Word, RTF, PDF et PostScript en HTML. L\'équipe Greenstone ne maintient pas ces modules bien que nous incluons les derniÚres versions dans chaque édition de Greenstone. Des coquilles apparaissent avec les documents
     138inhabituels de Word (par exemple à partir de vieux systÚmes Macintosh) et des fois, le texte est mal extrait. Certains fichiers PDF n\'ont pas du tout une forme lisible directement par les machines, mais sont représentés par une séquence de pages d\'<i>images</i> à partir desquelless le texte ne peut être extrait que par une reconnaissance optique de caractÚres (ROC), ce que
    132139Greenstone ne tente pas de faire. _text1_
    133140
    134141<p>
    135 Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration</a> comprend un index unique, basé sur un texte de document 
    136 et un classificateur, un <i>AZList</i> basée sur la méta-donnée <i>Titre</i>, montrée <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">ici</a> (le sélecteur 
    137 alphabétique est supprimé automatiquement parce que la collection ne contient que peu de documents). Cependant aucune déclaration de format n'est spécifiée. A l'absence d'information explicite, Greenstone fournit des défauts sensés. Dans ce cas le format par défaut pour le classificateur donne ceci :
    138 <ul>
    139 <li>
    140 une icÃŽne pour la version HTML du document (le texte est en fait indexé en grande partie de la même façon que le format d'archive Greenstone);
     142Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration</a> comprend un index unique, basé sur un texte de document
     143et un classificateur, un <i>AZList</i> basée sur la méta-donnée <i>Titre</i>, montrée <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">ici</a> (le sélecteur
     144alphabétique est supprimé automatiquement parce que la collection ne contient que peu de documents). Cependant aucune déclaration de format n\'est spécifiée. A l\'absence d\'information explicite, Greenstone fournit des défauts sensés. Dans ce cas le format par défaut pour le classificateur donne ceci :
     145<ul>
     146<li>
     147une icÃŽne pour la version HTML du document (le texte est en fait indexé en grande partie de la même façon que le format d\'archive Greenstone);
    141148<li>
    142149une icÃŽne pour la version originale du document (en cliquant dessus, on ouvre le document dans sa version originale);
     
    148155
    149156<p>
    150 Voici une déclaration de format qui fait exactement la même chose de maniÚre explicite. 
    151 Elle s'applique à tous les <i>VList</i> et contrÃŽle donc aussi bien les résultats de recherche que la navigation alphabétique par titre.
    152 
    153 <pre>
    154 format VList \"&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n
    155               &lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n
    156               &lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n
    157 </pre>
    158 "
    159 
     157Voici une déclaration de format qui fait exactement la même chose de maniÚre explicite.
     158Elle s\'applique à tous les <i>VList</i> et contrÃŽle donc aussi bien les résultats de recherche que la navigation alphabétique par titre.
     159
     160<pre>
     161format VList \"
     162&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n
     163&lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n
     164&lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n
     165</pre>
     166"
    160167
    161168# -- Spanish text ----------------
     
    163170<p>
    164171The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato.
    165 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 
     172The University of Waikato holds copyright. They may be distributed freely, without any restrictions.
    166173
    167174<h3>Cómo trabaja esta colección</h3>
     
    176183<p>
    177184<ul>
    178 <li> un icono para la versión HTML del documento (el texto que se está indexando, básicamente el mismo que el formato del Archivo Greenstone); 
    179 
    180 
    181 <li> un icono para la versión original del documento (al hacer click en él abre el documento en su forma original); 
    182 
    183 
    184 <li> el metadato de <i>Título</i> extraído del documento; 
    185 
    186 
    187 <li> el metadato de <i>Fuente</i> (es decir, el nombre de archivo) extraído del documento. 
    188 </ul>
    189 <p>
    190 He aquí un enunciado de formato que logra exactamente el mismo efecto de manera explícita. Se aplica a todas las <i>Vlists</i> y por lo tanto controla tanto la lista de resultados de la búsqueda como el explorador de títulos por orden alfabético. 
    191 
    192 <pre>
    193 format VList \"&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n
    194               &lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n
    195               &lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n
    196 </pre>
    197 "
    198 
     185<li> un icono para la versión HTML del documento (el texto que se está indexando, básicamente el mismo que el formato del Archivo Greenstone);
     186
     187
     188<li> un icono para la versión original del documento (al hacer click en él abre el documento en su forma original);
     189
     190
     191<li> el metadato de <i>Título</i> extraído del documento;
     192
     193
     194<li> el metadato de <i>Fuente</i> (es decir, el nombre de archivo) extraído del documento.
     195</ul>
     196<p>
     197He aquí un enunciado de formato que logra exactamente el mismo efecto de manera explícita. Se aplica a todas las <i>Vlists</i> y por lo tanto controla tanto la lista de resultados de la búsqueda como el explorador de títulos por orden alfabético.
     198
     199<pre>
     200format VList \"
     201&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n
     202&lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n
     203&lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n
     204</pre>
     205"
    199206
    200207# -- Russian text ----------------
    201208collectionmeta  collectionextra [l=ru] "
    202 Ð­Ñ‚а кПллекцОя ЎеЌПМстрОрует спПсПбМПсть Greenstone  Ðº пПстрПеМОю кПллекцОО Оз ЎПкуЌеМтПв, выпПлМеММыÑ
     209Эта кПллекцОя ЎеЌПМстрОрует спПсПбМПсть Greenstone к пПстрПеМОю кПллекцОО Оз ЎПкуЌеМтПв, выпПлМеММыÑ
    203210 Ð² разлОчМыÑ
    204211 Ñ„ПрЌатаÑ
     
    208215<p>
    209216The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato.
    210 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 
     217The University of Waikato holds copyright. They may be distributed freely, without any restrictions.
    211218
    212219
     
    221228 ÑÐ°ÐŒÑ‹Ðµ пПслеЎМОе версОО в кажЎый выпуск Greenstone. ОшОбкО вПзМОкают у МеПбычМыÑ
    222229 ÐŽÐŸÐºÑƒÐŒÐµÐœÑ‚Пв Word (МапрОЌер, Пт старыÑ
    223  ÑÐžÑÑ‚еЌ МакОМтПша), О ОМПгЎа текст ужасМП Озвлекается. НекПтПрые PDF файлы Ме сПзЎают МОкакПгП ЌашОММПчОтаеЌПгП текста вППбще, а вЌестП этПгП включают  Ð¿ÐŸÑÐ»ÐµÐŽÐŸÐ²Ð°Ñ‚ельМПсть <i>ОзПбражеМОй</i> страМОцы, Оз кПтПрыÑ
     230 ÑÐžÑÑ‚еЌ МакОМтПша), О ОМПгЎа текст ужасМП Озвлекается. НекПтПрые PDF файлы Ме сПзЎают МОкакПгП ЌашОММПчОтаеЌПгП текста вППбще, а вЌестП этПгП включают пПслеЎПвательМПсть <i>ОзПбражеМОй</i> страМОцы, Оз кПтПрыÑ
    224231 Ñ‚екст ЌПжет быть ОзвлечеМ тПлькП путеЌ ПптОческПгП распПзМаваМОя (OCR), чтП в Greenstone Ме преЎусЌПтреМП. _text1_
    225232<p>
     
    228235<a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>КПМфОгурацОПММый файл</a> включает еЎОМствеММый ОМЎекс, ПсМПваММый Ма тексте ЎПкуЌеМта О ПЎОМ классОфОкатПр <i>AZList</i>, ПсМПваММый Ма ЌетаЎаММыÑ
    229236 <i>НазваМОя</i>, пПказаММый <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">зЎесь</a> (алфавОтМый ПтбПрщОк автПЌатОческО ПтключеМ, пПскПльку кПллекцОя сПЎержОт тПлькП МескПлькП ЎПкуЌеМтПв). ОЎМакП МОкакОÑ
    230  ÐŸÐ¿ÐµÑ€Ð°Ñ‚ПрПв фПрЌата Ме ПпреЎелеМП. ПрО  ÐŸÑ‚сутствОО явМПй ОМфПрЌацОО Greenstone  пПЎЎержОвает пП уЌПлчаМОю МаОбПлее ПщутОЌые. В этПЌ случае пП уЌПлчаМОю ОспПльзуются слеЎующОе  фПрЌаты Ўля классОфОкатПра:
     237 ÐŸÐ¿ÐµÑ€Ð°Ñ‚ПрПв фПрЌата Ме ПпреЎелеМП. ПрО ПтсутствОО явМПй ОМфПрЌацОО Greenstone пПЎЎержОвает пП уЌПлчаМОю МаОбПлее ПщутОЌые. В этПЌ случае пП уЌПлчаМОю ОспПльзуются слеЎующОе фПрЌаты Ўля классОфОкатПра:
    231238<p>
    232239
     
    249256
    250257<pre>
    251 format VList \"&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n
    252               &lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n
    253               &lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n
    254 </pre>
    255 "
     258format VList \"
     259&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n
     260&lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n
     261&lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n
     262</pre>
     263"
Note: See TracChangeset for help on using the changeset viewer.