Show
Ignore:
Timestamp:
11.05.2009 14:20:52 (10 years ago)
Author:
kjdon
Message:

opened and closed in GLI. minor formatting changes to file

Files:
1 modified

Legend:

Unmodified
Added
Removed
  • collections/documented-examples/trunk/wrdpdf-e/etc/collect.cfg

    r19359 r19378  
    22public      true 
    33 
    4 plugin      WordPlugin 
    5 plugin      RTFPlugin 
    6 plugin      PDFPlugin 
    7 plugin      PostScriptPlugin 
    8 plugin      GreenstoneXMLPlugin 
    9 plugin      MetadataXMLPlugin 
    10 plugin      ArchivesInfPlugin 
    11 plugin      DirectoryPlugin 
     4buildtype   mg 
     5 
     6plugin  WordPlugin 
     7plugin  RTFPlugin 
     8plugin  PDFPlugin 
     9plugin  PostScriptPlugin 
     10plugin  GreenstoneXMLPlugin 
     11plugin  MetadataXMLPlugin 
     12plugin  ArchivesInfPlugin 
     13plugin  DirectoryPlugin 
    1214 
    1315indexes     document:text 
     
    1820format DocumentButtons "" 
    1921 
     22format VList "<td valign=\"top\">[link][icon][/link]</td> 
     23<td valign=\"top\">[ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]</td> 
     24<td valign=\"top\">[highlight] 
     25{Or}{[dc.Title],[exp.Title],[ex.Title],Untitled} 
     26[/highlight]{If}{[ex.Source],<br><i>([ex.Source])</i>}</td>" 
     27 
     28format HList "[link][highlight][ex.Title][/highlight][/link]" 
     29 
     30format DocumentText "[Text]" 
    2031 
    2132# -- English strings ---------------- 
     
    2435collectionmeta  .document:text [l=en] "documents" 
    2536 
    26  
    2737# -- French strings ---------------- 
    2838collectionmeta  collectionname [l=fr] "Démonstration MSWord et PDF" 
     
    3040collectionmeta  .document:text [l=fr] "documents" 
    3141 
    32  
    3342# -- Spanish strings ---------------- 
    3443collectionmeta  collectionname [l=es] "Demostración en MSWord y PDF" 
     
    3645collectionmeta  .document:text [l=es] "documentos" 
    3746 
    38  
    3947# -- Russian strings ---------------- 
    4048collectionmeta  collectionname [l=ru] "ДеЌПМстрацОя MSWord О PDF" 
     
    4250collectionmeta  .document:text [l=ru] "ДПкуЌеМты" 
    4351 
    44  
    4552# -- English text ---------------- 
    4653collectionmeta  collectionextra [l=en] "This collection demonstrates Greenstone\'s 
    47     ability to build collections from documents provided in different formats. 
    48     It contains a number of papers written by various members of the NZDL 
    49     project in PDF, MSWord, RTF, and Postscript formats.\n 
    50 <p> 
    51 The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato. 
    52 The University of Waikato holds copyright. They may be distributed freely, without any restrictions.  
     54ability to build collections from documents provided in different formats. 
     55It contains a number of papers written by various members of the NZDL 
     56project in PDF, MSWord, RTF, and Postscript formats.\n 
     57<p> 
     58The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato. 
     59The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 
    5360 
    5461<h3>How the collection works</h3>\n 
     
    6370<p> 
    6471Greenstone contains third-party software that is used to convert 
    65 Word, RTF, PDF and PostScript files into HTML.  The Greenstone team does not 
    66 maintain these modules, although we do try to include the latest versions  
     72Word, RTF, PDF and PostScript files into HTML. The Greenstone team does not 
     73maintain these modules, although we do try to include the latest versions 
    6774with each 
    6875Greenstone release. Bugs arise with unusual Word documents (e.g. from older 
     
    7380can either remove the offending documents from your collection, or try using 
    7481some of the advanced plugin options to process the documents in different ways. 
    75 For more information, see the Enhanced PDf and Word tutorials on the   
     82For more information, see the Enhanced PDf and Word tutorials on the 
    7683<a href=\'http://wiki.greenstone.org/wiki/index.php/Tutorial_exercises\'>Greenstone wiki</a>. 
    7784 
     
    7986The <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>configuration 
    8087file</a> includes a single index, based on document text, and one classifier, 
    81 an <i>AZList</i> based on <i>Title</i> metadata, shown  
     88an <i>AZList</i> based on <i>Title</i> metadata, shown 
    8289<a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">here</a> (the alphabetic 
    8390selector is suppressed automatically because the collection contains only a few 
     
    105112 
    106113<pre> 
    107 format VList \"&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n 
    108               &lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n 
    109               &lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n 
    110 </pre> 
    111 " 
    112  
     114format VList \" 
     115&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n 
     116&lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n 
     117&lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n 
     118</pre> 
     119" 
    113120 
    114121# -- French text ---------------- 
     
    116123<p> 
    117124The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato. 
    118 The University of Waikato holds copyright. They may be distributed freely, without any restrictions.  
     125The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 
    119126 
    120127<p> 
     
    124131Le <a href=\"_httpcollection_/etc/collect.cfg\" 
    125132target=collect.cfg>fichier de configuration</a> de cette collection contient quatre plugins, <i>WordPlugin</i>, <i>RTFPlugin</i>, 
    126  <i>PDFPlugin</i> et <i>PostScriptPlugin</i> (ensemble avec les quatre plugins standards <i>GreenstoneXMLPlugin</i>, <i>MetadataXMLPlugin</i>, <i>ArchivesInfPlugin</i> et <i>DirectoryPlugin</i>).  
    127  Tous ces quatre modules extraient les méta-données <i>Titre</i> et <i>Source</i> (c.-a-d. nom de fichier). 
    128  
    129 <p> 
    130 Greenstone contient des logiciels de tierces parties utilisés pour convertir des fichiers Word, RTF, PDF et PostScript en HTML. L'équipe Greenstone ne maintient pas ces modules bien que nous incluons les derniÚres versions dans chaque édition de Greenstone. Des coquilles apparaissent avec les documents  
    131 inhabituels de Word (par exemple à partir de vieux systÚmes Macintosh) et des fois, le texte est mal extrait. Certains fichiers PDF n'ont pas du tout une forme lisible directement par les machines, mais sont représentés par une séquence de pages d'<i>images</i> à partir desquelless le texte ne peut être extrait que par une reconnaissance optique de caractÚres (ROC), ce que  
     133<i>PDFPlugin</i> et <i>PostScriptPlugin</i> (ensemble avec les quatre plugins standards <i>GreenstoneXMLPlugin</i>, <i>MetadataXMLPlugin</i>, <i>ArchivesInfPlugin</i> et <i>DirectoryPlugin</i>). 
     134Tous ces quatre modules extraient les méta-données <i>Titre</i> et <i>Source</i> (c.-a-d. nom de fichier). 
     135 
     136<p> 
     137Greenstone contient des logiciels de tierces parties utilisés pour convertir des fichiers Word, RTF, PDF et PostScript en HTML. L\'équipe Greenstone ne maintient pas ces modules bien que nous incluons les derniÚres versions dans chaque édition de Greenstone. Des coquilles apparaissent avec les documents 
     138inhabituels de Word (par exemple à partir de vieux systÚmes Macintosh) et des fois, le texte est mal extrait. Certains fichiers PDF n\'ont pas du tout une forme lisible directement par les machines, mais sont représentés par une séquence de pages d\'<i>images</i> à partir desquelless le texte ne peut être extrait que par une reconnaissance optique de caractÚres (ROC), ce que 
    132139Greenstone ne tente pas de faire. _text1_ 
    133140 
    134141<p> 
    135 Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration</a> comprend un index unique, basé sur un texte de document  
    136 et un classificateur, un <i>AZList</i> basée sur la méta-donnée <i>Titre</i>, montrée <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">ici</a> (le sélecteur  
    137 alphabétique est supprimé automatiquement parce que la collection ne contient que peu de documents). Cependant aucune déclaration de format n'est spécifiée. A l'absence d'information explicite, Greenstone fournit des défauts sensés. Dans ce cas le format par défaut pour le classificateur donne ceci : 
    138 <ul> 
    139 <li> 
    140 une icÃŽne pour la version HTML du document (le texte est en fait indexé en grande partie de la même façon que le format d'archive Greenstone); 
     142Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration</a> comprend un index unique, basé sur un texte de document 
     143et un classificateur, un <i>AZList</i> basée sur la méta-donnée <i>Titre</i>, montrée <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">ici</a> (le sélecteur 
     144alphabétique est supprimé automatiquement parce que la collection ne contient que peu de documents). Cependant aucune déclaration de format n\'est spécifiée. A l\'absence d\'information explicite, Greenstone fournit des défauts sensés. Dans ce cas le format par défaut pour le classificateur donne ceci : 
     145<ul> 
     146<li> 
     147une icÃŽne pour la version HTML du document (le texte est en fait indexé en grande partie de la même façon que le format d\'archive Greenstone); 
    141148<li> 
    142149une icÃŽne pour la version originale du document (en cliquant dessus, on ouvre le document dans sa version originale); 
     
    148155 
    149156<p> 
    150 Voici une déclaration de format qui fait exactement la même chose de maniÚre explicite.  
    151 Elle s'applique à tous les <i>VList</i> et contrÃŽle donc aussi bien les résultats de recherche que la navigation alphabétique par titre. 
    152  
    153 <pre> 
    154 format VList \"&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n 
    155               &lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n 
    156               &lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n 
    157 </pre> 
    158 " 
    159  
     157Voici une déclaration de format qui fait exactement la même chose de maniÚre explicite. 
     158Elle s\'applique à tous les <i>VList</i> et contrÃŽle donc aussi bien les résultats de recherche que la navigation alphabétique par titre. 
     159 
     160<pre> 
     161format VList \" 
     162&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n 
     163&lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n 
     164&lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n 
     165</pre> 
     166" 
    160167 
    161168# -- Spanish text ---------------- 
     
    163170<p> 
    164171The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato. 
    165 The University of Waikato holds copyright. They may be distributed freely, without any restrictions.  
     172The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 
    166173 
    167174<h3>Cómo trabaja esta colección</h3> 
     
    176183<p> 
    177184<ul> 
    178 <li> un icono para la versión HTML del documento (el texto que se está indexando, básicamente el mismo que el formato del Archivo Greenstone);  
    179  
    180  
    181 <li> un icono para la versión original del documento (al hacer click en él abre el documento en su forma original);  
    182  
    183  
    184 <li> el metadato de <i>Título</i> extraído del documento;  
    185  
    186  
    187 <li> el metadato de <i>Fuente</i> (es decir, el nombre de archivo) extraído del documento.  
    188 </ul> 
    189 <p> 
    190 He aquí un enunciado de formato que logra exactamente el mismo efecto de manera explícita. Se aplica a todas las <i>Vlists</i> y por lo tanto controla tanto la lista de resultados de la búsqueda como el explorador de títulos por orden alfabético.  
    191  
    192 <pre> 
    193 format VList \"&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n 
    194               &lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n 
    195               &lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n 
    196 </pre> 
    197 " 
    198  
     185<li> un icono para la versión HTML del documento (el texto que se está indexando, básicamente el mismo que el formato del Archivo Greenstone); 
     186 
     187 
     188<li> un icono para la versión original del documento (al hacer click en él abre el documento en su forma original); 
     189 
     190 
     191<li> el metadato de <i>Título</i> extraído del documento; 
     192 
     193 
     194<li> el metadato de <i>Fuente</i> (es decir, el nombre de archivo) extraído del documento. 
     195</ul> 
     196<p> 
     197He aquí un enunciado de formato que logra exactamente el mismo efecto de manera explícita. Se aplica a todas las <i>Vlists</i> y por lo tanto controla tanto la lista de resultados de la búsqueda como el explorador de títulos por orden alfabético. 
     198 
     199<pre> 
     200format VList \" 
     201&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n 
     202&lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n 
     203&lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n 
     204</pre> 
     205" 
    199206 
    200207# -- Russian text ---------------- 
    201208collectionmeta  collectionextra [l=ru] " 
    202 Ð­Ñ‚а кПллекцОя ЎеЌПМстрОрует спПсПбМПсть Greenstone  Ðº пПстрПеМОю кПллекцОО Оз ЎПкуЌеМтПв, выпПлМеММыѠ
     209Эта кПллекцОя ЎеЌПМстрОрует спПсПбМПсть Greenstone к пПстрПеМОю кПллекцОО Оз ЎПкуЌеМтПв, выпПлМеММыѠ
    203210 Ð² разлОчМыѠ
    204211 Ñ„ПрЌатаѠ
     
    208215<p> 
    209216The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato. 
    210 The University of Waikato holds copyright. They may be distributed freely, without any restrictions.  
     217The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 
    211218 
    212219 
     
    221228 ÑÐ°ÐŒÑ‹Ðµ пПслеЎМОе версОО в кажЎый выпуск Greenstone. ОшОбкО вПзМОкают у МеПбычМыѠ
    222229 ÐŽÐŸÐºÑƒÐŒÐµÐœÑ‚Пв Word (МапрОЌер, Пт старыѠ
    223  ÑÐžÑÑ‚еЌ МакОМтПша), О ОМПгЎа текст ужасМП Озвлекается. НекПтПрые PDF файлы Ме сПзЎают МОкакПгП ЌашОММПчОтаеЌПгП текста вППбще, а вЌестП этПгП включают  Ð¿ÐŸÑÐ»ÐµÐŽÐŸÐ²Ð°Ñ‚ельМПсть <i>ОзПбражеМОй</i> страМОцы, Оз кПтПрыѠ
     230 ÑÐžÑÑ‚еЌ МакОМтПша), О ОМПгЎа текст ужасМП Озвлекается. НекПтПрые PDF файлы Ме сПзЎают МОкакПгП ЌашОММПчОтаеЌПгП текста вППбще, а вЌестП этПгП включают пПслеЎПвательМПсть <i>ОзПбражеМОй</i> страМОцы, Оз кПтПрыѠ
    224231 Ñ‚екст ЌПжет быть ОзвлечеМ тПлькП путеЌ ПптОческПгП распПзМаваМОя (OCR), чтП в Greenstone Ме преЎусЌПтреМП. _text1_ 
    225232<p> 
     
    228235<a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>КПМфОгурацОПММый файл</a> включает еЎОМствеММый ОМЎекс, ПсМПваММый Ма тексте ЎПкуЌеМта О ПЎОМ классОфОкатПр <i>AZList</i>, ПсМПваММый Ма ЌетаЎаММыѠ
    229236 <i>НазваМОя</i>, пПказаММый <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">зЎесь</a> (алфавОтМый ПтбПрщОк автПЌатОческО ПтключеМ, пПскПльку кПллекцОя сПЎержОт тПлькП МескПлькП ЎПкуЌеМтПв). ОЎМакП МОкакОѠ
    230  ÐŸÐ¿ÐµÑ€Ð°Ñ‚ПрПв фПрЌата Ме ПпреЎелеМП. ПрО  ÐŸÑ‚сутствОО явМПй ОМфПрЌацОО Greenstone  пПЎЎержОвает пП уЌПлчаМОю МаОбПлее ПщутОЌые. В этПЌ случае пП уЌПлчаМОю ОспПльзуются слеЎующОе  фПрЌаты Ўля классОфОкатПра:  
     237 ÐŸÐ¿ÐµÑ€Ð°Ñ‚ПрПв фПрЌата Ме ПпреЎелеМП. ПрО ПтсутствОО явМПй ОМфПрЌацОО Greenstone пПЎЎержОвает пП уЌПлчаМОю МаОбПлее ПщутОЌые. В этПЌ случае пП уЌПлчаМОю ОспПльзуются слеЎующОе фПрЌаты Ўля классОфОкатПра: 
    231238<p> 
    232239 
     
    249256 
    250257<pre> 
    251 format VList \"&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n 
    252               &lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n 
    253               &lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n 
    254 </pre> 
    255 " 
     258format VList \" 
     259&lt;td&gt;[link][icon][/link]&lt;\/td&gt;\n 
     260&lt;td&gt;[srclink][srcicon][/srclink]&lt;\/td&gt;\n 
     261&lt;td&gt;[Title]&lt;br&gt;&lt;i&gt;([Source])&lt;/i&gt;&lt;/td&gt;\"\n 
     262</pre> 
     263"