Changeset 19378 for collections/documented-examples
- Timestamp:
- 2009-05-11T14:20:52+12:00 (15 years ago)
- File:
-
- 1 edited
Legend:
- Unmodified
- Added
- Removed
-
collections/documented-examples/trunk/wrdpdf-e/etc/collect.cfg
r19359 r19378 2 2 public true 3 3 4 plugin WordPlugin 5 plugin RTFPlugin 6 plugin PDFPlugin 7 plugin PostScriptPlugin 8 plugin GreenstoneXMLPlugin 9 plugin MetadataXMLPlugin 10 plugin ArchivesInfPlugin 11 plugin DirectoryPlugin 4 buildtype mg 5 6 plugin WordPlugin 7 plugin RTFPlugin 8 plugin PDFPlugin 9 plugin PostScriptPlugin 10 plugin GreenstoneXMLPlugin 11 plugin MetadataXMLPlugin 12 plugin ArchivesInfPlugin 13 plugin DirectoryPlugin 12 14 13 15 indexes document:text … … 18 20 format DocumentButtons "" 19 21 22 format VList "<td valign=\"top\">[link][icon][/link]</td> 23 <td valign=\"top\">[ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]</td> 24 <td valign=\"top\">[highlight] 25 {Or}{[dc.Title],[exp.Title],[ex.Title],Untitled} 26 [/highlight]{If}{[ex.Source],<br><i>([ex.Source])</i>}</td>" 27 28 format HList "[link][highlight][ex.Title][/highlight][/link]" 29 30 format DocumentText "[Text]" 20 31 21 32 # -- English strings ---------------- … … 24 35 collectionmeta .document:text [l=en] "documents" 25 36 26 27 37 # -- French strings ---------------- 28 38 collectionmeta collectionname [l=fr] "Démonstration MSWord et PDF" … … 30 40 collectionmeta .document:text [l=fr] "documents" 31 41 32 33 42 # -- Spanish strings ---------------- 34 43 collectionmeta collectionname [l=es] "Demostración en MSWord y PDF" … … 36 45 collectionmeta .document:text [l=es] "documentos" 37 46 38 39 47 # -- Russian strings ---------------- 40 48 collectionmeta collectionname [l=ru] "ÐеЌПМÑÑÑаÑÐžÑ MSWord О PDF" … … 42 50 collectionmeta .document:text [l=ru] "ÐПкÑЌеМÑÑ" 43 51 44 45 52 # -- English text ---------------- 46 53 collectionmeta collectionextra [l=en] "This collection demonstrates Greenstone\'s 47 48 49 50 <p> 51 The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato. 52 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 54 ability to build collections from documents provided in different formats. 55 It contains a number of papers written by various members of the NZDL 56 project in PDF, MSWord, RTF, and Postscript formats.\n 57 <p> 58 The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato. 59 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 53 60 54 61 <h3>How the collection works</h3>\n … … 63 70 <p> 64 71 Greenstone contains third-party software that is used to convert 65 Word, RTF, PDF and PostScript files into HTML. 66 maintain these modules, although we do try to include the latest versions 72 Word, RTF, PDF and PostScript files into HTML. The Greenstone team does not 73 maintain these modules, although we do try to include the latest versions 67 74 with each 68 75 Greenstone release. Bugs arise with unusual Word documents (e.g. from older … … 73 80 can either remove the offending documents from your collection, or try using 74 81 some of the advanced plugin options to process the documents in different ways. 75 For more information, see the Enhanced PDf and Word tutorials on the 82 For more information, see the Enhanced PDf and Word tutorials on the 76 83 <a href=\'http://wiki.greenstone.org/wiki/index.php/Tutorial_exercises\'>Greenstone wiki</a>. 77 84 … … 79 86 The <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>configuration 80 87 file</a> includes a single index, based on document text, and one classifier, 81 an <i>AZList</i> based on <i>Title</i> metadata, shown 88 an <i>AZList</i> based on <i>Title</i> metadata, shown 82 89 <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">here</a> (the alphabetic 83 90 selector is suppressed automatically because the collection contains only a few … … 105 112 106 113 <pre> 107 format VList \" <td>[link][icon][/link]<\/td>\n108 <td>[srclink][srcicon][/srclink]<\/td>\n109 <td>[Title]<br><i>([Source])</i></td>\"\n110 </pre> 111 " 112 114 format VList \" 115 <td>[link][icon][/link]<\/td>\n 116 <td>[srclink][srcicon][/srclink]<\/td>\n 117 <td>[Title]<br><i>([Source])</i></td>\"\n 118 </pre> 119 " 113 120 114 121 # -- French text ---------------- … … 116 123 <p> 117 124 The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato. 118 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 125 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 119 126 120 127 <p> … … 124 131 Le <a href=\"_httpcollection_/etc/collect.cfg\" 125 132 target=collect.cfg>fichier de configuration</a> de cette collection contient quatre plugins, <i>WordPlugin</i>, <i>RTFPlugin</i>, 126 <i>PDFPlugin</i> et <i>PostScriptPlugin</i> (ensemble avec les quatre plugins standards <i>GreenstoneXMLPlugin</i>, <i>MetadataXMLPlugin</i>, <i>ArchivesInfPlugin</i> et <i>DirectoryPlugin</i>). 127 128 129 <p> 130 Greenstone contient des logiciels de tierces parties utilisés pour convertir des fichiers Word, RTF, PDF et PostScript en HTML. L 'équipe Greenstone ne maintient pas ces modules bien que nous incluons les derniÚres versions dans chaque édition de Greenstone. Des coquilles apparaissent avec les documents131 inhabituels de Word (par exemple à partir de vieux systÚmes Macintosh) et des fois, le texte est mal extrait. Certains fichiers PDF n 'ont pas du tout une forme lisible directement par les machines, mais sont représentés par une séquence de pages d'<i>images</i> à partir desquelless le texte ne peut être extrait que par une reconnaissance optique de caractÚres (ROC), ce que133 <i>PDFPlugin</i> et <i>PostScriptPlugin</i> (ensemble avec les quatre plugins standards <i>GreenstoneXMLPlugin</i>, <i>MetadataXMLPlugin</i>, <i>ArchivesInfPlugin</i> et <i>DirectoryPlugin</i>). 134 Tous ces quatre modules extraient les méta-données <i>Titre</i> et <i>Source</i> (c.-a-d. nom de fichier). 135 136 <p> 137 Greenstone contient des logiciels de tierces parties utilisés pour convertir des fichiers Word, RTF, PDF et PostScript en HTML. L\'équipe Greenstone ne maintient pas ces modules bien que nous incluons les derniÚres versions dans chaque édition de Greenstone. Des coquilles apparaissent avec les documents 138 inhabituels de Word (par exemple à partir de vieux systÚmes Macintosh) et des fois, le texte est mal extrait. Certains fichiers PDF n\'ont pas du tout une forme lisible directement par les machines, mais sont représentés par une séquence de pages d\'<i>images</i> à partir desquelless le texte ne peut être extrait que par une reconnaissance optique de caractÚres (ROC), ce que 132 139 Greenstone ne tente pas de faire. _text1_ 133 140 134 141 <p> 135 Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration</a> comprend un index unique, basé sur un texte de document 136 et un classificateur, un <i>AZList</i> basée sur la méta-donnée <i>Titre</i>, montrée <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">ici</a> (le sélecteur 137 alphabétique est supprimé automatiquement parce que la collection ne contient que peu de documents). Cependant aucune déclaration de format n 'est spécifiée. A l'absence d'information explicite, Greenstone fournit des défauts sensés. Dans ce cas le format par défaut pour le classificateur donne ceci :138 <ul> 139 <li> 140 une icÃŽne pour la version HTML du document (le texte est en fait indexé en grande partie de la même façon que le format d 'archive Greenstone);142 Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration</a> comprend un index unique, basé sur un texte de document 143 et un classificateur, un <i>AZList</i> basée sur la méta-donnée <i>Titre</i>, montrée <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">ici</a> (le sélecteur 144 alphabétique est supprimé automatiquement parce que la collection ne contient que peu de documents). Cependant aucune déclaration de format n\'est spécifiée. A l\'absence d\'information explicite, Greenstone fournit des défauts sensés. Dans ce cas le format par défaut pour le classificateur donne ceci : 145 <ul> 146 <li> 147 une icÃŽne pour la version HTML du document (le texte est en fait indexé en grande partie de la même façon que le format d\'archive Greenstone); 141 148 <li> 142 149 une icÃŽne pour la version originale du document (en cliquant dessus, on ouvre le document dans sa version originale); … … 148 155 149 156 <p> 150 Voici une déclaration de format qui fait exactement la même chose de maniÚre explicite. 151 Elle s 'applique à tous les <i>VList</i> et contrÃŽle donc aussi bien les résultats de recherche que la navigation alphabétique par titre.152 153 <pre> 154 format VList \" <td>[link][icon][/link]<\/td>\n155 <td>[srclink][srcicon][/srclink]<\/td>\n156 <td>[Title]<br><i>([Source])</i></td>\"\n157 </pre> 158 " 159 157 Voici une déclaration de format qui fait exactement la même chose de maniÚre explicite. 158 Elle s\'applique à tous les <i>VList</i> et contrÃŽle donc aussi bien les résultats de recherche que la navigation alphabétique par titre. 159 160 <pre> 161 format VList \" 162 <td>[link][icon][/link]<\/td>\n 163 <td>[srclink][srcicon][/srclink]<\/td>\n 164 <td>[Title]<br><i>([Source])</i></td>\"\n 165 </pre> 166 " 160 167 161 168 # -- Spanish text ---------------- … … 163 170 <p> 164 171 The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato. 165 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 172 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 166 173 167 174 <h3>Cómo trabaja esta colección</h3> … … 176 183 <p> 177 184 <ul> 178 <li> un icono para la versión HTML del documento (el texto que se está indexando, básicamente el mismo que el formato del Archivo Greenstone); 179 180 181 <li> un icono para la versión original del documento (al hacer click en él abre el documento en su forma original); 182 183 184 <li> el metadato de <i>TÃtulo</i> extraÃdo del documento; 185 186 187 <li> el metadato de <i>Fuente</i> (es decir, el nombre de archivo) extraÃdo del documento. 188 </ul> 189 <p> 190 He aquà un enunciado de formato que logra exactamente el mismo efecto de manera explÃcita. Se aplica a todas las <i>Vlists</i> y por lo tanto controla tanto la lista de resultados de la búsqueda como el explorador de tÃtulos por orden alfabético. 191 192 <pre> 193 format VList \" <td>[link][icon][/link]<\/td>\n194 <td>[srclink][srcicon][/srclink]<\/td>\n195 <td>[Title]<br><i>([Source])</i></td>\"\n196 </pre> 197 " 198 185 <li> un icono para la versión HTML del documento (el texto que se está indexando, básicamente el mismo que el formato del Archivo Greenstone); 186 187 188 <li> un icono para la versión original del documento (al hacer click en él abre el documento en su forma original); 189 190 191 <li> el metadato de <i>TÃtulo</i> extraÃdo del documento; 192 193 194 <li> el metadato de <i>Fuente</i> (es decir, el nombre de archivo) extraÃdo del documento. 195 </ul> 196 <p> 197 He aquà un enunciado de formato que logra exactamente el mismo efecto de manera explÃcita. Se aplica a todas las <i>Vlists</i> y por lo tanto controla tanto la lista de resultados de la búsqueda como el explorador de tÃtulos por orden alfabético. 198 199 <pre> 200 format VList \" 201 <td>[link][icon][/link]<\/td>\n 202 <td>[srclink][srcicon][/srclink]<\/td>\n 203 <td>[Title]<br><i>([Source])</i></td>\"\n 204 </pre> 205 " 199 206 200 207 # -- Russian text ---------------- 201 208 collectionmeta collectionextra [l=ru] " 202 ÐÑа кПллекÑÐžÑ ÐŽÐµÐŒÐŸÐœÑÑÑОÑÑÐµÑ ÑпПÑПбМПÑÑÑ Greenstone к пПÑÑÑПеМОÑкПллекÑОО Оз ЎПкÑЌеМÑПв, вÑпПлМеММÑÑ209 ÐÑа кПллекÑÐžÑ ÐŽÐµÐŒÐŸÐœÑÑÑОÑÑÐµÑ ÑпПÑПбМПÑÑÑ Greenstone к пПÑÑÑÐŸÐµÐœÐžÑ ÐºÐŸÐ»Ð»ÐµÐºÑОО Оз ЎПкÑЌеМÑПв, вÑпПлМеММÑÑ 203 210 в ÑазлОÑÐœÑÑ 204 211 ÑПÑЌаÑÐ°Ñ … … 208 215 <p> 209 216 The documents in this collection have been produced by members of the Department of Computer Science, University of Waikato. 210 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 217 The University of Waikato holds copyright. They may be distributed freely, without any restrictions. 211 218 212 219 … … 221 228 ÑаЌÑе пПÑлеЎМОе веÑÑОО в кажЎÑй вÑпÑÑк Greenstone. ÐÑОбкО вПзМОкаÑÑ Ñ ÐœÐµÐŸÐ±ÑÑÐœÑÑ 222 229 ЎПкÑЌеМÑПв Word (МапÑОЌеÑ, ÐŸÑ ÑÑаÑÑÑ 223 ÑОÑÑеЌ ÐакОМÑПÑа), О ОМПгЎа ÑекÑÑ ÑжаÑМП ОзвлекаеÑÑÑ. ÐекПÑПÑÑе PDF ÑÐ°Ð¹Ð»Ñ ÐœÐµ ÑПзЎаÑÑ ÐœÐžÐºÐ°ÐºÐŸÐ³ÐŸ ЌаÑОММПÑОÑаеЌПгП ÑекÑÑа вППбÑе, а вЌеÑÑП ÑÑПгП вклÑÑаÑÑ 230 ÑОÑÑеЌ ÐакОМÑПÑа), О ОМПгЎа ÑекÑÑ ÑжаÑМП ОзвлекаеÑÑÑ. ÐекПÑПÑÑе PDF ÑÐ°Ð¹Ð»Ñ ÐœÐµ ÑПзЎаÑÑ ÐœÐžÐºÐ°ÐºÐŸÐ³ÐŸ ЌаÑОММПÑОÑаеЌПгП ÑекÑÑа вППбÑе, а вЌеÑÑП ÑÑПгП вклÑÑаÑÑ Ð¿ÐŸÑлеЎПваÑелÑМПÑÑÑ <i>ОзПбÑажеМОй</i> ÑÑÑаМОÑÑ, Оз кПÑПÑÑÑ 224 231 ÑекÑÑ ÐŒÐŸÐ¶ÐµÑ Ð±ÑÑÑ ÐžÐ·Ð²Ð»ÐµÑеМ ÑПлÑкП пÑÑеЌ ПпÑОÑеÑкПгП ÑаÑÐ¿ÐŸÐ·ÐœÐ°Ð²Ð°ÐœÐžÑ (OCR), ÑÑП в Greenstone Ме пÑеЎÑÑЌПÑÑеМП. _text1_ 225 232 <p> … … 228 235 <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>ÐПМÑОгÑÑаÑОПММÑй Ñайл</a> вклÑÑÐ°ÐµÑ ÐµÐŽÐžÐœÑÑвеММÑй ОМЎекÑ, ПÑМПваММÑй Ма ÑекÑÑе ЎПкÑЌеМÑа О ПЎОМ клаÑÑОÑОкаÑÐŸÑ <i>AZList</i>, ПÑМПваММÑй Ма ЌеÑаЎаММÑÑ 229 236 <i>ÐазваМОÑ</i>, пПказаММÑй <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">зЎеÑÑ</a> (алÑавОÑÐœÑй ПÑбПÑÑОк авÑПЌаÑОÑеÑкО ПÑклÑÑеМ, пПÑкПлÑÐºÑ ÐºÐŸÐ»Ð»ÐµÐºÑÐžÑ ÑПЎеÑÐ¶ÐžÑ ÑПлÑкП МеÑкПлÑкП ЎПкÑЌеМÑПв). ÐЎМакП ÐœÐžÐºÐ°ÐºÐžÑ 230 ПпеÑаÑПÑПв ÑПÑЌаÑа Ме ПпÑеЎелеМП. ÐÑО ПÑÑÑÑÑÑвОО ÑвМПй ОМÑПÑЌаÑОО Greenstone пПЎЎеÑÐ¶ÐžÐ²Ð°ÐµÑ Ð¿ÐŸ ÑЌПлÑÐ°ÐœÐžÑ ÐœÐ°ÐžÐ±ÐŸÐ»ÐµÐµ ПÑÑÑОЌÑе. Ð ÑÑПЌ ÑлÑÑае пП ÑЌПлÑÐ°ÐœÐžÑ ÐžÑпПлÑзÑÑÑÑÑ ÑлеЎÑÑÑОе ÑПÑЌаÑÑ ÐŽÐ»Ñ ÐºÐ»Ð°ÑÑОÑОкаÑПÑа:237 ПпеÑаÑПÑПв ÑПÑЌаÑа Ме ПпÑеЎелеМП. ÐÑО ПÑÑÑÑÑÑвОО ÑвМПй ОМÑПÑЌаÑОО Greenstone пПЎЎеÑÐ¶ÐžÐ²Ð°ÐµÑ Ð¿ÐŸ ÑЌПлÑÐ°ÐœÐžÑ ÐœÐ°ÐžÐ±ÐŸÐ»ÐµÐµ ПÑÑÑОЌÑе. Ð ÑÑПЌ ÑлÑÑае пП ÑЌПлÑÐ°ÐœÐžÑ ÐžÑпПлÑзÑÑÑÑÑ ÑлеЎÑÑÑОе ÑПÑЌаÑÑ ÐŽÐ»Ñ ÐºÐ»Ð°ÑÑОÑОкаÑПÑа: 231 238 <p> 232 239 … … 249 256 250 257 <pre> 251 format VList \"<td>[link][icon][/link]<\/td>\n 252 <td>[srclink][srcicon][/srclink]<\/td>\n 253 <td>[Title]<br><i>([Source])</i></td>\"\n 254 </pre> 255 " 258 format VList \" 259 <td>[link][icon][/link]<\/td>\n 260 <td>[srclink][srcicon][/srclink]<\/td>\n 261 <td>[Title]<br><i>([Source])</i></td>\"\n 262 </pre> 263 "
Note:
See TracChangeset
for help on using the changeset viewer.