Changeset 19692
- Timestamp:
- 2009-05-31T11:11:56+12:00 (15 years ago)
- File:
-
- 1 edited
Legend:
- Unmodified
- Added
- Removed
-
collections/documented-examples/trunk/pagedimg-e/etc/collect.cfg
r19565 r19692 68 68 collectionmeta collectionname [l=en] "Paged Image example" 69 69 collectionmeta .section:text [l=en] "newspaper pages" 70 71 # -- French strings -------------------- 72 collectionmeta collectionname [l=fr] "Exemple d'image mise en page" 73 collectionmeta .section:text [l=fr] "pages de journaux" 70 74 71 75 # -- Spanish strings -------------------- … … 134 138 " 135 139 140 # -- French text ----------------------- 141 142 collectionmeta collectionextra [l=fr] " 143 Cette collection contient quelques journaux de la collection de journaux Maori 144 <a href='http://www.nzdl.org/cgi-bin/library?a=p&p=about&c=niupepa'>Niupepa</a>. 145 146 <h3>Comment fonctionne la collection</h3> 147 148 <p>Chaque numéro de revue est constitué d'une série d'images, une par page, et d'une série de 149 fichiers textuels issus de l'OCR. Un fichier d'exemplaire fait le lien entre la série d'images 150 et le document du numéro du journal. Le plugiciel PagedImagePlugin est utilisé pour traiter les 151 fichiers d'exemplaire. <p>Il y a deux styles de fichiers d'exemplaires, et cette collection les 152 utilise tous les deux. Le premier utilise un format textuel, et regroupe une liste de métadonnées 153 et une liste de pages. 154 155 En voici quelques exemples : <a href='_httpcollection_/import/09/09\_1\_1.item'>Te Waka o Te Iwi, Vol. 1, No. 1</a>, 156 <a href='_httpcollection_/import/10/10\_1\_3.item'>Te Whetu o Te Tau, Vol. 1, No. 3</a>. 157 Ce format permet de spécifier des métadonnées de niveau document, et une seule liste de pages. 158 159 <p>Le second style est un format étendu et utilise XML. Il permet de hiérarchiser les pages, 160 et de spécifier des métadonnées aussi bien au niveau de la page que du document. 161 En voici un exemple : <a href='_httpcollection_/import/xml/23/23\_\_2.item'>Matariki 1881, No. 2</a>. 162 Ce journal a aussi un résumé qui lui est associé. Les contenus ont donc été regroupés en deux sections : 163 matériaux complémentaires, qui contient les résumés, et pages du journal, qui contient les images des pages. 164 Les documents paginés peuvent être présentés avec une table des matiÚres hiérarchique (voir par exemple 165 <a href='?a=d&c=_cgiargc_&d=23\_\_1.2.1&p=text'>celle-ci</a>), ou avec des flÚches de navigation pour 166 atteindre la page précédente ou la page suivante, ainsi qu'une boîte permettant d'atteindre une page en particulier 167 (par exemple <a href='?a=d&c=_cgiargc_&d=10\_1\_2&p=preview'>celle-ci</a>). Cela est défini par l'option 168 <tt>-documenttype (hierarchy|paged)</tt> du plugiciel PagedImagePlugin. Les flÚches de navigation suivent l"organisation 169 linéaire des documents, tandis que la table des matiÚres respecte l'organisation hiérarchique des documents. Normalement, 170 une collection Greenstone utilise un seul plugiciel par type de document, et tous les documents de ce type subissent le même 171 traitement. Dans ce cas, nous voulons traiter différemment les fichiers d'exemplaires au format XML et les ficiers d'exemplaires 172 au format texte. Nous pouvons arriver à ce résultat en ajoutant deux plugiciels PagedImagePlugin à la collection, et en 173 les configurant différemment de la façon suivante : 174 <p><tt>plugin PagedImagePlugin -documenttype hierarchy -process_exp xml.*\.item$ <br/> 175 plugin PagedImagePlugin -documenttype paged </tt> <p>Les journaux décrits en XML ont été regroupés dans un dossier 176 appelé <tt>xml</tt>. Cela nous permet de traiter ces fichiers différemment, en utilisant l'option <tt>process_exp</tt> 177 dont disposent tous les plugiciels. Le premier plugiciel PagedImagePlugin de la liste recherche les fichiers d'exemplaires 178 à l'intérieur du dossier xml. Ces documents seront alors traités comme des documents hiérarchisés. Les fichiers d'exemplaires 179 qui ne correspondent pas à l'expression de recherche (c'est à dire qui ne sont pas situés dans le dossier xml) seront traités 180 par le second plugiciel PagedImagePlugin, comme des documents paginés. <p><b>Formatage</b> <p>Nous avons modifié le formatage 181 du document pour afficher les images en haute résolution, prévisualiser les images ou le texte, avec un bouton pour passer 182 d'un mode à l'autre. Cela implique des modifications dans les déclarations des formats DocumentHeading et DocumentText, 183 dans le <a href='_httpcollection_/etc/collect.cfg' target=\'collect.cfg\'>fichier de configuration de la collection</a>, 184 et la définition de certaines macros dans le <a href='_httpcollection_/macros/extra.dm' target=\'extra.dm\'>fichier de 185 macro extra.dm</a>. Le fichier de macro extra.dm définit les boutons (\_viewfullsize\_, \_viewpreview\_, \_viewtext\_) qui 186 sont utilisés par la déclaration de format dans le fichier collect.cfg. La déclaration de format change l'affichage du document 187 et définit les boutons affichés en se basant sur l'argument p, qui est aussi défini dans la déclaration du format. 188 " 189 136 190 # -- Spanish text ----------------------- 137 191 collectionmeta collectionextra [l=es] "Esta colección contiene algunos diarios de la colección
Note:
See TracChangeset
for help on using the changeset viewer.