Changeset 36623 for documented-examples/trunk/pagedimg-e/resources
- Timestamp:
- 2022-09-15T18:29:54+12:00 (20 months ago)
- Location:
- documented-examples/trunk/pagedimg-e/resources
- Files:
-
- 2 edited
Legend:
- Unmodified
- Added
- Removed
-
documented-examples/trunk/pagedimg-e/resources/collectionConfig.properties
r36621 r36623 4 4 shortDescription=<p>This collection contains a few newspapers from the <a href='http\://www.nzdl.org/cgi-bin/library?a=p&p=about&c=niupepa'>Niupepa</a> collection of Maori newspapers.</p> 5 5 6 description1=<h3>How the collection works</h3> <p>Each newspaper issue consists of a set of images, one per page, and a set of text files for the OCR \'d text. An item file links the set of pages into a single newspaper document. PagedImagePlugin is used to process the item files.</p>6 description1=<h3>How the collection works</h3> <p>Each newspaper issue consists of a set of images, one per page, and a set of text files for the OCR'd text. An item file links the set of pages into a single newspaper document. PagedImagePlugin is used to process the item files.</p> 7 7 8 8 description2=<p>There are two styles of item files, and this collection demonstrates both. The first uses a text based format, and consists of a list of metadata for the document, and a list of pages. Some examples are\: <i>Te Waka o Te Iwi, Vol. 1, No. 1</i> (in <tt>import/09/09_1_1.item</tt>) and <i>Te Whetu o Te Tau, Vol. 1, No. 3</i> (in <tt>import/10/10_1_3.item</tt>. This format allows specification of document level metadata, and a single list of pages.</p> … … 14 14 description5=<p><tt>plugin PagedImagePlugin -documenttype hierarchy -process_exp xml.*\.item$ ... <br/> plugin PagedImagePlugin -documenttype paged ...</tt></p> 15 15 16 description6=<p>XML based newpapers have been grouped into a folder called <tt>xml</tt>. This enables us to process these files differently, by utilising the <tt>process_exp</tt> option which all plugins support. The first PagedImagePlugin in the list looks for item files underneath the xml folder. These documents will be processed as hierarchical documents. Item files that don \'t match the process expression (i.e. aren\'t underneath the xml folder) will be passed onto the second PagedImagePlugin, and these are treated as paged documents.</p>16 description6=<p>XML based newpapers have been grouped into a folder called <tt>xml</tt>. This enables us to process these files differently, by utilising the <tt>process_exp</tt> option which all plugins support. The first PagedImagePlugin in the list looks for item files underneath the xml folder. These documents will be processed as hierarchical documents. Item files that don't match the process expression (i.e. aren't underneath the xml folder) will be passed onto the second PagedImagePlugin, and these are treated as paged documents.</p> 17 17 18 description7=<p><b>Formatting</b> <p>Unlike in Greenstone 2, where the document formatting was modified to customize the display, in Greenstone 3 we rely for the rest on Greenstone \'s default behaviour.</p>18 description7=<p><b>Formatting</b> <p>Unlike in Greenstone 2, where the document formatting was modified to customize the display, in Greenstone 3 we rely for the rest on Greenstone's default behaviour.</p> 19 19 -
documented-examples/trunk/pagedimg-e/resources/collectionConfig_fr.properties
r36620 r36623 1 name=Exemple d \'image mise en page1 name=Exemple d'image mise en page 2 2 section_text=pages de journaux 3 3 4 shortDescription=<p>Cette collection contient quelques journaux de la collection de journaux Maori <a href='http\://www.nzdl.org/cgi-bin/library?a=p&p=about&c=niupepa \'>Niupepa</a>.</p>4 shortDescription=<p>Cette collection contient quelques journaux de la collection de journaux Maori <a href='http\://www.nzdl.org/cgi-bin/library?a=p&p=about&c=niupepa'>Niupepa</a>.</p> 5 5 6 description1=<h3>Comment fonctionne la collection</h3> <p>Chaque numéro de revue est constitué d \'une série d\'images, une par page, et d\'une série de fichiers textuels issus de l\'OCR. Un fichier d\'exemplaire fait le lien entre la série d\'images et le document du numéro du journal. Le plugiciel PagedImagePlugin est utilisé pour traiter les fichiers d\'exemplaire.</p>6 description1=<h3>Comment fonctionne la collection</h3> <p>Chaque numéro de revue est constitué d'une série d'images, une par page, et d'une série de fichiers textuels issus de l'OCR. Un fichier d'exemplaire fait le lien entre la série d'images et le document du numéro du journal. Le plugiciel PagedImagePlugin est utilisé pour traiter les fichiers d'exemplaire.</p> 7 7 8 description2=<p>Il y a deux styles de fichiers d \'exemplaires, et cette collection les utilise tous les deux. Le premier utilise un format textuel, et regroupe une liste de métadonnées et une liste de pages. En voici quelques exemples \: Te Waka o Te Iwi, Vol. 1, No. 1 (<tt>import/09/09\_1\_1.item\</tt>), Te Whetu o Te Tau, Vol. 1, No. 3 (<tt>import/10/10\_1\_3.item\</tt>). Ce format permet de spécifier des métadonnées de niveau document, et une seule liste de pages.</p>8 description2=<p>Il y a deux styles de fichiers d'exemplaires, et cette collection les utilise tous les deux. Le premier utilise un format textuel, et regroupe une liste de métadonnées et une liste de pages. En voici quelques exemples \: Te Waka o Te Iwi, Vol. 1, No. 1 (<tt>import/09/09\_1\_1.item\</tt>), Te Whetu o Te Tau, Vol. 1, No. 3 (<tt>import/10/10\_1\_3.item\</tt>). Ce format permet de spécifier des métadonnées de niveau document, et une seule liste de pages.</p> 9 9 10 10 description3=<p>Le second style est un format étendu et utilise XML. Il permet de hiérarchiser les pages, et de spécifier des métadonnées aussi bien au niveau de la page que du document. En voici un exemple \: Matariki 1881, No. 2 (<tt>import/xml/23/23\_\_2.item\</tt>). Ce journal a aussi un résumé qui lui est associé. Les contenus ont donc été regroupés en deux sections \: matériaux complémentaires, qui contient les 11 11 résumés, et pages du journal, qui contient les images des pages.</p> 12 12 13 description4=<p>Les documents paginés peuvent être présentés avec une table des matiÚres hiérarchique (voir par exemple <a href='library/collection/pagedimg-e/document/23__1?ed=1'>celle-ci</a>), ou avec des flÚches de navigation pour atteindre la page précédente ou la page suivante, ainsi qu \'une boîte permettant d\'atteindre une page en particulier (par exemple <a href='library/collection/pagedimg-e/document/10_1_2'>celle-ci</a>). Cela est défini par l\'option <tt>-documenttype (hierarchy|paged)</tt> du plugiciel PagedImagePlugin. Les flÚches de navigation suivent l\'organisation linéaire des documents, tandis que la table des matiÚres respecte l\'organisation hiérarchique des documents. Normalement, une collection Greenstone utilise un seul plugiciel par type de document, et tous les documents de ce type subissent le même traitement. Dans ce cas, nous voulons traiter différemment les fichiers d\'exemplaires au format XML et les ficiers d\'exemplaires au format texte. Nous pouvons arriver à ce résultat en ajoutant deux plugiciels PagedImagePlugin à la collection, et en les configurant différemment de la façon suivante \:</p>13 description4=<p>Les documents paginés peuvent être présentés avec une table des matiÚres hiérarchique (voir par exemple <a href='library/collection/pagedimg-e/document/23__1?ed=1'>celle-ci</a>), ou avec des flÚches de navigation pour atteindre la page précédente ou la page suivante, ainsi qu'une boîte permettant d'atteindre une page en particulier (par exemple <a href='library/collection/pagedimg-e/document/10_1_2'>celle-ci</a>). Cela est défini par l'option <tt>-documenttype (hierarchy|paged)</tt> du plugiciel PagedImagePlugin. Les flÚches de navigation suivent l'organisation linéaire des documents, tandis que la table des matiÚres respecte l'organisation hiérarchique des documents. Normalement, une collection Greenstone utilise un seul plugiciel par type de document, et tous les documents de ce type subissent le même traitement. Dans ce cas, nous voulons traiter différemment les fichiers d'exemplaires au format XML et les ficiers d'exemplaires au format texte. Nous pouvons arriver à ce résultat en ajoutant deux plugiciels PagedImagePlugin à la collection, et en les configurant différemment de la façon suivante \:</p> 14 14 15 15 description5=<p><tt>plugin PagedImagePlugin -documenttype hierarchy -process_exp xml.*\.item$ ... <br/> plugin PagedImagePlugin -documenttype paged ...</tt></p> 16 16 17 description6=<p>Les journaux décrits en XML ont été regroupés dans un dossier appelé <tt>xml</tt>. Cela nous permet de traiter ces fichiers différemment, en utilisant l \'option <tt>process_exp</tt> dont disposent tous les plugiciels. Le premier plugiciel PagedImagePlugin de la liste recherche les fichiers d\'exemplaires à l\'intérieur du dossier xml. Ces documents seront alors traités comme des documents hiérarchisés. Les fichiers d\'exemplaires qui ne correspondent pas à l\'expression de recherche (c\'est à dire qui ne sont pas situés dans le dossier xml) seront traités par le second plugiciel PagedImagePlugin, comme des documents paginés.</p>17 description6=<p>Les journaux décrits en XML ont été regroupés dans un dossier appelé <tt>xml</tt>. Cela nous permet de traiter ces fichiers différemment, en utilisant l'option <tt>process_exp</tt> dont disposent tous les plugiciels. Le premier plugiciel PagedImagePlugin de la liste recherche les fichiers d'exemplaires à l'intérieur du dossier xml. Ces documents seront alors traités comme des documents hiérarchisés. Les fichiers d'exemplaires qui ne correspondent pas à l'expression de recherche (c'est à dire qui ne sont pas situés dans le dossier xml) seront traités par le second plugiciel PagedImagePlugin, comme des documents paginés.</p> 18 18 19 description7=[PENDING]<p><b>Formatage</b> <p>Nous avons modifié le formatage du document pour afficher les images en haute résolution, prévisualiser les images ou le texte, avec un bouton pour passer d \'un mode à l\'autre. Cela implique des modifications dans les déclarations des formats DocumentHeading et DocumentText, dans le fichier de configuration de la collection (<tt>(etc/collectionConfig.xml)</tt>), et la définition de certaines macros dans le fichier de macro extra.dm (<tt>macros/extra.dm</tt>). Le fichier de macro extra.dm définit les boutons (\_viewfullsize\_, \_viewpreview\_, \_viewtext\_) qui sont utilisés par la déclaration de format dans le fichier collect.cfg. La déclaration de format change l\'affichage du document et définit les boutons affichés en se basant sur l\'argument p, qui est aussi défini dans la déclaration du format.</p>19 description7=[PENDING]<p><b>Formatage</b> <p>Nous avons modifié le formatage du document pour afficher les images en haute résolution, prévisualiser les images ou le texte, avec un bouton pour passer d'un mode à l'autre. Cela implique des modifications dans les déclarations des formats DocumentHeading et DocumentText, dans le fichier de configuration de la collection (<tt>(etc/collectionConfig.xml)</tt>), et la définition de certaines macros dans le fichier de macro extra.dm (<tt>macros/extra.dm</tt>). Le fichier de macro extra.dm définit les boutons (\_viewfullsize\_, \_viewpreview\_, \_viewtext\_) qui sont utilisés par la déclaration de format dans le fichier collect.cfg. La déclaration de format change l'affichage du document et définit les boutons affichés en se basant sur l'argument p, qui est aussi défini dans la déclaration du format.</p>
Note:
See TracChangeset
for help on using the changeset viewer.