- Timestamp:
- 2009-05-11T12:01:36+12:00 (15 years ago)
- File:
-
- 1 edited
Legend:
- Unmodified
- Added
- Removed
-
collections/documented-examples/trunk/pagedimg-e/etc/collect.cfg
r19196 r19359 67 67 collectionmeta .section:text [l=en] "newspaper pages" 68 68 69 # -- Spanish strings -------------------- 70 collectionmeta collectionname [l=es] "Ejemplo de imágenes paginadas" 71 collectionmeta .section:text [l=es] "páginas de diario" 72 69 73 # -- English text ----------------------- 70 74 … … 124 128 " 125 129 130 # -- Spanish text ----------------------- 131 collectionmeta collectionextra [l=es] "Esta colección contiene algunos diarios de la colección 132 <a href='http://www.nzdl.org/cgi-bin/library?a=p&p=about&c=niupepa'> 133 Niupepa</a> de periódicos Maories. 134 135 <h3>Cómo funciona la colección</h3> 136 <p>Cada diario consiste en un conjunto de imágenes, una por página, y un conjunto de archivos de texto provenientes del OCR. Un archivo .item relaciona al conjunto de páginas en un único documento de diario. PagedImagePlugin se utiliza para procesar esos archivos .item. 137 <p>Hay dos estilos para escribir esos archivos item. y esta colección demuestra ambos. 138 El primero usa un formato básico de texto, y consiste en una lista de metadatos para el documento, y una lista de páginas. Aquà hay algunos ejemplos: 139 <a href='_httpcollection_/import/09/09\_1\_1.item'>Te Waka o Te Iwi, Vol. 1, No. 1</a>, 140 <a href='_httpcollection_/import/10/10\_1\_3.item'>Te Whetu o Te Tau, Vol. 1, No. 3</a>. 141 Este formato permite la especificación de metadatos a nivel de documento, y una lista simple de páginas. 142 <p>El segundo estilo es un formato extendido y usa XML. Permite una jerarquÃa de páginas, y una especificación de metadatos a nivel de documento como también de páginas. Un ejemplo es <a href='_httpcollection_/import/xml/23/23\_\_2.item'>Matariki 1881, No. 2</a>. 143 Este diario también tiene un resumen asociado a él. Los contenidos han sido agrupados en 2 secciones: Material Suplementario, la cual contiene el resumen, y Páginas del Diario, que contiene las imágenes de las páginas. 144 <p>Los documentos paginados pueden presentarse con una tabla de contenidos jerárquica 145 (por ej. <a href='?a=d&c=_cgiargc_&d=23\_\_1.2.1&p=text'>esta</a>), 146 o con flechas "Siguiente" y "Anterior" y un recuadro "Ir a la página..." 147 (por ej. <a href='?a=d&c=_cgiargc_&d=10\_1\_2&p=preview'>esta</a>). 148 Esto es definido por la opción <tt>-documenttype (hierarchy|paged)</tt> asignada al plugin PagedImagePlugin. 149 Las flechas Siguiente y Anterior permiten seguir el documento de manera lineal, mientras que la tabla de contenidos muestra al documento organizado jerárquicamente. Generalmente, una colección de Greenstone tendrÃa un plugin por cada tipo de documento y todos los documentos de ese mismo tipo tendrÃan el mismo procesamiento. En este caso, queremos tratar los archivos .item con formato XML de manera diferente a aquellos con formato de texto plano. Esto puede lograrse agregando dos plugin PagedImagePlugin a la colección, y configurándolo de manera diferente. 150 <p><tt>plugin PagedImagePlugin -documenttype hierarchy -process_exp xml.*\.item$ <br/> 151 plugin PagedImagePlugin -documenttype paged </tt> 152 153 <p>Los diarios basados en XML han sido agrupados en una carpeta llamada <tt>xml</tt>. 154 Esto nos permite procesar esos archivos de una manera diferente, utilizando la opción <tt>process_exp</tt> que es soportada por todos los plugins. El primer plugin PagedImagePlugin 155 en la lista busca archivos .item que se encuentren en la carpeta xml. Estos documentos se procesarán como documentos jerárquicos. Los archivos .item que no coincidan con la expresión de procesamiento (por ejemplo, los que no estén dentro de la carpeta xml) serán pasados al segundo plugin PagedImagePlugin, y se tratarán como documentos paginados. 156 157 <p><b>Formateo</b> 158 <p>Hemos modificado el formateo del documento para mostrar imágenes a tamaño completo, previsualizar imágenes o texto y botones para cambiar entre estas opciones. Esto involucra modificaciones a las cadenas de formateo del DocumentHeading y el DocumentText en el 159 <a href='_httpcollection_/etc/collect.cfg' target=\'collect.cfg\'>archivo de configuración de la colección.</a>, 160 y algunas definiciones de macros en el <a href='_httpcollection_/macros/extra.dm' target=\'extra.dm\'>archivo de macros extra.dm</a>. 161 El archivo extra.dm provee definiciones para los botones (\_viewfullsize\_, 162 \_viewpreview\_, \_viewtext\_) los cuales son usados por la sentencia de formateo en el archivo collect.cfg. La sentencia de formateo cambia la visualización del documento y setea los botones que deben mostrarse basándose en el argumento p, el cual es configurado también en la misma sentencia. 163 "
Note:
See TracChangeset
for help on using the changeset viewer.