root/collections/documented-examples/trunk/gsarch-e/etc/collect.cfg @ 19786

Revision 19786, 25.8 KB (checked in by anna, 10 years ago)

display English text where translations are missing.

  • Property svn:executable set to *
Line 
1creator     greenstone@cs.waikato.ac.nz
2maintainer  greenstone@cs.waikato.ac.nz
3public      true
4
5buildtype   mg
6
7indexes     document:text document:From document:Subject
8defaultindex    document:text
9
10plugin      GreenstoneXMLPlugin
11# process_exp tells EmailPlugin which files to process - in this case all files
12# starting with 'greenstone'. This is used as the email files in this
13# collection don't have a standard mbx/email extension.
14# OIDtype message_id tells the plugin to use the message identifier as the
15# Greenstone document identifier - this way we can use the InReplyTo metadata
16# to link to the original email.
17plugin      EmailPlugin -process_exp greenstone.* -OIDtype message_id
18plugin      MetadataXMLPlugin
19plugin      ArchivesInfPlugin
20plugin      DirectoryPlugin
21groupsize      200
22
23# note that [ and ] get turned into &#9x; before we remove the prefix!
24# mingroup 2 so that bookshelves are only generated when there is more than
25# one item with a common value.
26# removeprefix removes re: fwd: [greenstone-users] [greenstone-devel] from
27# the subject line before classifying, so that messages and their replies end
28# up in the same folder.
29classify    AZCompactList -metadata Subject -mingroup 2 -removeprefix (\\s*(?i:re:|fw(d)?:|\[greenstone-(users|devel)\])\\s*)*
30classify    AZCompactList -metadata FromName -mingroup 2 -buttonname From
31classify    DateList -nogroup  -bymonth
32
33format DocumentHeading ""
34format DocumentButtons ""
35format DocumentArrowsTop false
36format DocumentArrowsBottom false
37format DocumentGoTo false
38
39# removed from format strings to prevent listing email addresses - John:
40# &lt;<a href=\"mailto:[FromAddr]\">[FromAddr]</a>&gt;
41
42# for Subjects
43format CL1VList "
44<td valign=top>[link][icon][/link]</td>
45<td>{If}{[numleafdocs], <b>[Title]</b>,<b>[link][Subject][/link]</b><br>
46_From_: [FromName] &nbsp;&nbsp;(<a href=\"_httpquery_&q=[cgisafe:FromName]&h=dfr\">_SearchBySender_</a>) <br>
47_Date_: [DateText]}</td>
48"
49
50# for From
51format CL2VList "
52<td valign=top>[link][icon][/link]</td>
53<td>{If}{[numleafdocs],
54<strong>_From_:</strong> [Title] ([numleafdocs]),
55<strong>_From_: [FromName]</strong> &nbsp;&nbsp;(<a href=\"_httpquery_&q=[cgisafe:FromName]&h=dfr\">_SearchBySender_</a>) <br>
56<strong>_Subject_:</strong> [link][Subject][/link]<br>
57<strong>_Date_:</strong> [DateText]
58}</td>
59"
60
61# for Dates
62format CL3DateList "
63<td valign=top>[link][icon][/link]</td>
64<td><b>[link][Subject][/link]</b><br>
65_From_: [FromName] &nbsp;&nbsp;(<a href=\"_httpquery_&q=[cgisafe:FromName]&h=dfr\">_SearchBySender_</a>)<br>
66_Date_: [DateText]
67</td>
68"
69
70format SearchVList "
71<td valign=top>[link][icon][/link]</td>
72<td><b>[link][Subject][/link]</b><br>
73_From_: [FromName] &nbsp;&nbsp;(<a href=\"_httpquery_&q=[cgisafe:FromName]&h=dfr\">_SearchBySender_</a>)<br>
74_Date_: [DateText]
75</td>
76"
77
78format DocumentText "<center> <h2>[Subject]</h2>
79<p>
80<table width=\"90%\">
81<tr bgcolor=\"#DDDDEE\">
82<td align=\"right\">_From_</td>
83<td><b><a href=\"_httpquery_&q=[cgisafe:FromName]&h=dfr\">[FromName]</a></b>
84</td>
85</tr>
86<tr bgcolor=\"#DDDDEE\">
87<td align=\"right\">_Date_</td><td><b>[DateText]</b></td>
88</tr>
89<tr bgcolor=\"#DDDDEE\">
90<td align=\"right\">_Subject_</td>
91<td><b>[Subject]</b></td></tr>
92_If_([InReplyTo],<tr bgcolor=\"#DDDDEE\"><td align=\"right\">In-Reply-To</td><td>
93<a href=\"_httpdocument_&amp;d=[InReplyTo]\">([InReplyTo])</a></td></tr>)
94<tr><td colspan=\"2\">[Text]</td></tr>
95</table>
96</p>
97</center>"
98
99format VList "<td valign=\"top\">[link][icon][/link]</td>
100<td valign=\"top\">[ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]</td>
101<td valign=\"top\">[highlight]
102{Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}
103[/highlight]{If}{[ex.Source],<br><i>([ex.Source])</i>}</td>"
104
105format HList "[link][highlight][ex.Title][/highlight][/link]"
106
107format DateList "<td>[link][icon][/link]</td>
108<td>[highlight]{Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}[/highlight]</td>
109<td>{Or}{[dc.Date],[exp.Date],[ex.Date]}</td>"
110
111
112# -- English strings ----------------
113collectionmeta  collectionname [l=en] "Greenstone Archives collection"
114
115collectionmeta  .document:text [l=en] "Messages"
116collectionmeta  .document:From [l=en] "From fields"
117collectionmeta  .document:Subject [l=en] "Subject lines"
118
119collectionmeta  From [l=en] "From"
120collectionmeta  Date [l=en] "Date"
121collectionmeta  Subject [l=en] "Subject"
122collectionmeta  SearchBySender [l=en] "search by sender"
123
124# -- French strings ----------------
125collectionmeta  collectionname [l=fr] "Collection des Archives de Greenstone"
126
127collectionmeta  .document:text [l=fr] "Messages"
128collectionmeta  .document:From [l=fr] "Champs De"
129collectionmeta  .document:Subject [l=fr] "Lignes de sujets"
130
131collectionmeta  From [l=fr] "De"
132collectionmeta  Date [l=fr] "Date"
133collectionmeta  Subject [l=fr] "Sujet"
134collectionmeta  SearchBySender [l=fr] "recherche par expéditeur"
135
136# -- Spanish strings ----------------
137collectionmeta  collectionname [l=es] "Colección de Archivos Greenstone"
138
139collectionmeta  .document:text [l=es] "Mensaje"
140collectionmeta  .document:From [l=es] "Campos de origen"
141collectionmeta  .document:Subject [l=es] "Líneas del asunto"
142
143collectionmeta  From [l=es] "De"
144collectionmeta  Date [l=es] "Fecha"
145collectionmeta  Subject [l=es] "Asunto"
146collectionmeta  SearchBySender [l=es] "buscar por emisor"
147
148# -- Russian strings ----------------
149collectionmeta  collectionname [l=ru] "КПллекцОя архОвПв Greenstone"
150
151collectionmeta  .document:text [l=ru] "СППбщеМОя"
152collectionmeta  .document:From [l=ru] "Из пПлей"
153collectionmeta  .document:Subject [l=ru] "СтрПкО преЎЌета"
154
155collectionmeta  From [l=ru] "От"
156collectionmeta  Date [l=ru] "Дата"
157collectionmeta  Subject [l=ru] "ПреЎЌет"
158collectionmeta  SearchBySender [l=ru] "ППОск пП ПтправОтелю"
159
160# -- Simplified Chinese strings ----------------
161collectionmeta  collectionname [l=zh] "Greenstone存档銆藏"
162
163collectionmeta  .document:text [l=zh] "消息"
164collectionmeta  .document:From [l=zh] "来自字段"
165collectionmeta  .document:Subject [l=zh] "䞻题行"
166
167collectionmeta  From [l=zh] "来自"
168collectionmeta  Date [l=zh] "日期"
169collectionmeta  Subject [l=zh] "䞻题"
170collectionmeta  SearchBySender [l=zh] "按发送者搜玢"
171
172# -- English text ----------------
173collectionmeta  collectionextra [l=en] "This is a collection of email messages
174from the Greenstone mailing list archives, from November/December, 2008.
175
176<h3>How the collection works</h3>
177
178<p>
179The Greenstone Archives collection
180uses the <i>Email</i> plugin, which parses files in email formats. In this case, there is a file per month per mailing list, and each file contains many email messages. The <i>Email</i>
181plugin splits these into individual documents, and produces <i>Title</i>,
182<i>Subject</i>, <i>From</i>, <i>FromName</i>, <i>FromAddr</i>,
183<i>Date</i>, <i>DateText</i>, <i>InReplyTo</i>, and optionally <i>Headers</i>, metadata.
184
185<p>
186The <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>collection configuration file</a> begins with the specification
187<i>groupsize 200</i>. This groups documents together into groups of 200. Email
188collections typically have many small documents, and grouping them together
189prevents Greenstone\'s internal file structures from becoming bloated and
190occupying more disk space than necessary. Notice that the <i>Email</i> plugin first
191splits the input files up into individual Emails, then <i>groupsize</i> groups them
192together again. This allows the collection designer to control what is going on.
193
194<p>
195The <i>indexes</i> line specifies 3 searchable indexes, which can be seen by clicking
196beside the word \"Messages\" on the
197<a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=q\">search page</a> to reveal a drop-down menu.
198The first (called <i>Messages</i>) is created from the document
199text, while the others are formed from <i>From</i> and <i>Subject</i> metadata.
200
201<p>
202There are three classifiers, based on <i>Subject</i>, <i>FromName</i>, and
203<i>Date</i> metadata. The <i>AZCompactList</i> classifier used for the first
204two is like <i>AZList</i> but generates a bookshelf for duplicate items, as
205illustrated <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">here</a>.
206This is represented by a tree structure whose nodes are either
207leaf nodes, representing documents, or internal nodes. A metadata item called
208numleafdocs gives the total number of documents below an internal node. The
209format statement for the first classifier, called <i>CL1Vlist</i>, checks
210whether this item exists. If so the node must be an internal one, in which case
211it is labeled by its <i>Title</i>. Otherwise the node\'s label starts with the
212<i>Subject</i> which links to the document, then gives <i>FromName</i> metadata, with a link to \"Search by Sender\", followed by the <i>DateText</i>.
213
214<p>
215The second classifier (<i>CL2Vlist</i>) is similar, but shows slightly
216different information -- the result can be seen
217<a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2\">here</a>.
218For internal nodes, the actual number of leaf documents
219(<i>numleafdocs</i>) is given in parentheses after the <i>Title</i>. For
220document nodes the <i>FromName</i>, with a link to \"Search By Sender\", <i>Subject</i> (linked to the document), and <i>DateText</i> metadata is
221shown.
222
223<p>
224The third classifier is a <i>DateList</i>, which allows selection by month and year.
225
226<p>
227Finally, the document text is formatted to show the header fields (<i>FromName</i>, <i>DateText</i>, <i>Subject</i>, <i>InReplyTo</i>), followed by
228the message text (written as <i>[Text]</i> in the format statement). <i>FromName</i> is linked to a search on that name, while <i>InReplyTo</i> links to the email message that it refers to.
229"
230
231# -- French text ----------------
232collectionmeta  collectionextra [l=fr] "
233
234Cette collection est composée de messages électroniques extraits des archives de la liste de diffusion Greenstone,
235publiés entre novembre et décembre 2008.
236
237<h3>Comment fonctionne cette collection ?</h3>
238
239<p>
240La collection Greenstone Archive utilise le plugin \"<i>E-mail</i>\", qui traite les fichiers aux formats e-mail.
241Dans ce cas, il y a un fichier par mois et par liste de diffusion, et chaque fichier contient de nombreux messages.
242Le plugin <i>E-mail</i> les éclate en documents individuels et produit les métadonnées
243<i>Title</i>, <i>Subject</i>, <i>Headers</i> (en option), <i>From</i>, <i>FromName</i>,
244<i>FromAddr</i>, <i>Date</i> et <i>DateText</i>.
245
246<p>
247Le <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>fichier de configuration</a> de la collection débute avec la spécification <i>groupsize 200</i>. Ceci regroupe les documents par groupes de 200. Les collections E-mail sont constituées habituellement de plusieurs documents de petite taille; leur regroupement évite l\'augmentation excessive des structures de fichier internes de Greenstone et l\'occupation de plus d\'espace disque que nécessaire. Notez que le plugin <i>E-mail</i> éclate d\'abord les fichiers d\'entrée à traiter en E-mail individuels, ensuite <i>groupsize</i> procÚde à leur regroupement. Ceci permet au créateur de la collection de contrÎler ce qui se passe.
248
249<p>
250La ligne des <i>indexes</i> précise trois indexes de recherche qui peuvent être vus en cliquant à cÎté du mot \"Message\" de la <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=q\">page de recherche</a> pour révéler un menu déroulant. Le premier (appelé <i>Messages</i>) est créé à partir
251du texte du document, tandis que les autres sont formés à partir des méta-données <i>From</i> et <i>Subject</i>.
252
253<p>
254Il existe trois classificateurs basés sur les méta-données <i>Subject</i>, <i>FromName</i> et <i>Date</i>. Le classificateur <i>AZCompactList</i> utilisé pour les deux premiers est semblable
255à \"<i>AZList</i>\", mais en outre il génÚre un rayon de bibliothÚque pour les articles dupliqués, comme illustré <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">ici</a>.
256Il est représenté par une structure arborescente dont les nœuds sont soit des nœuds de feuille
257représentant les documents, soit des nœuds internes. Une Méta-donnée appelée
258\"Numleafdocs\" donne le nombre total de documents sous un nœud interne. Les déclarations de format pour le premier classificateur, appelé <i>CL1VList</i>, vérifie si cette méta-donnée existe, auquel cas le nœud doit être d\'une part interne et d\'autre part libellé par son \"<i>Title</i>\" (<i>Titre</i>). Sinon le nom du noeud commencera par le <i>Subject</i> qui fait le lien vers le document, suivi par la métadonnée <i>FromName</i>, avec un lien vers la \"Recherche par expéditeur\" et enfin par la <i>DateText</i>.
259
260<p>
261Le deuxiÚme classificateur (<i>CL2Vlist</i>) est similaire, mais fournit une
262information légÚrement différente --le résultat peut être vu
263<a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2\">ici</a>.
264Pour les nœuds internes, le nombre exact de documents en feuilles
265(<i>numleafdocs</i>) est donné entre parenthÚses aprÚs <i>Title</i>.
266Pour les documents noeuds, les métadonnées suivantes seront visibles :
267<i>FromName</i>,  avec un lien vers la \"Recherche par expéditeur\",
268<i>Subject</i> (avec un lien vers le document), et <i>DateText</i>.
269
270<p>
271Le troisiÚme classificateur est un \"<i>DateList</i>\" qui permet une sélection par mois et par année.
272
273<p>
274Pour finir, le document est mis en forme pour montrer les entêtes (<i>FromName</i>, <i>DateText</i>, <i>Subjet</i>, <i>InReplyTo</i>), suivis par le texte du message (écrit en tant que <i>[Text]</i> dans le format d'enregistrement). FromName est un lien vers une recherche sur ce nom, tandis que InReplyTo est un lien vers le message électronique auquel celui-ci se réfÚre.
275"
276
277# -- Spanish text ----------------
278collectionmeta  collectionextra [l=es] "
279Esta es una colección de mensajes de email del archivo de la lista de mailing de Greenstone, de Noviembre/Diciembre de 2008.
280
281<h3>Cómo trabaja esta colección</h3>
282<p>
283
284La colección de Archivos de Greenstone utiliza el plugin <i>Email</i>, el cual descompone y analiza los archivos que están en formato de correo electrónico. En este caso, hay un archivo por mes por lista, y cada archivo contiene muchos mensajes de email. El plugin <i>Email</i> los divide en documentos individuales y produce los metadatos <i>Title</i>, <i>Subject</i>, <i>From</i>, <i>FromName</i>, <i>FromAddr</i>, <i>Date</i>, <i>DateText</i>, <i>InReplyTo</i>, y opcionalmente <i>Headers</i>.
285<p>
286
287El <a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>archivo de configuración de la colección</a> empieza con la especificación <i>groupsize 200</i>, la cual reúne los documentos en grupos de 200. En términos generales las colecciones de correo electrónico tienen muchos documentos pequeños y al agruparlos se evita que las estructuras de archivos internos de Greenstone se inflen demasiado y ocupen más espacio del necesario. Recuerde que el plugin <i>Email</i> divide primero los archivos de entrada en correos individuales y luego <i>groupsize</i> los agrupa nuevamente. Esto le permite al diseñador de la colección controlar lo que está pasando.
288<p>
289
290La línea de índices especifica 3 índices de búsqueda, los cuales se pueden ver haciendo click a un lado de la palabra \"Mensajes\" en la <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=q\">página de búsqueda</a> para que aparezca un menú descendente. El primero (llamado <i>Mensajes</i>) se crea a partir del texto del documento, mientras que los demás se forman a partir de los metadatos de <i>Remitente</i> y <i>Asunto</i>.
291<p>
292
293Existen tres clasificadores basados en los metadatos de <i>Asunto, Nombre del Remitente</i> y <i>Fecha</i>. El clasificador <i>AZCompactList</i> utilizado para los dos primeros es como <i>AZList</i>, pero además genera un estante para los ítems duplicados, tal como se puede ver <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">aquí</a>. Éste se caracteriza por medio de una estructura de árbol cuyos nodos son hojas que representan documentos o nodos internos. Un ítem de metadato llamado <i>numleafdocs</i> proporciona el número total de documentos debajo de un nodo interno. Los enunciados de formato para el primer clasificador llamado <i>CL1Vlist</i> comprueban si existe dicho ítem. En caso afirmativo se trata de un nodo interno, en cuyo caso se etiquetará por su <i>Título</i>. Además, la etiqueta del nodo comienza con <i>Subject</i> que es un link al documento, luego el metadato <i>FromName</i>, con un link a \"Search by sender\", seguido por la fecha <i>DateText</i>.
294<p>
295
296El segundo clasificador (CL2Vlist) es similar, sólo que muestra una información ligeramente diferente. El resultado se puede ver <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2\">aquí</a>. Para nodos internos el número de documentos (<i>numleafdocs</i>) aparece entre paréntesis después del <i>Título</i>. Para los nodos de los documentos se muestran el <i>FromName</i>, con un link a \"Search by Sender"\", el <i>Subject</i> (enlazado al documento), y <i>DateText</i>.
297<p>
298
299El tercer clasificador es una <i>Lista de Fechas (DateList)</i>, que permite hacer la selección por mes y año.
300<p>
301
302Finalmente, el document text está formateado para mostrar los campos del encabezado (<i>FromName</i>, <i>DateText</i>, <i>Subject</i>, <i>InReplyTo</i>), seguido del texto del mensaje (escrito como <i>[Text]</i> en la cadena de formateo). FromName está enlazado a una búsqueda sobre ese mismo nombre, mientras que InReplyTo enlaza con el mensaje al cual hace referencia.
303"
304
305# -- Russian strings ----------------
306collectionmeta  collectionextra [l=ru] "
307<!-- _text1_ -->
308This is a collection of email messages
309from the Greenstone mailing list archives, from November/December, 2008.
310
311<h3>Как рабПтает кПллекцОя</h3>
312
313КПллекцОя архОвПв Greenstone ОспПльзует плагОМ Еmail, кПтПрый аМалОзОрует файлы в фПрЌатах ÑÐ»ÐµÐºÑ‚рПММПй пПчты. <!-- _text2_ -->In this case, there is a file per month per mailing list, and each file contains many email messages.  ПлагОМ Еmail разбОвает Ох ÐœÐ° ОМЎОвОЎуальМые ЎПкуЌеМты О сПзЎает <i>НазваМОе</i>, <i>ПреЎЌет</i>, <i>От</i>, <i>ИЌя ПтправОтеля</i>, <i>АЎрес ПтправОтеля</i>, <i>Дата</i>, <i>Дата текстПЌ</i>, <i>КПЌу Ответ</i> О выбПрПчМП <i>ЗагПлПвкО</i>.
314<p>
315
316КПМфОгурацОПММый файл кПллекцОО МачОМается с ПпреЎелеМОя <i>groupsize</i> 200. ОМ сПбОрает ЎПкуЌеМты в группы пП 200 еЎОМОц. КПллекцОО электрПММПй пПчты ПбычМП сПстПят Оз бПльшПгП чОсла МебПльшОх ÐŽÐŸÐºÑƒÐŒÐµÐœÑ‚Пв, О группОрПвка Ох Ð²ÐŒÐµÑÑ‚е преЎПтвращает вМутреММОе файлПвые структуры Greenstone Пт разбухаМОя О заМятОя бПльшегП Ќеста Ма ЎОске, чеЌ МеПбхПЎОЌП. ЗаЌетьте, чтП плагОМ Еmail вМачале разбОвает вхПЎМые файлы Ма ОМЎОвОЎуальМые электрПММые пОсьЌа, а затеЌ <i>groupsize</i> сМПва сПбОрает Ох Ð²ÐŒÐµÑÑ‚е. ЭтП пПзвПляет прПектОрПвщОку кПллекцОО управлять теЌ, чтП слеЎует Ўальше.
317<p>
318
319СтрПка <i>ОМЎексПв (indexes)</i> ПпреЎеляет 3 ЎПступМых ÐŽÐ»Ñ пПОска ОМЎекса, кПтПрые ЌПгут быть вОЎМы, еслО щелкать ПкПлП слПва <i>СППбщеМОя (Messages)</i> Ма <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=q\">пПОскПвПй страМОце</a> Ўля пПказа МОспаЎающегП ЌеМю. Первый, МазываеЌый <i>СППбщеМОяЌО</i>, сПзЎается Оз текста ЎПкуЌеМта, в тП вреЌя как ЎругОе сфПрЌОрПваМы пП ЌетаЎаММыЌ <i>От кПгП О ПреЎЌет</i>.
320<p>
321
322Существует трО классОфОкатПра, ПсМПваММые Ма ЌетаЎаММых <i>ПреЎЌет</i>, <i>ИЌя ПтправОтеля</i> О <i>Дата</i>. КлассОфОкатПр <i>AZCompactList</i>, ОспПльзуеЌый Ўля первых ÐŽÐ²ÑƒÑ…, пПхПж Ма <i>AZLIST</i>, МП ПМ фПрЌОрует кМОжМую пПлку Ўля ЎублОкатПв элеЌеМтПв, как пПказаМП <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">зЎесь</a>. ОМа преЎставлеМа структурПй Ўерева, узлы кПтПрПй являются ОлО узлаЌО лОста, преЎставляя ЎПкуЌеМты, ОлО вМутреММОЌО узлаЌО. МетаЎаММые элеЌеМтПв, МазываеЌые numleafdocs, Ўают Пбщее кПлОчествП ЎПкуЌеМтПв, распПлПжеММых ÐœÐžÐ¶Ðµ вМутреММегП узла. ОператПры фПрЌата Ўля первПгП классОфОкатПра, МазываеЌые <i>CL1Vlist</i>, прПверяют, существует лО этПт элеЌеМт. ЕслО этП так, тП узел ЎПлжеМ быть вМутреММОЌ, в случае чегП ПМ пПЌечается егП <i>НазваМОеЌ (Title)</i>. <!-- _text4_ -->Otherwise the node\'s label starts with the
323<i>Subject</i> which links to the document, then gives <i>FromName</i> metadata, with a link to \"Search by Sender\", followed by the <i>DateText</i>.
324<p>
325
326ВтПрПй классОфОкатПр (<i>CL2Vlist</i>) пПЎПбеМ первПЌу, МП ПМ пПказывает ПтлОчающуюся ОМфПрЌацОю -- результат ЌПжМП вОЎеть <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2\">зЎесь</a>. Для вМутреММОх ÑƒÐ·Ð»ÐŸÐ² фактОческПе чОслП ЎПкуЌеМтПв в спОске (<i>numleafdocs</i>) Ўается в круглых ÑÐºÐŸÐ±ÐºÐ°Ñ… Ð¿ÐŸÑÐ»Ðµ <i>НазваМОя</i>. <!-- _text5_ -->For
327document nodes the <i>FromName</i>, with a link to \"Search By Sender\", <i>Subject</i> (linked to the document), and <i>DateText</i> metadata is
328shown.
329<p>
330
331ТретьОЌ классОфОкатПрПЌ является <i>DateList</i>, кПтПрый пПзвПляет прПОзвПЎОть выбПрку сППбщеМОй пП Ќесяцу О гПЎу.
332<p>
333
334<!-- _text6_ -->Finally, the document text is formatted to show the header fields (<i>FromName</i>, <i>DateText</i>, <i>Subject</i>, <i>InReplyTo</i>), followed by
335the message text (written as <i>[Text]</i> in the format statement). FromName is linked to a search on that name, while InReplyTo links to the email message that it refers to.
336"
337
338# -- Simplified Chinese text ----------------
339collectionmeta  collectionextra [l=zh] "
340本銆藏由Greenstone邮件列衚文档䞭2008幎11月䞎12月的email消息组成。
341 
342<h3>本銆藏劂䜕工䜜</h3>\n
343
344<p>
345Greenstone存档銆藏䜿甚<i>Email</i>插件这䞪插件倄理email栌匏的文件。圚本銆藏这每䞪邮件列衚每䞪月郜有䞀䞪对应的文件
346而每䞪文件包含讞倚email消息。<i>Email</i> 插件将这些文件分成单䞪的文档并生成<i>标题</i>、<i>䞻题</i>、<i>发件人</i>、
347<i>发件人名称</i>、<i>发件人地址</i>、<i>日期</i>、<i>日期文本</i>、<i>回倍</i>以及选择性的<i>题名</i>元数据。
348
349<p>
350銆藏<a href=\"_httpcollection_/etc/collect.cfg\" target=collect.cfg>配眮文件</a>起始于<i>groupsize 200</i>讟眮。
351这䞪讟眮将文档以200䞺单䜍分组。Email銆藏通垞有讞倚小文档而将这些小文档分成小组可避免Greenstone的内郚
352文件结构变埗过于庞杂䞔占据䞍必芁的磁盘空闎。请泚意<i>Email</i>插件銖先将蟓入文件分成单䞪的email然后<i>groupsize</i>
353再将它们分组。这䜿埗銆藏的讟计者可以对过皋加以控制。
354
355<p>
356<i>indexes</i>行讟眮了3䞪䟛检玢的玢匕这可通过圚<a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=q\">搜玢页面</a>侊
357点击\"消息\"产生䞀䞪䞋拉列衚菜单。第䞀䞪称䞺<i>消息</i>是从文档文本䞭创建的及倖的选项是构建圚<i>发送人</i>和
358<i>䞻题</i>元数据䞊的。
359
360<p>
361本銆藏有䞉䞪分类噚分别基于<i>䞻题</i>、<i>发件人名称</i>以及<i>日期</i>元数据。前面䞀䞪<i>AZCompactList</i>分类噚
362和<i>AZList</i>类䌌䜆重倍条目䌚以乊架圢匏星瀺劂<a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">这里</a>所瀺。
363这里是䞀䞪树型结构其节点芁么是代衚文档的叶子节点芁么是内郚节点。numleafdocs元数据记圕了䞀䞪内郚节点䞋的文档的总数。
364第䞀䞪分类噚的栌匏变量<i>CL1Vlist</i>刀断这䞪元数据是吊存圚。劂果存圚则圓前节点必然是䞀䞪内郚节点歀时该节点甚其<i>题名</i>所标识。
365吊则该节点的标筟将銖先星瀺<i>䞻题</i>元数据䞔可以铟接到该文档然后星瀺<i>发件人名称</i>元数据以及䞀䞪\"按发送人搜玢\"的铟接接䞋来是<i>日期文本</i>。
366
367<p>
368第二䞪分类噚<i>CL2Vlist</i>䞎前面的类䌌只是星瀺的信息皍有䞍同——劂<a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2\">这里</a>所瀺。
369对于内郚节点而蚀其叶子文档的数目<i>numleafdocs</i>甚圆括号括起并星瀺圚<i>题名</i>之后。对于文档节点则星瀺<i>发件人名称</i>、
370以及䞀䞪\"按发件人名称搜玢\"的铟接 <i>䞻题</i>铟接到文本以及<i>日期文本</i>元数据。
371
372<p>
373第䞉䞪分类噚是<i>DateList</i>可按月和幎进行选择。
374
375<p>
376最后文档文本的星瀺栌匏是倎字段<i>发件人名称</i>、<i>日期文本</i>、<i>䞻题</i>、<i>回倍</i>接䞋来是消息文本即栌匏变量䞭的<i>[Text]</i>。
377<i>发件人名称</i>所垊的铟接将对这䞪发件人名字进行搜玢而<i>回倍</i>所垊的铟接指向所匕甚的email消息。
378"
379
380# use utf-8 as the default encoding
381cgiarg shortname=w argdefault=utf-8
382
Note: See TracBrowser for help on using the browser.