Ignore:
Timestamp:
2022-09-15T18:29:54+12:00 (20 months ago)
Author:
anupama
Message:

Unescaping apostrophes again (removing the backslash in front of apostrophes in French and English in one step), as the strings where they were escaped weren't loading in GTI anyway, which may be because the English language strings were modified on the same day and so they're not marked as in need of updating until I modify all the English strings just after midnight, to force GTI to mark all strings that are already translated as in need of updating.

Location:
documented-examples/trunk/gsarch-e/resources
Files:
2 edited

Legend:

Unmodified
Added
Removed
  • documented-examples/trunk/gsarch-e/resources/collectionConfig.properties

    r36621 r36623  
    1313description1=<h3>How the collection works</h3><p>The Greenstone Archives collection uses the <i>Email</i> plugin, which parses files in email formats. In this case, there is a file per month per mailing list, and each file contains many email messages. The <i>Email</i> plugin splits these into individual documents, and produces <i>Title</i>, <i>Subject</i>, <i>From</i>, <i>FromName</i>, <i>FromAddr</i>, <i>Date</i>, <i>DateText</i>, <i>InReplyTo</i>, and optionally <i>Headers</i>, metadata.</p>
    1414
    15 description2=<p>The collection configuration file, <tt>etc/collectionConfig.xml</tt> specifies <i>&lt;importOption name="groupsize" value="200"/&gt;</i>. This groups documents together into groups of 200. Email collections typically have many small documents, and grouping them together prevents Greenstone\'s internal file structures from becoming bloated and occupying more disk space than necessary. Notice that the <i>Email</i> plugin first splits the input files up into individual Emails, then <i>groupsize</i> groups them together again. This allows the collection designer to control what is going on.</p>
     15description2=<p>The collection configuration file, <tt>etc/collectionConfig.xml</tt> specifies <i>&lt;importOption name="groupsize" value="200"/&gt;</i>. This groups documents together into groups of 200. Email collections typically have many small documents, and grouping them together prevents Greenstone's internal file structures from becoming bloated and occupying more disk space than necessary. Notice that the <i>Email</i> plugin first splits the input files up into individual Emails, then <i>groupsize</i> groups them together again. This allows the collection designer to control what is going on.</p>
    1616
    1717description3=<p>The <i>indexes</i> line specifies 3 searchable indexes, which can be seen by clicking beside the word "Messages" on the <a href="library/collection/gsarch-e/search/TextQuery">search page</a> to reveal a drop-down menu. The first (called <i>Messages</i>) is created from the document text, while the others are formed from <i>From</i> and <i>Subject</i> metadata.</p>
    1818
    19 description4=<p>There are three classifiers, based on <i>Subject</i>, <i>FromName</i>, and <i>Date</i> metadata. The <i>AZCompactList</i> classifier used for the first two is like <i>AZList</i> but generates a bookshelf for duplicate items, as illustrated <a href="library/collection/gsarch-e/browse/CL1">here</a>. This is represented by a tree structure whose nodes are either leaf nodes, representing documents, or internal nodes. A metadata item called numleafdocs gives the total number of documents below an internal node. The format statement for the first classifier, called <i>CL1Vlist</i>, checks whether this item exists. If so the node must be an internal one, in which case it is labeled by its <i>Title</i>. Otherwise the node\'s label starts with the <i>Subject</i> which links to the document, then gives <i>FromName</i> metadata, with a link to "Search by Sender", followed by the <i>DateText</i>.</p>
     19description4=<p>There are three classifiers, based on <i>Subject</i>, <i>FromName</i>, and <i>Date</i> metadata. The <i>AZCompactList</i> classifier used for the first two is like <i>AZList</i> but generates a bookshelf for duplicate items, as illustrated <a href="library/collection/gsarch-e/browse/CL1">here</a>. This is represented by a tree structure whose nodes are either leaf nodes, representing documents, or internal nodes. A metadata item called numleafdocs gives the total number of documents below an internal node. The format statement for the first classifier, called <i>CL1Vlist</i>, checks whether this item exists. If so the node must be an internal one, in which case it is labeled by its <i>Title</i>. Otherwise the node's label starts with the <i>Subject</i> which links to the document, then gives <i>FromName</i> metadata, with a link to "Search by Sender", followed by the <i>DateText</i>.</p>
    2020
    2121description5=<p>The second classifier (<i>CL2Vlist</i>) is similar, but shows slightly different information -- the result can be seen <a href="library/collection/gsarch-e/browse/CL2">here</a>. For internal nodes, the actual number of leaf documents (<i>numleafdocs</i>) is given in parentheses after the <i>Title</i>. For document nodes the <i>FromName</i>, with a link to "Search By Sender", <i>Subject</i> (linked to the document), and <i>DateText</i> metadata is shown.</p>
  • documented-examples/trunk/gsarch-e/resources/collectionConfig_fr.properties

    r36620 r36623  
    1212description1=<h3>Comment fonctionne cette collection ?</h3><p>La collection Greenstone Archive utilise le plugin "<i>E-mail</i>", qui traite les fichiers aux formats e-mail. Dans ce cas, il y a un fichier par mois et par liste de diffusion, et chaque fichier contient de nombreux messages. Le plugin <i>E-mail</i> les éclate en documents individuels et produit les métadonnées <i>Title</i>, <i>Subject</i>, <i>Headers</i> (en option), <i>From</i>, <i>FromName</i>, <i>FromAddr</i>, <i>Date</i> et <i>DateText</i>.</p>
    1313
    14 description2=<p>Le <tt>fichier de configuration</tt> de la collection débute avec la spécification <i>groupsize 200</i>. Ceci regroupe les documents par groupes de 200. Les collections E-mail sont constituées habituellement de plusieurs documents de petite taille; leur regroupement évite l\'augmentation excessive des structures de fichier internes de Greenstone et l\'occupation de plus d\'espace disque que nécessaire. Notez que le plugin <i>E-mail</i> éclate d\'abord les fichiers d\'entrée à traiter en E-mail individuels, ensuite <i>groupsize</i> procÚde à leur regroupement. Ceci permet au créateur de la collection de contrÃŽler ce qui se passe.</p>
     14description2=<p>Le <tt>fichier de configuration</tt> de la collection débute avec la spécification <i>groupsize 200</i>. Ceci regroupe les documents par groupes de 200. Les collections E-mail sont constituées habituellement de plusieurs documents de petite taille; leur regroupement évite l'augmentation excessive des structures de fichier internes de Greenstone et l'occupation de plus d'espace disque que nécessaire. Notez que le plugin <i>E-mail</i> éclate d'abord les fichiers d'entrée à traiter en E-mail individuels, ensuite <i>groupsize</i> procÚde à leur regroupement. Ceci permet au créateur de la collection de contrÃŽler ce qui se passe.</p>
    1515
    1616description3=<p>La ligne des <i>indexes</i> précise trois indexes de recherche qui peuvent être vus en cliquant à cÎté du mot "Message" de la <tt>page de recherche</tt> pour révéler un menu déroulant. Le premier (appelé <i>Messages</i>) est créé à partir du texte du document, tandis que les autres sont formés à partir des méta-données <i>From</i> et <i>Subject</i>.</p>
    1717
    18 description4=<p>Il existe trois classificateurs basés sur les méta-données <i>Subject</i>, <i>FromName</i> et <i>Date</i>. Le classificateur <i>AZCompactList</i> utilisé pour les deux premiers est semblable à "<i>AZList</i>", mais en outre il génÚre un rayon de bibliothÚque pour les articles dupliqués, comme illustré <a href="library/collection/gsarch-e/browse/CL1">ici</a>. Il est représenté par une structure arborescente dont les nœuds sont soit des nœuds de feuille représentant les documents, soit des nœuds internes. Une Méta-donnée appelée "Numleafdocs" donne le nombre total de documents sous un nœud interne. Les déclarations de format pour le premier classificateur, appelé <i>CL1VList</i>, vérifie si cette méta-donnée existe, auquel cas le nœud doit être d\'une part interne et d\'autre part libellé par son "<i>Title</i>" (<i>Titre</i>). Sinon le nom du noeud commencera par le <i>Subject</i> qui fait le lien vers le document, suivi par la métadonnée <i>FromName</i>, avec un lien vers la "Recherche par expéditeur" et enfin par la <i>DateText</i>.</p>
     18description4=<p>Il existe trois classificateurs basés sur les méta-données <i>Subject</i>, <i>FromName</i> et <i>Date</i>. Le classificateur <i>AZCompactList</i> utilisé pour les deux premiers est semblable à "<i>AZList</i>", mais en outre il génÚre un rayon de bibliothÚque pour les articles dupliqués, comme illustré <a href="library/collection/gsarch-e/browse/CL1">ici</a>. Il est représenté par une structure arborescente dont les nœuds sont soit des nœuds de feuille représentant les documents, soit des nœuds internes. Une Méta-donnée appelée "Numleafdocs" donne le nombre total de documents sous un nœud interne. Les déclarations de format pour le premier classificateur, appelé <i>CL1VList</i>, vérifie si cette méta-donnée existe, auquel cas le nœud doit être d'une part interne et d'autre part libellé par son "<i>Title</i>" (<i>Titre</i>). Sinon le nom du noeud commencera par le <i>Subject</i> qui fait le lien vers le document, suivi par la métadonnée <i>FromName</i>, avec un lien vers la "Recherche par expéditeur" et enfin par la <i>DateText</i>.</p>
    1919
    2020description5=<p>Le deuxiÚme classificateur (<i>CL2Vlist</i>) est similaire, mais fournit une information légÚrement différente --le résultat peut être vu <a href="library/collection/gsarch-e/browse/CL2">ici</a>. Pour les nœuds internes, le nombre exact de documents en feuilles (<i>numleafdocs</i>) est donné entre parenthÚses aprÚs <i>Title</i>. Pour les documents noeuds, les métadonnées suivantes seront visibles \: <i>FromName</i>, avec un lien vers la "Recherche par expéditeur", <i>Subject</i> (avec un lien vers le document), et <i>DateText</i>.</p>
     
    2222description6=<p>Le troisiÚme classificateur est un "<i>DateList</i>" qui permet une sélection par mois et par année.</p>
    2323
    24 description7=<p>Pour finir, le document est mis en forme pour montrer les entêtes (<i>FromName</i>, <i>DateText</i>, <i>Subjet</i>, <i>InReplyTo</i>), suivis par le texte du message (écrit en tant que <i>[Text]</i> dans le format d\'enregistrement). FromName est un lien vers une recherche sur ce nom, tandis que InReplyTo est un lien vers le message électronique auquel celui-ci se réfÚre.</p>
     24description7=<p>Pour finir, le document est mis en forme pour montrer les entêtes (<i>FromName</i>, <i>DateText</i>, <i>Subjet</i>, <i>InReplyTo</i>), suivis par le texte du message (écrit en tant que <i>[Text]</i> dans le format d'enregistrement). FromName est un lien vers une recherche sur ce nom, tandis que InReplyTo est un lien vers le message électronique auquel celui-ci se réfÚre.</p>
Note: See TracChangeset for help on using the changeset viewer.