Changeset 19356 for collections


Ignore:
Timestamp:
2009-05-09T15:36:27+12:00 (15 years ago)
Author:
kjdon
Message:

more mods. nearly finished...

File:
1 edited

Legend:

Unmodified
Added
Removed
  • collections/documented-examples/trunk/dls-e/etc/collect.cfg

    r19341 r19356  
    248248<i>mode=override</i>).\n
    249249
    250 *** TODO***
    251 <p><b>Hierarchy files</b>. The subject hierarchy file <a
    252 href=\"_httpcollection_/etc/dls.Subject.txt\" target=text>dls.Subject.txt</a> contains a
    253 succession of lines each of which has three items. The first and last items
    254 are text strings, and they are the same. The middle item is a number that
    255 defines the position in the hierarchy. The first string is matched against the
    256 metadata that occurs in the <i>metadata.xml</i> file described above; the last
    257 one is the string that describes that node of the hierarchy on the web pages
    258 that Greenstone generates.\n
    259 
    260 <p>
    261 For example, the first line contains the three items \"Industry, Manufacture
    262 and Services\", 1, and \"Industry, Manufacture and Services\". The middle one,
    263 the numeral 1, indicates that this subject appears at the first position of the
    264 <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">subject hierarchy</a>).
    265 The first item, the string \"Industry, Manufacture and Services\", is what appears in
    266 the <a href=\"_httpcollection_/import/t0021e/metadata.xml\" target=text>metadata.xml</a> file
    267 as <i>Subject</i> metadata. The third item, which happens to be the same string,
    268 is what appears as the text in the first position of the subject hierarchy.
    269 
    270 <p>
    271 The organization hierarchy file
    272 <a href=\"_httpcollection_/etc/dls.Organization.txt\" target=text>dls.Organization.txt</a>
    273 has exactly the same structure. Again, the first and last text strings on each
    274 line are the same because the metadata values in <i>metadata.xml</i> are
    275 exactly what should be shown on the Greenstone web pages. The number between
    276 defines the position in the hierarchy: in this case the hierarchy is flat and
    277 the position is simply an integer that determines the order of the list.\n
    278 
    279 <p>
    280 The <i>Keyword</i> classifier is also a hierarchy classifier, in this case
    281 based on <i>Keyword</i> metadata. This is to allow for the possibility that two
    282 different documents have the same keyword.\n
     250<p><b>Hierarchy files</b>. Hierarchy files contain a
     251succession of lines each of which has three items. **_text12_ starts here. **The first item is a text string which is matched against the metadata that occurs in the <i>metadata.xml</i> file described above. The second item is a number that defines the position in the hierarchy. The third item is a text string that describes the node of the hierarchy on the web pages that Greenstone generates.
     252<p>
     253For example, the following shows three lines from the subject hierarchy file <a href=\"_httpcollection_/etc/dls.Subject.txt\" target=text>dls.Subject.txt</a>.
     254
     255<pre>
     256\"Animal Husbandry and Animal Product Processing\"  7   \"Animal Husbandry and Animal Product Processing\"
     257\"Animal Husbandry and Animal Product Processing|Cattle\"   7.1 \"Cattle\"
     258\"Animal Husbandry and Animal Product Processing|Other animals (micro-livestock, little known animals, silkworms, reptiles, frogs, snails, game, etc.)\"    7.2 \"Other animals (micro-livestock, little known animals, silkworms, reptiles, frogs, snails, game, etc.)\"
     259</pre>
     260
     261These three lines define one top level bookshelf (at position 7), titled \"Animal Husbandry and Animal Product Processing\", with two bookshelves underneath it, titled \"Cattle\" and \"Other animals (micro-livestock, little known animals, silkworms, reptiles, frogs, snails, game, etc.)\" respectively.
     262
     263In this case, the first strings (and therefore the entries in metadata.xml files) contain the entire hierarchy values. Levels in the hierarchy are separated by \"|\". They could be used directly by a <i>Hierarchy</i> classifier without the use of the hierarchy file. However, then the entries would be ordered alphabetically, not in the special order defined by the file.
     264
     265The <a href=\"_httpcollection_/etc/dls.AZList.txt\" target=text>dls.AZList.txt</a> hierarchy file used by the titles classifier contains a similar structure. Ordinarily, a titles browser would use a <i>List</i> (or <i>AZList</i>) classifier. In this case, we want to predefine the A-Z groupings, and include a separate entry for periodicals, as can be seen <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL2.7\">here</a>.
    283266"
    284267
     
    388371
    389372<p>
    390 <b>Fichiers d\'hiérarchie</b>. Le fichier d\'hiérarchie de sujet <a
    391 href=\"_httpcollection_/etc/dls.Subject.txt\" target=text>dls.Subject.txt</a> contient
    392 une suite de lignes dont chacune a trois éléments. Le premier et le dernier élément sont
    393 des chaînes de textes, et ils sont identiques. L\'élément du milieu est un nombre qui définit la position dans la hiérarchie. La premiÚre chaîne est ajustée sur la méta-donnée qui intervient dans le fichier <i>metadata.xml</i> décrit ci-dessus; la derniÚre est la chaîne qui décrit le n\'ud de la
    394 hiérarchie sur les pages web que Greenstone génÚre.
    395 
    396 <p>
    397 Par exemple, la premiÚre ligne contient les trois éléments \"Industry, Manufacture, and Services\", 1, et \"Industry, Manufacture and Services\". Celui du milieu, le nombre 1, indique que ce sujet apparaît en premiÚre position de <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">subject Hierarchy</a>). Le premier élément, la chaîne \"Industry, Manufacture and Services\", apparaît dans le fichier <a href=\"_httpcollection_/import/t0021e/metadata.xml\" target=text>metadata.xml</a> comme méta-donnée <i>Subject</i>. Le troisiÚme élément qui se trouve être la même chaîne, apparaît dans le texte en premiÚre position de la hiérarchie de sujet.
    398 
    399 <p>
    400 Le fichier d\'hiérarchie d\'organisation <a href=\"_httpcollection_/etc/dls.Organization.txt\" target=text>dls.Organization.txt</a> a exactement la même structure. De nouveau, les premiÚres et derniÚres chaînes de texte sont les mêmes sur chaque ligne parce que les valeurs de méta-donnée dans <i>metadata.xml</i> sont exactement ce qui doit être affiché sur les pages d\'accueil de Greenstone. Le nombre intermédiaire définit la position dans la hiérarchie: dans ce cas-ci, la hiérarchie est plate et la position est tout simplement un entier qui détermine l\'ordre de la liste.
    401 
    402 <p>
    403 Le classificateur <i>Keyword</i> est aussi un classificateur de hiérarchie, basé dans ce cas-ci sur la méta-donnée <i>Keyword</i>. Ceci pour offrir la possibilité à deux documents différents d\'avoir le même mot-clé.
     373<b>Fichiers d\'hiérarchie</b>. _text12_
     374
     375
    404376"
    405377
     
    503475<p>
    504476
    505 <b>Archivos de jerarquía</b>. El archivo de jerarquía del asunto <a href=\"_httpcollection_/etc/dls.Subject.txt\" target=text>dls.Subject.txt</a> contiene una serie de líneas cada una de las cuales tiene tres ítems. El primero y último son cadenas de texto y son iguales. El ítem intermedio es un número que define la posición en la jerarquía. La primer cadena corresponde al metadato que ocurre en el archivo <i>metadata.xml</i> que se describe arriba, mientras que la última describe el nodo de la jerarquía en las páginas Web que Greenstone genera.
    506 <p>
    507 
    508 Por ejemplo, la primera línea contiene los tres ítems \"Industria, Manufactura y Servicios\", 1 y finalmente \"Industria, Manufactura y Servicios\". El ítem intermedio con el numeral 1 indica que este asunto aparece en la primera posición de la <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">jerarquía de asunto</a>. El primer ítem con la cadena \"Industria, Manufactura y Servicios\" es lo que aparece en el archivo <a href=\"_httpcollection_/import/t0021e/metadata.xml\" target=text>metadata.xml</a> como <i>Asunto</i>. El tercer ítem es el mismo y es lo que aparece como texto en la primera posición de la jerarquía del asunto.
    509 <p>
    510 
    511 El archivo de jerarquía de la organización <a href=\"_httpcollection_/etc/dls.Organization.txt\" target=text>dls.Organization.txt</a> tiene exactamente la misma estructura. Nuevamente la primera y última cadena de texto en cada línea son las mismas, ya que los valores de los metadatos que se encuentran en <i>metadata.xml</i> son exactamente lo que se va a mostrar en las páginas Web de Greenstone. El número entre ambas define la posición en la jerarquía: en este caso la jerarquía es plana y la posición es simplemente un número entero que determina el orden de la lista.
    512 <p>
    513 
    514 El clasificador de <i>Palabras Clave</i> también es un clasificador de jerarquía, en este caso basado en el metadato <i>Palabra Clave</i>. Esto permite la posibilidad de que dos documentos diferentes tengan la misma palabra clave.
     477<b>Archivos de jerarquía</b>.
    515478"
    516479
     
    660623
    661624<b>ИерарÑ
    662 ÐžÑ‡ÐµÑÐºÐžÐµ файлы</b>. ПреЎЌет ОерарÑ
    663 ÐžÑ‡ÐµÑÐºÐŸÐ³ÐŸ файла <a href=\"_httpcollection_/etc/dls.Subject.txt\" target=text>dls.Subject.txt</a> сПЎержОт пПслеЎПвательМПсть стрПк, кажЎая Оз кПтПрыÑ
    664  ÐžÐŒÐµÐµÑ‚ трО пуМкта. Первый О пПслеЎМОй пуМкты являются текстПвыЌО стрПкаЌО О ПМО ПЎОМакПвы. СреЎМОй пуМкт является чОслПЌ, кПтПрПе ПпреЎеляет пПзОцОю в ОерарÑ
    665 ÐžÐž. Первая стрПка сППтветствует ЌетаЎаММыЌ, кПтПрые МаÑ
    666 ÐŸÐŽÑÑ‚ся в файле ,<i>metadata.xml</i>, ПпОсаММПЌ выше; пПслеЎМяя стрПка ПпОсывает тПт узел ОерарÑ
    667 ÐžÐž Ма web-страМОцаÑ
    668  ÑÐµÑ‚О, кПтПрые геМерОрует Greenstone.
    669 <p>
    670 
    671 ÐÐ°Ð¿Ñ€ÐžÐŒÐµÑ€, первая стрПка сПЎержОт трО пуМкта «ПрПЌышлеММПсть, ИзгПтПвлеМОе О УслугО», 1, О «ПрПЌышлеММПсть, ИзгПтПвлеМОе О УслугО». СреЎМОй пуМкт, цОфра 1, указывает, чтП этПт преЎЌет пПявляется Ма первПй пПзОцОО в <a href=\"_gwcgi_?l=_cgiargl_&c=_cgiargc_&a=d&cl=CL1\">сОстеЌе ОерарÑ
    672 ÐžÐž</a>. Первый пуМкт, стрПка «ПрПЌышлеММПсть, ИзгПтПвлеМОе О УслугО» является теЌ, чтП пПявляется в файле <i>metadata.xml</i> как ЌетаЎаММые <i>ПреЎЌета</i>. ТретОй пуМкт, кПтПрый преЎставлеМ аМалПгОчМПй стрПкПй, - этП тП, чтП пПявляется в вОЎе текста в первПй пПзОцОО преЎЌета ОерарÑ
    673 ÐžÐž.
    674 <p>
    675 
    676 Ð€Ð°Ð¹Ð» ПргаМОзацОО ОерарÑ
    677 ÐžÐž <a href=\"_httpcollection_/etc/dls.Organization.txt\" target=text>dls.Organization.txt</a> ОЌеет тПчМП такую же структуру. Так же, первые О пПслеЎМОе стрПкО текста Ма кажЎПй лОМОО те же саЌые, пПтПЌу чтП зМачеМОя ЌетаЎаММыÑ
    678  Ð² <i>metadata.xml</i> -- тПчМП те же, чтП ЎПлжМы быть пПказаМы Ма web-страМОцаÑ
    679  Greenstone. ЧОслП ЌежЎу этОЌО стрПкаЌО ПпреЎеляет пПзОцОю в ОерарÑ
    680 ÐžÐž: в этПЌ случае ОерарÑ
    681 ÐžÑ является плПскПй, О пПзОцОя -- прПстП целПе чОслП, кПтПрПе ПпреЎеляет пПряЎПк в спОске.
    682 <p>
    683 
    684 ÐšÐ»Ð°ÑÑÐžÑ„ОкатПр <i>КлючевПе слПвП</i> также является классОфОкатПрПЌ ОерарÑ
    685 ÐžÐž, в этПЌ случае ПсМПваММПЌ Ма ЌетаЎаММыÑ
    686  <i>КлючевПгП слПва</i>. ЭтП ЎПлжМП пПзвПлОть учесть вПзЌПжМПсть тПгП, чтП Ўва разлОчМыÑ
    687  ÐŽÐŸÐºÑƒÐŒÐµÐœÑ‚а сПЎержат ПЎОМакПвПе ключевПе слПвП.
     625ОческОе файлы</b>. _text12_
     626
    688627"
Note: See TracChangeset for help on using the changeset viewer.