name=Коллекция архивов Greenstone SearchBySender=Поиск по отправителю Subject=Предмет Date=Дата From=От .document\:text=Сообщения .document\:Subject=Строки предмета .document\:From=Из полей shortDescription=

This is a collection of email messages from the Greenstone mailing list archives, from November/December, 2008.

description1=

Как работает коллекция

Коллекция архивов Greenstone использует плагин Еmail, который анализирует файлы в форматах электронной почты. In this case, there is a file per month per mailing list, and each file contains many email messages. Плагин Еmail разбивает их на индивидуальные документы и создает Название, Предмет, От, Имя отправителя, Адрес отправителя, Дата, Дата текстом, Кому Ответ и выборочно Заголовки.

description2=

Конфигурационный файл коллекции начинается с определения groupsize 200. Он собирает документы в группы по 200 единиц. Коллекции электронной почты обычно состоят из большого числа небольших документов, и группировка их вместе предотвращает внутренние файловые структуры Greenstone от разбухания и занятия большего места на диске, чем необходимо. Заметьте, что плагин Еmail вначале разбивает входные файлы на индивидуальные электронные письма, а затем groupsize снова собирает их вместе. Это позволяет проектировщику коллекции управлять тем, что следует дальше.

description3=

Строка индексов (indexes) определяет 3 доступных для поиска индекса, которые могут быть видны, если щелкать около слова Сообщения (Messages) на поисковой странице для показа ниспадающего меню. Первый, называемый Сообщениями, создается из текста документа, в то время как другие сформированы по метаданным От кого и Предмет.

description4=

Существует три классификатора, основанные на метаданных Предмет, Имя отправителя и Дата. Классификатор AZCompactList, используемый для первых двух, похож на AZLIST, но он формирует книжную полку для дубликатов элементов, как показано здесь. Она представлена структурой дерева, узлы которой являются или узлами листа, представляя документы, или внутренними узлами. Метаданные элементов, называемые numleafdocs, дают общее количество документов, расположенных ниже внутреннего узла. Операторы формата для первого классификатора, называемые CL1Vlist, проверяют, существует ли этот элемент. Если это так, то узел должен быть внутренним, в случае чего он помечается его Названием (Title). Otherwise the node's label starts with the Subject which links to the document, then gives FromName metadata, with a link to "Search by Sender", followed by the DateText.

description5=

Второй классификатор (CL2Vlist) подобен первому, но он показывает отличающуюся информацию -- результат можно видеть здесь. Для внутренних узлов фактическое число документов в списке (numleafdocs) дается в круглых скобках после Названия. For document nodes the FromName, with a link to "Search By Sender", Subject (linked to the document), and DateText metadata is shown.

description6=

Третьим классификатором является DateList, который позволяет производить выборку сообщений по месяцу и году.

description7=

Finally, the document text is formatted to show the header fields (FromName, DateText, Subject, InReplyTo), followed by the message text (written as [Text] in the format statement). FromName is linked to a search on that name, while InReplyTo links to the email message that it refers to.