name=微软Word与PDF演示馆藏 document_text=文档 shortDescription=本馆藏演示Greenstone用不同格式文档创建馆藏的功能。本馆藏收录了若干NZDL项目组成员所写的论文,有PDF,微软Word以及Postscript格式。 description1=

本馆藏中的文档来自于怀卡托大学计算机系的成员。版权由怀卡托大学所属。这些文档可自由发布,没有任何限制。

description2=

本馆藏如何工作

本馆藏的配置文件包含四个插件,WordPluginRTFPluginPDFPluginPostScriptPlugin(以及四个标准插件,GreenstoneXMLPluginMetadataXMLPluginArchivesInfPluginDirectoryPlugin)。这四个插件都会抽取题名来源(即文件名)元数据。

description3=

Greenstone使用第三方软件将Word,RTF,PDF与PostScript文件转换成HTML文档。Greenstone小组并不负责维护这些第三方软件,尽管我们尽量在发布每个Greenstone版本中使用最新的版本。特殊的Word文档可能会有某些问题(比如旧的Macintosh系统创建的Word文档),并且有时从这些文档中抽取的文本质量很差。有些PDF文档不包括任何机器可读的文本,而是由一系列的页面图片组成,只能用光学字符识别技术(OCR)从中读取文本,而Greenstone并不包括OCR技术。如果你遇到了这些问题,要么你可以从馆藏中删除有问题的文档,或者尝试高级的插件选项,以不同的方式处理文档。更多信息,请参阅Greenstone wiki中的提高版PDF与Word文档处理教程。

description4=

本馆藏的配置文件中只有一个索引,该索引是基于文档文本的,以及一个分类器:一个基于题名元数据的AZList,如这里所示(这里自动隐藏了按字母的选择浏览条,因为本馆藏只有为数不多的几个文档)。然而,本馆藏没有设定任何格式变量。在没有制定特定格式信息时,Greenstone提供合理的缺省值。在这种情况下,缺省的分类器格式将显示:

description5=这个特定的格式变量将得到一模一样的外观。它适用于所有的Vlists,也控制搜索结果列表与字母顺序的题名列表。