配置可全文索引的附件类型

您可以控制允许进行全文索引的附件文件类型。

关于此任务

缺省情况下,除以下格式外,Tika 1.18 支持的所有文件格式均可进行全文索引:
.au, .bqy, .cca, .dbd, .dll, .exe, .gif, .gz, .img, .jar, .jpg, .mov, .mp3,.mpg,
 .msi,.nsf, .ntf, .p7m, .p7s,.pag, .pdb, .png, .rar, .sys, .tar, .tar, .tif, .wav, .wpl, .z, .zip. 
使用 notes.ini 设置定义您自己的附件类型列表,以允许进行全文索引。
提示:
  • 要在多个服务器上部署 notes.ini 设置,请在目录中使用服务器配置文档。在“基本”选项卡中,对于将这些设置用作所有服务器的默认设置,选择,然后将一个或多个设置添加到文档的 NOTES.INI 选项卡中。
  • 要在多个 Notes 客户机上部署 notes.ini 设置,请使用桌面设置策略文档的定制设置 > noes.ini 选项卡。

过程

  1. 若要定义您自己的附件类型列表以允许进行全文索引,请将以下 notes.ini 设置添加到 Domino 服务器或 Notes 客户机:
    FT_USE_MY_ATTACHMENT_WHITE_LIST=1
    请注意,此设置会覆盖缺省行为,且在完成下一步之前,不能对附件进行全文索引。
  2. 使用下表中的 notes.ini 设置可配置全文索引的附件类型。
    1. 配置附件类型以允许执行全文搜索
    目标 要使用的设置
    配置所有数据库上允许的文件类型。

    FT_INDEX_FILTER_ATTACHMENT_TYPES=*.<format>,*.<format>,其中 <format> 为文件格式。在格式之间使用逗号。

    FT_INDEX_FILTER_ATTACHMENT_TYPES_MAX_MB=<value>,其中 <value> 为可选的最大附件大小(以 MB 为单位),以限制可搜索的文件大小。如果未指定,则没有限制。

    例如:
    FT_INDEX_FILTER_ATTACHMENT_TYPES=*.mp3
    FT_INDEX_FILTER_ATTACHMENT_TYPES_MAX_MB=2
    配置特定数据库上允许的文件类型。

    FT_INDEX_FILTER_ATTACHMENT_TYPES_<replicaID>=*.<format>,其中 <replicaID> 是要搜索的数据库的副本标识,<format> 是文件类型。在格式之间使用逗号。

    FT_INDEX_FILTER_ATTACHMENT_TYPES_<replicaID>_MAX_MB=1,其中 <replicaID> 是要搜索的数据库的副本标识,<value> 是可选的最大附件大小(以 MB 为单位),以限制可搜索的文件大小。如果未指定,则没有限制。

    例如:
    FT_INDEX_FILTER_ATTACHMENT_TYPES_00124866492581EC=*.txt
    FT_INDEX_FILTER_ATTACHMENT_TYPES_00124866492581EC_MAX_MB=1
    注: 如果当前在 Domino 服务器或 Notes 客户机上使用 notes.ini设置 FT_USE_ATTACHMENT_WHITE_LIST=1,请注意以下行为:
    • 缺省情况下,允许使用以下文件类型进行全文索引。请注意,此白名单否决了黑名单格式 .zip 和 .jar,并允许对它们进行索引。但黑名单中的其他类型仍然不允许使用。
      *.123,*.ami,*.ap,*.as,*.aw,*.dca,*.doc*,*.dwg,*.emf,*.emz,*.fff,*.fft,*.flg,*
      .fm,*.htm*,*.hwp,*.jar,*.jtd,*.jtt,*.lwp,*.mime,*.oas,*.odp,*.ods,*.odt,*.pdf*,*.pic,
      *.ppt*,*.pst,*.qpw,*.r13,*.r14,*.rtf,*.sam,*.shw,*.swp,*.vsd*,*.wk4,*.wks,*.wmf,*.wp*,
      *.wri,*.xlr,*.xls*,*.xml,*.xy*",*.zip
    • 您可以使用步骤 2 中描述的 notes.ini 设置以及此设置来允许其他附件类型。
    • 切换到 FT_USE_MY_ATTACHMENT_WHITE_LIST=1 会否决此设置。