附件全文索引

Domino® 服务器和 Notes® 标准客户机使用 Apache Tika 1.18 开源转换过滤器提取文本以进行附件的全文搜索。Tika 取代了以前版本中使用的 KeyView 转换过滤器。

Tika 的实施支持以下功能:
  • 搜索各种格式,包括 .zip 和 .tar 文件等容器文件。
  • 搜索包含 UTF-8 编码的 ASCII 文本文件。
  • 自定义可对哪些附件类型进行全文索引,以及允许进行全文索引的最大附件大小。

Tika 作为启动 Notes® 标准客户机或 Domino®Java 进程运行。缺省情况下,进程调用 tika-server.jar,启动 HTTP 任务并侦听端口 9998 上的文本提取请求。如果升级到 Notes® 或升级到 Domino® 10,以前使用 KeyView 过滤器提取文本的全文索引将使用 Tika 过滤器重新生成。

有关 Tika 1.18 支持的文件格式列表,请参阅 Apache Tika 网站

注: tika-server.jar 启动 HTTP 服务器并侦听端口 9998 上的文本提取请求。如果该端口已被其他应用程序使用,请使用以下 notes.ini 设置将 Tika 端口更改为 9997:
TIKA_PORT=9997
注:

Notes® 基本客户机不使用 Tika 过滤器在本地数据库中进行附件搜索。(限制不适用于 Notes 标准客户机或基于服务器的数据库搜索)。Notes® 基本客户机用户可以选择为附件编制索引,但只搜索 ASCII 文本附件。