変換フィルターを使用した添付ファイルの全文索引

添付ファイルの全文索引に変換フィルターを使用する場合、Domino® サーバーと Notes® Standard 版クライアントは、Apache Tika 1.24.1 オープン・ソース変換フィルターを使用して、添付ファイルの全文検索用にテキストを抽出します。

Tika は、Domino 10 以前に使用されていた KeyView 変換フィルターに置き換わるものです。Tika の実装では、以下の機能がサポートされます。
  • 幅広いフォーマットをフィルタリングします。
  • UTF-8 エンコーディングが含まれる ASCII テキスト・ファイルを検索します。

Tika は、Notes® Standard 版クライアントまたは Domino® を起動するときに、Java プロセスとして実行されます。このプロセスは tika-server.jar を呼び出し、HTTP サーバーを開始し、テキスト抽出要求をポート 9998 (デフォルト) で listen します。the Notes® Standard 版クライアントまたは Domino® 10 以上にアップグレードする場合、これまで KeyView フィルターを使用していた全文索引は、Tika フィルターを使用して再構築されます。

Tika 1.24.1 でサポートされるファイル形式のリストについては、Apache Tika Web サイトを参照してください。

注: tika-server.jar は、HTTP サーバーを開始し、テキスト抽出要求をポート 9998 で listen します。このポートが別のアプリケーションで既に使用されている場合は、以下の notes.ini 設定を使用して Tika のポートを 9997 に変更します。
TIKA_PORT=9997
注:

Notes® Basic 版クライアントは、ローカル・データベース内の添付ファイルのフィルタリングに Tika フィルターを使用しません。Notes® Basic 版クライアントのユーザーは、ローカル・データベース内の添付ファイルの索引を作成するよう選択できますが、ASCII テキストの添付ファイルのみが索引付け、検索されます。