添付ファイルの全文索引

Domino® サーバーおよび Notes® Standard 版クライアントは、Apache Tika 1.18 オープンソース変換フィルタを使用して、添付ファイルの全文検索用にテキストを抽出します。Tika は、以前のリリースで使用されていた KeyView 変換フィルタに置き換わるものです。

Tika の実装では、以下の機能がサポートされます。
  • さまざまな形式を検索する (.zip ファイルや .tar ファイルなどのコンテナファイルを含む)。
  • UTF-8 エンコーディングが含まれる ASCII テキストファイルを検索する。
  • 全文索引を作成できる添付ファイルのタイプ、および全文索引が可能な最大添付ファイルサイズをカスタマイズする。

Tika は、Notes Standard 版クライアントまたは Domino を起動するときに、Java™ プロセスとして実行されます。このプロセスは tika-server.jar を呼び出し、HTTP タスクを開始し、テキスト抽出要求をポート 9998 (デフォルト) で listen します。Notes または Domino 10 にアップグレードする場合、これまで KeyView フィルタを使用していた全文索引は、Tika フィルタを使用して再構築されます。

Tika 1.18 でサポートされるファイル形式のリストについては、Apache Tika Web サイトを参照してください。

注: tika-server.jar は、HTTP サーバーを開始し、テキスト抽出要求をポート 9998 で listen します。このポートが別のアプリケーションで既に使用されている場合は、以下の notes.ini 設定を使用して Tika のポートを 9997 に変更します。
TIKA_PORT=9997
注:

Notes Basic 版クライアントは、ローカルデータベース内の添付ファイルの検索に Tika フィルタを使用しません(この制限は、Notes Standard 版クライアント、またはサーバーベースのデータベースの検索には適用されません)。Notes Basic 版クライアントのユーザーは、添付ファイルの索引を作成するよう選択できますが、ASCII テキストの添付ファイルのみが検索されます。