첨부 파일 전체 텍스트 색인

Domino® 서버 및 Notes® 표준 클라이언트는 Apache Tika 1.18 오픈 소스 변환 필터를 사용하여 첨부 파일의 전체 텍스트 검색을 위해 텍스트를 추출합니다. Tika는 이전 릴리스에 사용된 변환 필터인 KeyView를 대체합니다.

Tika의 구현으로 다음이 지원됩니다.
  • .zip 및 .tar 파일 등 컨테이너 파일을 포함한 다양한 형식 검색.
  • UTF-8 인코딩을 포함한 ASCII 텍스트 파일 검색.
  • 전체 텍스트 색인이 가능한 첨부 파일 유형과 전체 텍스트 색인을 위해 허용되는 최대 첨부 파일 크기의 사용자 정의.

Tika는 Notes® 표준 클라이언트 또는 Domino® 시작 시 Java 프로세스로 실행됩니다. 프로세서에서 tika-server.jar을 호출하면 기본적으로 HTTP 태스크가 시작되고 포트 9998의 텍스트 추출 요청을 수신합니다. Notes® 또는 Domino® 10으로 업그레이드한 경우 이전에 KeyView 필터를 사용하여 텍스트를 추출했던 전체 텍스트 색인이 Tika 필터를 사용하여 재구성됩니다.

Tika 1.18에서 지원하는 파일 형식 목록은 Apache Tika 웹 사이트를 참조하십시오.

주: tika-server.jar 파일이 HTTP 서버를 시작하고 포트 9998의 텍스트 추출 요청을 수신합니다. 다른 애플리케이션에서 이 포트를 이미 사용 중인 경우 다음 notes.ini 설정을 사용하여 Tike 포트를 9997로 변경합니다.
TIKA_PORT=9997
주:

Notes® 기본 클라이언트는 로컬 데이터베이스 첨부 파일 검색에 Tika 필터를 사용하지 않습니다. (Notes 표준 클라이언트 또는 서버 기반 데이터베이스 검색에 제한이 적용되지 않습니다.) Notes® 기본 클라이언트 사용자는 첨부 파일 색인을 선택할 수 있지만 ASCII 텍스트 첨부 파일만 검색됩니다.