Indexation documentaire de pièce jointe

Le serveur Domino® et le client Notes® standard utilisent des filtres de conversion open source Apache Tika 1.18 pour extraire du texte pour les recherches documentaires ou les pièces jointes. Tika remplace le filtre de conversion KeyView utilisé dans les précédentes éditions.

L'implémentation de Tika prend en charge les capacités suivantes :
  • Rechercher un large éventail de formats, y compris des fichiers de conteneur tels que des fichiers .zip et .tar.
  • Rechercher des fichiers de texte ASCII qui contiennent du codage UTF-8.
  • Personnaliser les types de pièces jointes qui peuvent faire l'objet d'un index documentaire et la taille maximale de la pièce jointe autorisée pour l'indexation documentaire.

Tika s'exécute en tant que processus Java lorsque vous démarrez le client standard Notes® ou Domino®. Le processus appelle tika-server.jar, qui démarre alors la tâche HTTP et écoute les demandes d'extraction de texte sur le port 9998, par défaut. Si vous effectuez une mise à niveau vers Notes® ou Domino® 10, les index documentaires qui ont précédemment utilisé des filtres KeyView pour extraire du texte sont reconstruits à l'aide des filtres Tika.

Pour obtenir la liste des formats de fichiers pris en charge par Tika 1.18, consultez le site Web Apache Tika.

Remarque : Le tika-server.jar démarre un serveur HTTP et écoute les demandes d'extraction de texte sur le port 9998. Si une autre application utilise déjà ce port, utilisez le paramètre notes.ini suivant pour passer le port Tika sur 9997 :
TIKA_PORT=9997
Remarque :

Le client de base Notes® n'utilise pas de filtres Tika pour rechercher des pièces jointes dans les bases de données locales. (La limitation ne s'applique pas au client standard Notes ou aux recherches de bases de données basées sur serveur). Les utilisateurs du client de base Notes® peuvent choisir d'indexer des pièces jointes, mais seules des pièces jointes en texte ASCII sont recherchées.