Indexation de fichiers liés aux notices

De WIKI-BOKEH
Aller à : navigation, rechercher

Bokeh permet d'indexation et la recherche plein texte de fichiers liés aux notices et présents sur le serveur d'hébergement.

Pré-requis[ ]

  • les formats de fichiers supportés sont PDF et HTML.
  • les fichiers doivent être présent dans le répertoire d'hébergement de Bokeh, dans le sous-répertoire /userfiles
  • l'extraction du texte des fichiers PDF s'appuie sur la commande linux pdftotext, cet outil doit donc être installé sur le serveur d'hébergement

Configuration du profil de données[ ]

Dans le profil de données utilisé pour importer vos notices vous trouverez dans l'onglet indexation un nouveau paramètre Indexer le contenu des fichiers spécifiés en

Data profile linked files.png

Le champ Chemin de fichier permet de restreindre l'indexation aux zones de liens ayant un contenu correspondant aux fichiers présent sur le serveur d'hébergement.

Il s'agit d'une expression régulière qui doit être compatible avec PHP (voir la documentation)