Bokeh permet l'indexation et la recherche plein texte de fichiers liés aux notices et présents sur le serveur d'hébergement.

ATTENTION
Cette fonctionnalité nécessite un hébergement dimensionné pour le volume de texte à indexer.

Pré-requis

  • les formats de fichiers supportés sont PDF et HTML.
  • les fichiers doivent être présents dans le répertoire d'hébergement de Bokeh, dans le sous-répertoire /userfiles
  • l'extraction du texte des fichiers PDF s'appuie sur la commande linux pdftotext, cet outil doit donc être installé sur le serveur d'hébergement

Configuration du profil de données

Dans le profil de données utilisé pour importer vos notices vous trouverez dans l'onglet indexation un nouveau paramètre Indexer le contenu des fichiers spécifiés en

Data profile linked files.png

Le champ Chemin de fichier permet de restreindre l'indexation aux zones de liens ayant un contenu correspondant aux fichiers présents sur le serveur d'hébergement.

Il s'agit d'une expression régulière qui doit être compatible avec PHP (voir la documentation)

Utilisation dans le portail

Configuration de la boite recherche

Vous pouvez choisir le mode de recherche lorsque l'internaute utilise une boite de recherche.

Widget search in file.png

L'option Mode de recherche vous permet d'activer la recherche dans l'index ET le contenu des fichiers liés.

Informations dans le résultat de recherche

Vous pouvez proposer le choix du mode de recherche dans l'en-tête de la liste de résultat.

Widget search result in file.png

L'outil Mode de recherche dans le paramètre composition de l'en-tête proposera ce choix.

Widget search result.png

Recherche avancée

Si vous utilisez la Personnalisation de la recherche avancée, vous pouvez utilisez le paramètre in_files.

Lorsque ce paramètre vaut 1, Bokeh effectue une recherche dans le contenu des fichiers.

Syntaxe possible

La syntaxe de recherche pour le contenu des fichiers est celle permise par le moteur fulltext MySQL, voir la documentation

Site hébergé et maintenu par AFI et BibLibre et enrichi par la communauté de Bokeh.