Comment fonctionne le dédoublonnage des notices ?

De WIKI-BOKEH
Aller à : navigation, rechercher

Dans bokeh il y a 3 manières de dédoublonner :

  1. Code barre
  2. ne pas dédoublonner
  3. la clé alpha (titre, auteur, éditeur, collection, année d'édition)

Le dédoublonnage se paramètre dans Cosmogramme > Variables > 4 - Intégration : paramétrage - mode_doublon

De manière générale : on intègre toutes les données envoyées, la bibliothèque pour laquelle on intègre et le profil de données pour lequel la notice doit être analysée. A ce moment le dédoublonneur demande les variables (unicité code barre) et le mode de dédoublonnage.

Il est aussi possible de dédoublonner uniquement au niveau des exemplaires (voir [unique dans le SIGB])

1 / Par code barre[ ]

Le dédoublonnage par code barre est le mode normal de dédoublonnage, il est utilisé pour tous les dédoublonnages des portails bokeh. C'est à partir de ce dédoublonnage que le portail va passer selon la configuration à un autre mode de dédoublonnage (2 - ne pas dédoublonner ou 3 - clé alpha) Ce dédoublonnage général par code barre va pour chacun des exemplaire essayer de trouver un code barre en base de données et, si le code barre est unique par bibliothèque il restreint sa recherche à cette seule bibliothèque (on peut lui indiquer s'il recherche sur une bibliothèque ou plusieurs du réseau)

si un exemplaire avec code barre est trouvé il est toujours associé à un type de document. Il recherche dans l'ordre comme suit :

  1. code barre appartenant à
  2. type doc appartenant à
  3. bib d’intégration

2 / Ne pas dédoublonner[ ]

Plus subtil que son titre ce mode de dédoublonnage ne peut s'appliquer que pour des SIGB Nanook ou Pergame. Le dédoublonneur va s'attacher à regarder les zones 001 (id origine).


3 / Dédoublonnage sur identifiants[ ]

Dédoublonne les notices par les identifiants suivants :

  • ISBN ou
  • EAN ou
  • Id commercial ou
  • ISSN (titres de périodiques seulement)

4 / Clé alpha[ ]

Ce dédoublonnage va s'attacher à trouver des notices qui ont les mêmes données alpha à savoir : titre, auteur, éditeur, date d'édition, collection.

Si toutes ces données sont les mêmes pour plusieurs notices alors il garde la première qu'il trouve. Il est possible de voir la clé alpha d'une notice en ajoutant en fin d'url inspector_gadget/1 comme ici : http://bibliotheques.breslemaritime.fr/recherche/viewnotice/expressionRecherche/*/type_doc/4/tri/*/clef/LESGOONIES--DONNERR--WARNERBROS-2002-4/id/68277/inspector_gadget/1 on retrouve sur un onglet "notice" Clé alpha LESGOONIES--DONNERR--WARNERBROS-2002-4

!! Prenons note qu'une zone modifiée sur une notice ne permet pas de la dédoublonner. Si j'ai deux notices avec la même zone 001 (id notice) le portail n'est pas en mesure de dédoublonner. Le portail préserve au maximum ce qu'il a déjà importé, il ne supprime pas des exemplaires à l'aveugle pour tout importer à l'aveugle, cela explique qu'il faille un dédoublonneur...

!! Cas pour lesquels on ne dédoublonne pas :

  • import de Dublin core ou de biblioondemand (moissonnage OAI)
  • toujours un import total (suppression d'exemplaire + integration)