SGB mutualisé et évolution du Sudoc 2/3 : l’étude sur l’évolution du catalogage et de la production de métadonnées

Ce billet est le deuxième d’une série de trois billets pour faire le point sur le projet de SGB mutualisé à la veille du lancement de la phase pilote :

  1. Point général
  2. Focus sur l’étude de l’évolution du catalogage et de la production de métadonnées
  3. Focus sur l’accord-cadre et la phase pilote.

Accéder à l’intégralité de l’étude

Un résumé détaillé des principaux résultats (« Résumé managérial » en 4 pages) est disponible en tête de l’étude.

L’étude s’intitule : « Catalogage partagé et production des métadonnées communes au sein du réseau Sudoc et Sudoc-PS : un aperçu des orientations possibles : une étude visant à soutenir le développement d’un programme fonctionnel en vue d’une rénovation des systèmes existants ». Elle était nécessaire pour répondre à un certain nombre de questions préalables à l’écriture d’un programme fonctionnel pour la migration du Sudoc (voir billet précédent « Point général« ). La société Pleiade a réalisé l’étude et animé les ateliers du groupe de travail qui accompagnait l’étude, en mettant l’accent sur l’environnement international autant que national. Elle s’est appuyée sur :

  • 10 études de cas : réseau américain Orbis Cascade, projet allemand CIB, projet des bibliothèques universitaires hollandaises, réseau catalan CSUC, réseau BIBSYS en Norvège, projet LIBRIS XL en Suède, projet Melinda/NLS en Finlande, réseau Libraries Australia, réseau des bibliothèques publiques hollandaises, projet allemand LIBOS ;
  • 9 entretiens avec des experts internationaux sur différents thèmes : RDA (Gordon Dunshire, Renate Polak, Reihnard Altenhoener), évolution du catalogage (Lorcan Dempsey, Karen Calhoun), évolution  de la production de métadonnées chez les éditeurs (EDitEUR, Springer), web sémantique (Jakob Voss), évolution de CBS (Eric van Lubeek);
  • 4 entretiens avec des représentants des partenaires nationaux de l’ABES : BnF(Gildas Ilien), ISSN France (Philippe Cantié), INIST (Raymond Bérard), BULAC (Marie-Lise Tsagouria, Christophe Pérales, Benjamin Guichard).

Une présentation de l’étude sera faite lors des journées ABES par son auteur, Maurits van der Graaf.

Quelles seront les suites de l’étude ? L’étude a permis de s’orienter vers deux scénarios pour la migration du Sudoc, l’un inspiré du projet allemand CIB, l’autre inspiré du projet suédois LIBRIS XL. Mais elle n’a pas abouti à un choix définitif entre ces deux solutions assez radicalement opposées.

Le modèle CIB est le choix d’une migration du catalogage national vers les SGB internationaux et le choix d’une évolution progressive vers le Web de données, mais dont le point de départ ne correspond pas à la situation française. Le modèle repose sur deux notions de base. Le german data space permet à chaque bibliothèque de participer au catalogage national à l’intérieur du SGB de son choix, puisque les espaces de données allemands présents dans les différents SGB sont synchronisés entre eux. C’est un catalogage partagé national, réparti entre les différents SGB. Le german data pool offre en plus une garantie d’indépendance des données nationales vis à vis des systèmes de catalogage internationaux et la possibilité de construire sur ces données des services  nationaux indépendants. Le modèle est ambitieux et original, mais le concept de data space, surtout la synchronisation entre les différents espaces de données nationaux, a suscité un certain scepticisme des experts du groupe d’étude. Les journées ABES seront l’occasion d’en apprendre plus sur CIB puisque nous aurons le plaisir d’entendre l’un de ses principaux responsables, Dr. Uwe Risch.

Le modèle LIBRIS XL est le choix de développer (ou d’adopter) une solution nationale séparée des SGB internationaux, quoiqu’en partie alimentée par eux, et directement orientée vers les technologies du Web sémantique. Pour gérer la transition depuis le catalogage MARC actuel vers le nouveau modèle de catalogage, une double interface (MARC 21, formulaire de saisie directe des données) est envisagée. Un couplage avec le flux de métadonnées de Worldcat est par ailleurs en préparation. Le modèle suédois a paru plus novateur au groupe d’étude. La garantie d’indépendance semble plus forte et l’évolution vers le Web de données, visée par le modèle FRBR, semble plus simple et plus directe. Mais il faut attendre que le système soit opérationnel pour mesurer la  faisabilité de la transition entre le Sudoc actuel et un tel système.

Un choix entre ces deux pistes est indispensable pour établir un vrai cahier des charges. Pleiade et le groupe d’étude ont écrit un programme fonctionnel, mais c’est seulement une version de travail générale, qui pourra être plus facilement affinée d’ici un an, car l’année à venir sera décisive pour les deux modèles de référence et verra aussi sans doute les premières implémentations basées sur le modèle BIBFRAME promu par la Bibliothèque du Congrès pour aboutir au remplacement du format MARC.

Une autre suite de l’étude ?

Le groupe d’étude considère que la suite de l’étude ne pourra probablement pas se contenter d’un simple choix entre les deux modèles de référence et devra construire une solution propre mixant les deux approches.

La construction d’un data pool national peut s’appuyer sur l’expérience de mise en oeuvre par l’ABES d’une base XML dérivée de la base de production du Sudoc. L’expression empruntée au modèle CIB correspond à ce que l’étude d’impact appelait base miroir et désigne un entrepôt national de données dans lequel on agrège, améliore et diffuse des données issues de sources variées, importantes pour le réseau national et ses partenaires. La copie des données issues des SGB garantira l’indépendance des établissements, facilitera l’agrégation nationale de données produites par différents outils (données bibliographiques, mais aussi données sur les abonnements électroniques, données locales, données d’usage) et augmentera les possibilités d’améliorer ces données et de les lier aux référentiels nationaux (IdRef, Bacon) via le hub de métadonnées. L’ABES et les établissements pourront s’appuyer sur ces données pour construire ou alimenter indépendamment les services nationaux ou locaux de leur choix.

Le nouvel outil de catalogage national centralisé doit être conçu de façon plus modulaire pour pouvoir facilement s’intégrer à  différents environnements de travail, un système national classique ou un workflow de SGB. On peut prendre modèle sur les applications IdRef, Star ou Calames qui s’appuient sur une API de CBS pour permettre aux catalogueurs de mettre à jour les autorités ou les thèses dans une base commune depuis différents environnements : Sudoc/WinIBW, mais aussi IdRef, Star, Calames, ORI-OAI, …

SchémaJABES

 

Publicités

Les personnes disposent d’un droit d’accès aux informations contenues dans cette zone de texte. Les informations que vous y inscrivez doivent être pertinentes au regard du contexte. Elles ne doivent pas comporter d’appréciation subjective, ni faire apparaître, directement ou indirectement les origines raciales, les opinions politiques, philosophiques ou religieuses, les appartenances syndicales ou les mœurs de la personne concernée.

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s