CCFr : Base Patrimoine

Description de la Base Patrimoine

La Base patrimoine est l’une des plus importantes bases bibliographiques françaises. Elle a vocation à signaler les documents conservés dans des :

  • fonds anciens,
  • fonds locaux ou spécialisés sélectionnés pour leur richesse, leur originalité.

Ceux-ci peuvent être conservés dans des bibliothèques territoriales, de musées, d’archives, de ministères (hors établissements relevant du Ministère de l’Enseignement supérieur).

Les livres représentent l'essentiel des documents décrits (plus de 90% des notices) mais on y trouve aussi des images fixes, périodiques, manuscrits, cartes, documents sonores et autres types de supports.

Un tiers des livres décrits date d'avant 1811, un autre tiers ayant été publié entre 1811 et 1914, le reste étant paru après 1914.

Le français représente les 3/4 des livres mais de nombreuses langues sont également présentes : latin, angais, allemand, italien, espagnol, néerlandais, basque, occitan, etc.

La Base patrimoine est hébergée par le Catalogue collectif de France et alimentée par les bibliothèques partenaires de la BnF, via des chargements de notices.

Ces chargements sont effectués deux à trois fois par an, pour une ou plusieurs bibliothèques à chaque fois.

Les notices sont chargées par bibliothèque et fonds documentaires.

Il n'y a pas de dédoublonnage des notices entre les différents chargements, pour respecter les particularités de chaque exemplaire (appartenance à un fonds, reliure, provenance, notes manuscrites, lacunes).

La mise à jour des données se fait par suppression des données existantes et chargement des données existantes, ce qui implique la modification du lien ark existant.

Description du jeu de données

La Base Patrimoine est présentée sous la forme d'un fichier d'archivage compressé de 608 Mo (5,25 Go décompressé).

Celui-ci contient 711 fichiers .mrk répartis dans 13 dossiers correspondants aux régions administratives.

Le nom des fichiers reprend la structure n°RCR de l'établissement-Ville-Nom de la bibliothèque, éventuellement suivi du nom du fonds et/ou d'un numéro séquentiel lorsque le nombre de notices impose un découpage en plusieurs fichiers. Les n° RCR sont indiqués dans les notices du Répertoire du CCFr et dans le jeu de données correspondant.

Les notices sont au format UNIMARC ISO2709, format officiel d'échange de l'information bibliographique en France.

Le logiciel MarcEdit (libre, gratuit et disponible sous Windows, MacOS et Linux) peut être utilisé pour l'édition de ces fichiers et pour leur transformation dans d'autres formats.

L'ensemble représente plus de 6,7 millions de notices bibliographiques.

Accéder au jeu de données

ftp://PRODUIT_CCFR:ks8r7HJ6@pef.bnf.fr/PRODUIT_CCFR/CCFr_Base_patrimoine_MARC_ISO2709_2018-10.7z

Pour en savoir plus

Dataset schema

JSON Schema

The following JSON object is a standardized description of your dataset's schema. More about JSON schema.