Politique de numérisation à la BNF


Quelle politique de numérisation de la presse et de l’image satirique à la Bibliothèque Nationale de France ? Réponses de Philippe Mezzasalma, Chef du service de la presse.

Depuis quelques années, la plupart des grandes bibliothèques ou des universités du monde s’engagent dans de vastes politiques de numérisation de leur fonds, et notamment de leur presse ancienne. L’image satirique reste le parent pauvre de cette politique…

Depuis quelques années, la BNF a adopté une politique volontariste en terme de numérisation de la presse disponible notamment sur Gallica. Où en est-on aujourd’hui ?
Philippe Mezzassalma : La première partie du programme est réalisée : près de 20 grands quotidiens du XIXème siècle sont en ligne et à moitié OCRisés, technique permettant la recherche plein texte ou c’est-à-dire que la recherche plein texte est possible. De plus, près de 300 journaux spécialisés du XXème siècle (presse de mode, presse enfantine, presse syndicale, presse de spectacle) sont maintenant accessibles via Gallica, téléchargeables gratuitement et intégralement. Plusieurs centaines de journaux éphémères du XIXe complètent ce tableau.
L’étape suivante devrait voir la numérisation des grands hebdomadaires, la numérisation des journaux publiés par les communautés de langues issues de l’immigration, ainsi que celle des grands quotidiens régionaux antérieurs à 1940.

De nombreux « grands » journaux politiques et d’information ont donc été numérisés, peu comprennent des images et encore moins des images satiriques. Pourquoi ?
PM : Pour la liste initiale, notre préoccupation d’origine consistait à établir une sélection strictement délimitée au contenu éditorial et à la réputation que celui-ci valait au journal, le positionnant ainsi dans l’histoire de la presse. Peu d’attention, voire aucune attention n’avait vraiment été prêtée à la présentation physique, matérielle des journaux. Le dessin ne constituait pas pour nous véritablement une raison d’exclure ou de retenir un titre. En revanche, lors de la numérisation effective, les problèmes techniques auxquels nous avons été confrontés nous ont amenés à nous poser, assez récemment comme vous l’avez compris, la question de la numérisation des dessins via le support publié. Nous avons ainsi traité sur d’autres filières des titres de la presse satiriques du XIXème, en format image uniquement.

Quels problèmes techniques posent la numérisation de la presse illustrée et la visualisation des documents par les internautes ?
PM : La médiocre qualité de l’impression, si fréquente dans la presse entre 1880 et 1940, est encore plus pénalisante pour les illustrations : le rendu peut ainsi être à la limite de l’illisible, la question des contrastes, du choix de la numérisation en couleur se pose, par exemple.

Gallica semble en passe de proposer une meilleure visualisation des images, pouvez-vous préciser ?
PM : Il s’agit surtout d’un visualiseur grand format, plus adapté à la numérisation des grands pages, qui permet la restitution de la page par tuilage (chargement en haute définition) par zones, permettant une augmentation des capacités de zoom et de navigation dans la page, de page en page, et de fascicules à fascicules.

Quels problèmes juridiques pose la mise à disposition du public des documents numérisés ?
PM : La question du droit d’auteur, car la mise en ligne de la numérisation d’un document correspond juridiquement à une nouvelle édition, la Bibliothèque devenant alors elle même éditrice. Il faut donc négocier les droits, lorsque les documents ne sont pas encore tombés dans le domaine public.

Pour échapper au problème de droits d’auteur, la BNF propose un accès aux sites Web qu’elle archive, uniquement aux chercheurs sur place. Pourquoi ne pas numériser ces journaux illustrés sans se soucier des questions de droit, en limitant l’accès aux seuls postes informatiques présents dans la BNF ?
PM : C’est déjà le cas puisque toute une série de titres (Ric et Rac, les Hommes du jour, le Cyrano …) sont numérisés, et accessibles même sur Gallica. Pour les titres publiés après 1940, en revanche, ils ne pourraient être accessibles que depuis le Rez de Jardin, bibliothèque dévolue au Dépôt Légal. Il faudrait pour cela développer une interface de consultation adaptée, ce qui est possible, mais prend du temps à instruire.

La Bibliothèque du Congrès américain a d’ores et déjà mis en ligne plus d’un million d’images, dont certaines très récentes. En Allemagne, la bibliothèque universitaire de Heidelberg numérise des revues satiriques dont certaines ne se terminent qu’en 1944. Les seules questions juridiques expliquent-elles le peu d’images numérisées par la BNF ?
PM : Beaucoup d’images sont déjà accessibles en ligne : photographies, estampes, affiches pour l’essentiel, mais peu de dessins, je vous le concède. Le grand emprunt a pour objectif la numérisation de centaines de milliers d’images, dont des dessins, parmi lesquels des originaux de dessins de presse conservés à la Bibliothèque. En dépit du don Tim, la bibliothèque demeure assez pauvre en originaux : nous espérons que cela créera des occasions de dons ou de dépôts … Par ailleurs, nous avons déjà négocié des droits pour des documents photographiques récents, comme les photos de l’AFP. Et je vous rappelle que le droit d’auteur ne s’applique pas de manière uniforme selon les pays, et avec plus ou moins de rigueur selon les membres de l’UE.

Vous « négociez » en ce moment la numérisation du Canard enchaîné. Quels problèmes rencontrez-vous ?
PM : Cette discussion est pour l’instant arrêtée, le journal devant se mettre préalablement en règle avec les dessinateurs ou leurs ayants droit. D’où le retard pris, mais bien sûr, pour nous, la numérisation du Canard est une priorité n°1.

Quelles difficultés rencontrez-vous avec la numérisation du supplément illustré du Petit journal ?
PM : La plupart des fascicules est en ligne, subsistent encore quelques lacunes que nous essayons de combler.

Qui réalise pratiquement les numérisations, pour quel coût, avec quels moyens techniques ?
PM : Des équipes de la BnF sur les sites de Richelieu, Bussy, Sable, et des prestataires privés. Des numériseurs verticaux dernière génération sont utilisés, permettant de numériser des documents en feuille ou des documents reliés avec correction de la courbure. Le seul programme de numérisation de la presse des grands quotidiens du XIXe siècle est estimé à 3,5 M d’euros, pour 3,5 millions de pages (31 titres), numérisés et oCRisés.

Les images présentes dans les journaux numérisés ne bénéficient pas d’une indexation descriptive, contrairement aux dizaines de milliers de gravures en lignes présentes sur la database du British Museum par exemple. Pourquoi ?
PM : Le statut tout à fait aléatoire de l’illustration dans la grande presse quotidienne (qualité du rendu, diversité des supports et des techniques, détourage, rubriquages et positionnement dans le journal aléatoire) rendait l’opération parfaitement impossible a priori. Les illustrations légendées peuvent être retrouvées en recherche plein texte. Nous avons estimé qu’il valait mieux rendre disponibles au plus vite ces journaux, quitte à ce que l’indexation ne soit pas la plus satisfaisante. Maintenant, peut être est-ce aussi la limite de notre travail de bibliothécaire, peut-être est-ce là que commence le travail de l’historien : on pourrait tout à fait envisager un enrichissement de notices par indexation participative …

La BNF semble très réticente à donner accès à des images de bonne qualité, préférant les vendre aux éditeurs. Le British Museum envoie sur simple demande et de manière automatique des fichiers moyenne définition utilisables gratuitement dans le cadre d’une publication papier scientifique et universitaire. La politique de la BN en la matière pourrait-elle évoluer ?
PM : J’ai du mal à comprendre ce que recouvre concrètement la première partie de la question : le travail de nos photographes est bon techniquement, mais très cher, et nous n’avons aucune réticence pour la réalisation commerciale de ce qui est demandé par le public. Celui-ci, contrairement aux éditeurs, se décourage devant les prix et les délais, mais il ne s’agit en rien d’une politique. Actuellement par ailleurs, une réflexion est menée, qui va entraîner une réorganisation profonde de ce service au public, et une évolution innovante.

Sous quel délai la BNF peut-elle numériser la presse satirique illustrée présente dans ses collections ?
PM : Je vous encourage à consulter Gallica, une bonne partie s’y trouve maintenant et le reste est en cours (1).

Visualiser une image de grande taille (comme les dessins du supplément illustré du Petit journal par exemple) sur un écran n’est pas simple. Des écrans « géants » sont-ils prévus pour de telles visualisations en Haut ou Rez de jardin de la BNF ?
PM : Oui, tout à fait, la future salle de la presse et des médias, qui sera en salle B, disposera de très grands écrans.

En matière de numérisation et de mise à disposition du public via le web de la presse satirique, les grandes Bibliothèques du monde vous semblent-elles plus ou moins avancées par rapport à la BNF ?
PM : La situation varie en fonction du type de financement possible : certains mécènes influent sur les réalisations. En France, les mécènes sont plus classiques dans leurs goûts, la presse n’étant que depuis peu considérée comme un objet patrimonial. Mais je considère, au vu de ce que je connais, que nous sommes loin d’être en retard sur la question.

Philippe Mezzasalma, Chef du service de la presse, BnF, propos recueillis par Guillaume Doizy, février 2010

(1) L’internaute trouvera sur Gallica tout ou partie de dizaines de titres satiriques illustrés comme par exemple : Journal pour rire, La Calotte, Ric et Rac, Cyrano, Canard Sauvage, Bec et ongles, La Gauloiserie, Le Titi, Coulisses lyonnaises, La Grimace, La Flèche de Triboulet, L’impartial Tlemcenien, Le Journal pour rire, L’Iroquois, Journal amusant, Le Moustique (Oran), La Caricature (1830-1833), La Cloche d’Argent (Rouen), La Chanson illustrée, La Flèche (1904), Marianne (1906), mais à la date de cette interview Gallica ne propose aucun dessin de l’Assiette au Beurre, du Rire, du Don Quichotte, etc. La plupart des images ont été numérisées en noir et blanc et rarement en niveaux de gris. (Note de GD).