Les défis de la numérisation des livres anciens en langues autochtones

par Lisa Miniaci
Directrice de la conservation et de la numérisation

et Pascale Montmartin
Chef de la conservation et des collections numériques

Direction générale de la Bibliothèque nationale

 

Au premier abord, numériser 146 livres provenant des collections de la bibliothèque nationale peut paraître anodin. Détrompez-vous! Malgré le nombre de documents assez restreint, les défis d’un tel projet ont été nombreux et inhabituels. L’expertise du personnel dédié à la conservation et à la numérisation des documents et la subvention octroyée par la Stratégie de numérisation du patrimoine documentaire (SNPD) ont permis la réalisation de ce projet important.

Jean André Cuoq, Kaiatonsera ionteweienstakwa kaiatonserase = Nouveau syllabaire iroquois, Montréal, John Lovell, 1873. Photo : Michel Legendre.

Avant de numériser, restaurer

À leur sortie des réserves et avant d’être déplacés vers les ateliers de la numérisation, les documents sont passés entre les mains de spécialistes de la conservation qui ont évalué l’état physique et les travaux de restauration nécessaires. Deux constats se sont imposés : le papier était souvent friable et certaines reliures trop serrées posaient des problèmes d’ouverture. Deux restauratrices ont consacré de nombreuses heures à consolider les documents, les interventions les plus fréquentes étant des réparations de déchirures au moyen de papier japonais et l’enlèvement d’adhésifs acides qui endommageaient le papier ou le cuir.

Une des singularités du projet tient aux choix qui ont été faits pour numériser des livres à ouverture restreinte due à ces reliures très serrées. Les équipes impliquées ont su faire preuve de créativité et de débrouillardise pour proposer des solutions visant à obtenir les meilleurs résultats de numérisation possible, c’est-à-dire une lisibilité optimale, tout en préservant l’intégrité matérielle des documents. Afin que tous les mots d’une page puissent être balayés lors des opérations de numérisation, quelques documents ont été exceptionnellement déreliés. Cette décision avait deux objectifs : faciliter la numérisation et diminuer le stress sur le papier induit par une reliure inadéquate.

Une variété de formats et d’alphabets à considérer

Des numériseurs avec angle de 100 degrés ont été utilisés pour capter la plupart des images. Il a fallu adapter ces appareils avec de nouvelles lentilles permettant d’obtenir des résolutions adéquates pour les petits livres, plusieurs ayant moins de 19 cm de longueur. Ces ajustements visaient encore une fois une lisibilité maximale, sans déformation.

Ouvrage en cours de numérisation à BAnQ Rosemont–La Petite-Patrie. Photo : Michel Legendre.

Dans de rares cas, il a été préférable d’utiliser deux exemplaires distincts lorsque les ouvertures étaient trop restreintes. Pour ceux-ci, la provenance des images est clairement mentionnée dans les notices descriptives. Malgré tous ces efforts, certains mots sont demeurés cachés dans le creux des reliures.

Quatre numériseurs différents ont été sollicités par le projet. Les cartes géographiques pliées et insérées à l’intérieur des documents ont présenté un défi supplémentaire, car les techniciens ont dû opérer deux appareils distincts (à plat et à angle) pour compléter la numérisation d’un même livre.

Dans le but d’améliorer le résultat de la reconnaissance optique des caractères (OCR), un travail de dépistage et de correction manuelle a été effectué à partir d’un échantillon. Après avoir regroupé les documents selon leurs défis particuliers, le résultat de l’océrisation a pu être amélioré en permettant à l’outil Tesseract de faire l’apprentissage des polices et des caractères spécifiques (ȣ, ρ, ᑭᒋ ᒥᐢᑲᐧᐁᒪᐠ ᒐᑯᕠᓇᐃᑌᓕᑕᓯ,…) de plusieurs langues autochtones. Au total, 30 documents ont bénéficié d’un tel traitement et une vingtaine de pages ont été corrigées manuellement. Un véritable travail de moine, qui a permis d’améliorer la qualité des retranscriptions de plus de 7300 pages! Cette nouvelle façon d’optimiser l’océrisation sera certainement utile à l’avenir.

Extrait d’un ouvrage rédigé en inuktitut. E. J. Peck, The four Gospels, Londres, British and Foreign Bible Society, 1897.

Les employés, tout en assurant les tâches techniques de numérisation sécuritaire selon les normes internationales, ont pu découvrir et apprécier le contenu de ces livres anciens en langues autochtones, comportant des alphabets et des caractères inusités. Ils ont été fascinés par les lexiques, les cartes et les illustrations des scènes de la vie quotidienne des diverses communautés. Cette réalisation ouvrira certainement de nouvelles pistes de recherche et sensibilisera les Québécois à la diversité de leur patrimoine.