•  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Décoder les manuscrits de la Nouvelle-France

La possibilité de lire aisément la masse de documents manuscrits de la Nouvelle-France fait rêver les mordus d’histoire et de généalogie. De nouvelles interfaces logicielles, qui font appel à l’intelligence artificielle, permettent aujourd’hui de transcrire, avec un faible taux d’erreurs, le menu récit du début de la colonie.

Image d'un document de la Nouvelle-France.

Un document datant de la Nouvelle-France est préservé par Bibliothèque et Archives nationales du Québec.

Photo : Radio-Canada

À première vue, on ne comprend rien. C’est illisible. Une écriture cursive, des graphies particulières et des termes de l’époque. Bienvenue dans les manuscrits de la Nouvelle-France! Tous les historiens et les généalogistes vous le diront : plonger dans les documents de cette période est une grande source de frustration parce que déchiffrer et transcrire le contenu de ces écrits est exigeant et demande un temps fou.

On estime qu’il y a environ 1,5 million de pages relatives aux archives de la Nouvelle-France dans le seul réseau de Bibliothèque et Archives nationales du Québec (BANQ), souligne Rénald Lessard, spécialiste de la Nouvelle-France et archiviste coordonnateur au sein de la vénérable institution québécoise.

C'est le bloc d'archives le plus important sur le premier empire colonial français en dehors de la France.

Une citation de Rénald Lessard, archiviste coordonnateur à BANQ

Une partie de ces documents originaux a été numérisée et mise en ligne par BANQ. Bien qu’un court texte résume le contenu de ces documents, on est encore loin d’une transcription complète et détaillée de chacune de ces pages. En conséquence, une grande partie des archives de la Nouvelle-France ont été vues, mais elles n’ont pas nécessairement été lues.

Photo de Rénald Lessard.

Rénald Lessard est archiviste coordonnateur à Bibliothèque et Archives nationales du Québec (BAnQ).

Photo : Radio-Canada

Maxime Gohier codirige avec son collègue Léon Robichaud le projet Nouvelle-France numérique. Tous deux professeurs d’histoire, l’un à l’Université du Québec à Rimouski (UQAR), l’autre à l’Université de Sherbrooke, ils rêvaient depuis longtemps d’un outil qui permettrait de mettre en parallèle des documents d’archives et leur transcription, tout en ayant la possibilité de les partager.

Je fouillais sur Internet, puis à un moment donné, je tombe sur le site web de Transkribus, se rappelle Maxime Gohier. Transkribus est un nouveau logiciel développé en Autriche par la coopérative Read. Le système met à profit des techniques d’apprentissage profond et d’intelligence artificielle pour transcrire des séries de documents anciens.

Je venais de découvrir un peu le Saint-Graal que les historiens cherchent.

Une citation de Maxime Gohier, professeur d’histoire à l’UQAR

Le logiciel permet d’accéder à des modèles génériques de reconnaissance et de transcription de manuscrits, mais il permet aussi de développer des modèles plus spécifiques pour la transcription de textes particuliers, comme ceux de la Nouvelle-France.

Photo de Maxime Gohier, de l'UQAR.

Maxime Gohier est professeur d’histoire à l'Université du Québec à Rimouski (UQAR).

Photo : Radio-Canada

Des historiens, des professeurs, des étudiants et des généalogistes spécialisés en paléographie ont graduellement corrigé les épreuves du logiciel pour lui apprendre à reconnaître des graphies particulières, des lettres, des nombres, des abréviations ou des termes de l’époque.

Au projet Nouvelle-France numérique se greffe un projet de science participative. Pierre Dubois a cofondé avec André Morel les Gardenotes, un regroupement de paléographes fascinés par les documents anciens.

Photo de Pierre Dubois.

Pierre Dubois est paléographe et cofondateur des Gardenotes.

Photo : Radio-Canada

Ce sont, pour la plupart, des généalogistes qui ont développé une grande aptitude à lire des documents manuscrits de l’époque. Grâce à leur expertise et à leur participation bénévole à l’entraînement des modèles, la performance de lecture du logiciel de transcription s’améliore.

On arrive avec un taux d’erreur de 5 % environ. C'est spectaculaire! Même nous, on n'y croyait pas au départ.

Une citation de Pierre Dubois, paléographe, cofondateur des Gardenotes

Une fois que la capacité de transcription du modèle est optimisée, à l’aide d’environ 200 pages d’entraînement, on peut lui soumettre des milliers de pages du même auteur avant que la transcription complète ne s'effectue en un clin d'œil.

C’est là qu'on tombe dans la haute performance. Un notaire a pu laisser un greffe de 15 000 à 20 000 pages qu'on peut transcrire à 5 % d'erreurs. C'est extraordinaire!, s’exclame le professeur Maxime Gohier.

Des personnages oubliés

Avec la transcription de milliers de pages vient la capacité de réaliser des recherches dans les textes et de redécouvrir des morceaux de la grande et de la petite histoire de la Nouvelle-France, de voir surgir des personnages oubliés de l’histoire.

Ça change tout. La vieille méthode de travail est complètement révolutionnée, s’enthousiasme Dominique Deslandres, professeure d’histoire à l’Université de Montréal.

Photo de Dominique Deslandres.

Dominique Deslandres est professeure d’histoire à l'Université de Montréal.

Photo : Radio-Canada

Elle s’intéresse aux documents du premier tribunal de Montréal. Elle est à la recherche de femmes et d’esclaves dans les procès civils et criminels. À sa grande surprise, elle a découvert, dans le premier registre d’audience, une certaine Marie Pournin, étroite collaboratrice de Jeanne Mance à l’Hôtel-Dieu.

En Nouvelle-France, il n'y avait pas d'avocat, les gens se représentaient eux-mêmes. La personne est interrogée, elle explique toutes sortes de choses. Donc, on voit et on entend des personnes qui n'ont laissé aucune autre trace que celle-là dans les archives, ajoute Dominique Deslandres.

Image d'une transcription.

Transcription d'un document d'archives de Bibliothèque et Archives nationales du Québec par le logiciel Transkribus.

Photo : Radio-Canada

Accéder à cette masse de documents manuscrits ouvre aussi la voie à de nouvelles recherches, plus pointues, qui seraient impossibles à réaliser à moins de lire ces documents, page par page.

Ça va nous permettre de travailler plus en profondeur sur des individus, des lieux, des sujets, parfois plus terre à terre, comme la présence de chiens en Nouvelle-France, des choses qui passent sous le radar en temps normal. Les possibilités sont énormes, renchérit Rénald Lessard de BANQ.

Le grand public aura-t-il bientôt accès à ces transcriptions des archives de la Nouvelle-France? Le projet reste à venir. D'abord, il y a un coût lié à l'utilisation de la technologie, rappelle Maxime Gohier, mais c'est également une question de propriété d'images. Certaines sont publiques, d’autres sont privées et, bien que plusieurs soient prêts à les transmettre, il reste encore du travail à faire de ce côté-là.

Une personne ouvre un vieux manuscrit datant de l'époque de la Nouvelle-France.

Le reportage d'André Bernard et de Yanick Rose présenté à l'émission « Découverte »

Photo : Radio-Canada

Vous souhaitez signaler une erreur?Écrivez-nous (Nouvelle fenêtre)

Vous voulez signaler un événement dont vous êtes témoin?Écrivez-nous en toute confidentialité (Nouvelle fenêtre)

Vous aimeriez en savoir plus sur le travail de journaliste?Consultez nos normes et pratiques journalistiques (Nouvelle fenêtre)

Chargement en cours

Infolettre Info nationale

Nouvelles, analyses, reportages : deux fois par jour, recevez l’essentiel de l’actualité.

Formulaire pour s’abonner à l’infolettre Info nationale.