Accueil / Individus, familles, groupes / Dictionnaires et collections de mémoires / Etudes modernes / Généalogies, alliances et informatique

Généalogies, alliances et informatique

Pierre Lamaison, Marion Selz-Laurière

Pierre Lamaison et Marion Selz-Laurière, "Généalogies, alliances et informatique", dans Terrain, année 1985, numéro 4, pp. 3-14.

Extrait de l’article

La reconstitution automatique des généalogies (sur ordinateur), à partir des données consignées depuis plusieurs siècles dans les registres paroissiaux et d’états civils des divers pays d’Europe occidentale, se heurte toujours au même type de difficulté : sur quoi fonder l’identification formelle de chaque individu, compte tenu de la fréquence plus ou moins élevée (selon les époques et les régions) des homonymies, des variations ou des erreurs dans la transcription des composantes de l’identité, patronymes et prénoms, et des approximations, avant le XIXe siècle, dans la notation des âges, des professions et même des lieux ? Comment, dès lors qu’aucun paramètre n’est absolument fiable, établir ou rétablir systématiquement les liens de filiation directe (père, mère / fils, fille), dont la connaissance conditionne l’établissement des généalogies ? Comment, en fin de compte, traiter par programme l’ensemble des opérations d’évaluation des informations, de déduction, voire de discernement, par lesquelles le chercheur parvient « à la main » à corriger les inexactitudes et à préparer un corpus généalogique susceptible d’être ensuite analysé ?

Ces questions ont été posées depuis longtemps dans le domaine européen, parce que l’établissement manuel des fiches de famille, ou de tout autre équivalent assurant la vérification des données suppose un travail si long et si fastidieux, que la plupart des chercheurs y renoncent en cours de réalisation. Le relevé des actes, baptêmes ou naissances, mariages, sépultures ou décès, se double en effet d’une série de mises en fiches, de superpositions et de tris assurant l’établissement des fratries, qui allonge considérablement le temps de préparation. Bien des équipes, en France et à l’étranger, ont donc tenté de supprimer, à l’aide de l’informatique, ces étapes supplémentaires, en cherchant à résoudre les problèmes spécifiques des données qu’elles entendaient traiter : historiens, ethnologues, démographes, généticiens des populations, etc., se sont engagés, avec des succès inégaux, dans cette voie, mais il semble qu’à ce jour, personne n’ait apporté de solution générale à ces questions — à moins qu’elle ne soit restée confidentielle. Tantôt parce que les programmes ont simplement été conçus en fonction de corpus particuliers, de situations spécifiques dont la résolution représentait l’unique objectif, tantôt, à l’inverse, parce que les ambitions ont été excessives et qu’on prétendait confier à l’ordinateur la résolution totale et automatique de toutes les incertitudes, à partir des données brutes relevées dans les registres, sans autre intervention des chercheurs. C’est oublier dès lors que la gamme des situations auxquelles on peut être amené à faire face est immense et qu’il n’est pas possible a priori de les imaginer toutes, ni même de définir la façon de solutionner certaines des ambiguïtés qui ont pu être décelées dès la collecte des informations. Les amateurs d’archives et de généalogies savent bien quel puzzle représentent certaines identifications et les recoupements qu’il faut opérer pour acquérir la certitude, par exemple, que Pierre Bouquet, Marie Bouchard et Jean Bouchet sont bien frères et sœur ! Ce sont pourtant là des imprécisions « minimes », pour lesquelles un système de règles sophistiquées peut déjà proposer quelques corrections, mais comment faire pour reconnaître dans Jacques Ranvier le fils de Joseph Delranc, quand, manuellement, il faut superposer tant d’informations d’origines différentes pour s’en apercevoir ? Or ce type d’irrégularité est encore fréquent au XVIIIe siècle et courant aux époques antérieures où les noms ne sont pas totalement fixés ; dans une même région on trouve de surcroît des différences selon les prêtres qui ont tenu les registres, le sérieux et l’application qu’ils y ont apportés. Le petit nombre de prénoms en vigueur à ces époques et l’habitude très générale de puiser constamment dans le même stock familial, jusqu’à nommer de la même façon deux ou trois frères ou sœurs, multiplient par ailleurs les cas d’homonymie ; la distinction est d’autant moins facile à opérer, surtout dans les régions très endogames et de faible immigration, que les patronymes sont peu nombreux. Or les données annexes, telles que l’âge et la profession, sont, elles aussi, incertaines ou fluctuantes et elles ne permettent pas de lever systématiquement toutes les hésitations ; parfois, ce sont d’autres indices, comme l’identité d’un témoin choisi dans la parenté, pour un mariage, ou celle d’un parrain ou d’une marraine, qui lèveront définitivement le doute. Mais on ne peut pas coder toutes ces informations parallèles, à moins de vouloir les analyser elles aussi, et il faut donc se contenter d’un nombre restreint de paramètres.

Lire la suite (revues.org)