notre généalogie est-elle biaisée ?
Général Sur le Blog...

Notre généalogie est-elle biaisée ?

23 avril 2018

Publier ses données généalogiques sur Internet ne sert pas seulement à partager avec d’autres généalogistes. Cela sert également aux historiens, notamment en démographie historique. Ainsi, une étude récemment publiée s’appuie sur les données publiées sur Geneanet. Toutefois, les résultats sont mitigés. Notre généalogie serait-elle biaisée ?

Le 6 mars 2018 a été publiée sur le site HAL, Étude de la démographie française du XIXe siècle à partir de données collaboratives de généalogie (1).

Les auteurs ont étudié les données de 2 457 450 individus nés en France entre 1800 et 1804. Pour cela, ils ont travaillé à partir des données publiées sur Geneanet. Cette étude a pour but de montrer que le travail de collecte et de saisie effectué (…) peut potentiellement être réutilisé en démographie historique (…)  et qu’il est possible de retrouver, bien qu’il subsiste parfois quelques biais, certains résultats de la littérature (2).  La littérature mentionnée concerne la littérature de référence en démographie française pour la période du XIXe siècle.

Si les auteurs soulignent que la couverture spatiale est un atout des arbres en ligne, ils relèvent quelques points non pas bloquants, mais posant pour le moins certaines limites.

Le premier point, que tout utilisateur de Geneanet connaît bien, est la difficulté à regrouper les branches communes des arbres. L’arbre universel permettrait une étude simplifiée et plus fine de la démographie française. Simplifiée dans le sens où il n’y aurait pas à traiter de nombreux doublons ; plus fine dans le sens où les informations seront probablement plus nombreuses, variées et documentées.

Le second point concerne la précision des informations retranscrites qui est, je cite : inhérente à la volonté de ces individus (3). Si je rejoints les auteurs sur ce point, je ne suis pas d’accord dans leur minoration de cette constatation. Ainsi, selon eux, “certaines erreurs peuvent être corrigées en confrontant les relevés des utilisateurs entre eux, en se fiant aux valeurs les plus fréquemment observées. Malheureusement, ce n’est pas aussi simple que cela. Tout comme moi, vous avez constaté qu’une erreur, qui pouvait provenir de votre arbre, était répétée à l’envie sur Geneanet, car recopiée sans vérification. Dans ce cas, ce ne sont pas les relevés qu’il faut confronter entre eux, mais aller à la source.

 

Comparaison des données issues de l’échantillon avec la littérature

Si l’étude en elle-même est intéressante, elle m’amène à m’interroger sur notre pratique de la généalogie, et l’interprétation que peuvent en faire des historiens qui ne pratiquent pas la généalogie.

Les auteurs soulignent que les données de l’INSEE concernant les naissances par sexe, pour 1801, indiquent un taux de masculinité de 105, alors qu’il est de 116 dans leur échantillon. Selon eux l’existence d’un biais sexiste dans les études de généalogie n’est pas nouvelle (4). Les auteurs Gavrilov et Gavrilova mentionnent l’existence d’une sous-déclaration des femmes et des enfants dans les bases de données généalogiques (5).

Cette assertion m’étonne. Notre généalogie serait-elle biaisée dans le sens où elle serait sexiste ? Je ne le crois pas. Nous savons tous combien il est difficile d’établir la généalogie des femmes, les sources à leur sujet étant moins nombreuses que pour les hommes. Nous intéresserions-nous alors qu’aux hommes, jusqu’à ne noter dans les filiations que les garçons ? Là encore, je ne serais pas aussi affirmative.

Le taux de fécondité est lui aussi en décalage par rapport à ce qui peut être trouvé dans la littérature. Dans l’échantillon de Charpentier et Gallic, il est de 1,46 enfant par femme (mariée, ayant au moins 15 ans), alors qu’il est de 4,46 selon J. Chesnais (6). Pour expliquer cet écart je vois deux réponses.

La première étant que les généalogistes n’indiquent pas tous les enfants mort-nés ou morts à quelques jours. Il suffit de voir les questions posées à ce sujet sur les réseaux sociaux et les forums pour le constater.

La deuxième concerne notre mode de recherche. Cherchez-vous et notez-vous systématiquement TOUS les enfants d’un couple ? Lorsque j’ai commencé la généalogie, je ne m’intéressais qu’à mes ancêtres directs. Il m’arrivait de noter d’autres enfants, selon les découvertes dans les registres, mais je n’allais pas au-delà. Je reprend maintenant toute ma généalogie, et relève tous les enfants. Il est fréquent qu’une fratrie de quatre enfants retrouve six autres frères et sœurs. De quoi fausser les statistiques..

notre généalogie est-elle biaisée ?

Les données migratoires sont-elles, elles aussi, concernées par ces différences de résultats ?

Charpentier et Gallic soulignent que les données généalogiques ne permettent pas, à priori, d’étudier les migrations liées au marché du travail. La saisie des différentes professions de nos ancêtres ne se fait pas aussi naturellement que pour une naissance, un mariage ou un décès, d’autant que ces informations peuvent être trouvées sur différents documents. Il faut alors penser à aller sur la fiche de l’individu et créer un évènement profession. Je n’y pense pas toujours et je le regrette, car étudier l’évolution professionnelle est aussi importante (je lance ici un appel à l’équipe d’Heredis pour que la profession puisse être documentée à l’occasion de la saisie par acte).

En outre, je m’interroge sur le fait qu’ils n’aient pu suivre les individus de leur échantillon dans le cadre de migrations temporaires (déplacements momentanés au cours d’une vie : lieu de naissance, de mariage, de naissance des enfants et de décès) par manque d’informations (7). L’échantillon de départ a été découpé de la façon suivante : les aïeux (nés entre 1800 et 1804), ils représentent 1 547 086 individus, leurs enfants – 402 190 individus -, leurs petits-enfants et arrières-petites-enfants. Les dates de naissances et de décès ne sont indiquées que pour 53% des aïeux. Pourquoi un taux aussi faible ? Ne saisissons-nous des données complètes que pour notre branche directe ?

 

Notre généalogie est-elle biaisée ?

Enfants non intégrés dans la famille, dates non complétées, migrations ignorées. Le constat parle de lui-même, notre généalogie est biaisée.

Nous avons tous commencé de la même façon, en ne nous intéressant qu’à notre lignée directe, en négligeant les collatéraux. Toutefois, je constate que les généalogistes qui reprennent leurs données en y incluant tous les enfants, les professions et d’autres évènements, sont de plus en plus nombreux. En formation, je conseille toujours aux généalogistes débutants de ne pas se lancer dans la course du “premier arrivé en haut de l’échelle du temps”. Il est plus intéressant de prendre son temps, de rechercher un maximum d’informations sur ses ancêtres, en incluant les autres membres de la famille.

Le généalogiste français a entamé sa mue pour devenir un historien familial. Nous avons donc beaucoup à apprendre des études publiées à partir de nos données comme celle d’Arthur Charpentier et Ewen Gallic.

Reprenons nos généalogies, corrigeons les, complétons les, et rendez-vous dans quelques années pour une nouvelle étude démographique à partir de données collaboratives de généalogie.

 

(1) Arthur Charpentier, Ewen Gallic. Étude de la démographie française du XIXe siècle à partir de données collaboratives de généalogie. 2018. 〈hal-01724269〉

(2) ibid, page 1

(3) ibid, page 4

(4) ibid, page 8

(5) L. A. Gavrilov and N. S. Et-gavrilova, Étude biodémographique des déterminants familiaux de la longévité humaine, Population (French Edition), vol.56, issue.1/2, pp.225-235, 2001.

(6) J. Chesnais, La Transition démographique : étapes, formes, implications économiques . Travaux et documents -Institut national d’études démographiques, 1986.

(7) Arthur Charpentier, Ewen Gallic. Étude de la démographie française du XIXe siècle à partir de données collaboratives de généalogie. 2018. 〈hal-01724269〉, page 12

Only registered users can comment.

  1. Bonjour,
    Je n’ai jamais considéré Geneanet comme une source relativement fiable de découvertes généalogiques, mais seulement comme un indicateur de pistes de recherches. De ce point de vue, Geneanet me rend le service attendu.
    Mon logiciel de généalogie me permet d’évaluer la fiabilité des sources des événements que j’enregistre pour chaque personnage de ma généalogie: 0 -> info possiblement exacte (source Geneanet par exemple); 1-> source secondaire peu fiable ou supposition basée sur d’autres faits; 2 -> source secondaire fiable (relevés systématiques d’actes, par exemple); 3 -> source originale (EC, RP…). L’intérêf est de parvenir à obtenir la source la plus fiable pour chaque événement que j’enregistre.
    Je m’intéresse à tous les personnages de la famille de mes ascendants. Un événement de la vie d’un frère ou d’une soeur me permet parfois de retrouver la trace d’un mariage ou d’un décès d’un ascendant resté longtemps introuvable.
    Utilisateur de Geneanet depuis sa création, je constate régulièrement la reprise de mes données généalogiques par une foule de collectionneurs d’ancêtres avec lesquels je n’ai jamais échangé aucune information, ni eu aucun contact. Je constate aussi que les erreurs sont si nombreuses qu’il est décourageant d’essayer de les signaler. J’ai renoncé à mettre à jour ma généalogie sur Geneanet.

  2. Bonjour Sophie,

    Nos généalogies sont biaisées. Certes !
    Mais biaisées par rapport à quoi ? Des études démographiques qui, elles-mêmes, comportent leurs propres biais statistiques ? (L’étude Charpentier-Gallic mentionne elle-même les biais dus à la constitution de l’échantillon Généanet).
    Nos généalogies sont dans le meilleur des cas issues de données transcrites par des personnes bénévoles, passionnées qui partagent leurs sources dans la mesure de leur temps disponible, de leur possibilité d’accéder à certaines archives, etc, etc…
    Nos généalogies témoignent de notre méthodologie, de notre approche affective de nos ancêtres, de nos envies d’explorer telle ou telle branche….
    S’il est bon d’encourager les généalogistes à partager plus de données, les plus fiables possible, nos généalogies doivent avant tout rester un enjeu de plaisir.

  3. D’accord avec toi Sophie, cette notion de “plus grand dénominateur commun” me gène. On a tous en tête des arbres sur Geneanet avec des branches très aléatoires et des erreurs répétées à l’envi ! J’ai personnellement un gros doute sur une sosa du 17e siècle et tant que je n’aurais pas trouvé une source fiable, je ne l’intégrerai pas à mon arbre. D’autres n’ont pas eu autant de scrupules et je la vois régulièrement apparaître.
    Ce n’est qu’un cas d’espèce certes mais ça en dit long sur le manque de fiablilité de l’entraide généalogique et je m’étonne que des chercheurs sérieux tirent des conclusions à partir de données souvent aussi fantaisistes.
    Sans parler de la subjectivité de notre pratique qu’évoque Brigitte et que, comme elle, j’assume complètement;

  4. Bonjour,

    Depuis quelques années, je complète systématiquement mes données. J’ai commencé avec ma branche paternelle et je suis très loin d’avoir terminé. Ce n’est pas tout de suite que je pourrais m’attaquer à ma branche maternelle.

    Je note systématiquement les professions, mais aussi les enfants morts-nés lorsque j’en ai connaissance. J’ai ainsi pu découvrir qu’un ancêtre (mon AAAGP) a eu deux filles (décédées très rapidement) dont je ne connaissais pas l’existence, notamment une jumelle d’une autre de ses filles. Curieux que l’information m’est échappée si longtemps. En fait, cette fille était mentionnée uniquement dans les décès et la mémoire familiale n’évoquant qu’une fille, je me suis laissé avoir. Depuis, je regarde aussi dans les décès.

    Concernant le sexisme, je ne suis pas d’accord. Souvent, les filles déménagent en se mariant, leurs traces devenant plus difficile à suivre, sauf en admettant qu’elles reviennent se marier dans leur ville d’origine (et donc nous avons mention du lieu d’habitation). Les femmes sont encore plus difficile à suivre, notamment lorsqu’elles ont des enfants naturels qui naissent dans des lieux parfois éloignés de celui d’origine pour ne pas faire mauvaise presse à la famille. J’ai même la soeur d’un ancêtre, au XIXe siècle qui, arrêté avec son époux – sans doute pour une historie de dettes – a accouchée au sein d’une maison d’arrêt.

    Cordialement,

    Simon.

  5. Bonjour,
    Ces études et les commentaires qui s’y rapportent sont très intéressants mais je crois que vous oubliez une chose importante : nous sommes d’abord des amateurs et nous “perdons” notre temps à ce “loisir” avec beaucoup de plaisir mais il n’a jamais été question que nous devenions à notre insu des employés non rémunérés de quelque institut historique ou entrepreneur généalogiste que ce soit.
    Nos recherches sont ciblées, fragmentaires, et perfectibles.
    Nos publications reflètent nos envies et notre niveau de compétence ; nous pouvons tous apprendre des conseils des autres ; mais nos obligations s’arrêtent là ; libre à chacun d’utiliser ou de trouver de meilleures informations que les autres, en dosant ses efforts à sa convenance.
    Je ne crois pas qu’il faille en attendre plus de nous, et j’irai même plus loin : à trop en faire nous privons nos descendants du plaisir de faire eux mêmes des trouvailles et de sentir l’utilité de se pencher sur leur passé. Est-ce une bonne chose ?

  6. La recherche des collatéraux est importante car elle peut, entre autre, permettre de résoudre des énigmes sur la branche directe. On ne trouve pas le décès d’un ancêtre ? Peut-être a-t-il fini ses jours chez un de ses enfants. Encore faut-il connaître tous les enfants…

  7. Nos généalogies regroupées sont peut être biaisées mais chacune d’entre elles correspond a des choix personnels qui biaisent peut être le regroupement mais pas la généalogie publiée.
    Les critères de mise en ligne et la part de hasard qui reste probablement très importante dans l’identification de toutes les personnes dès qu’il ne s’agit plus des ancêtres directs font que le regroupement systématique revient souvent à “additionner des serviettes et des torchons” (comme disait une ancienne institutrice il y a quelques années).
    Si la diversité fait la difficulté pour une étude historique sérieuse, elle fait aussi la richesse des “généalogies personnelles” (basées sur un de cujus). Il existe trop peu de “généalogies communales” (basées sur un lieu).

  8. Biaisée ?
    Mes recherches généalogiques sont tout simplement subjectives, ce sont les miennes, le reflet de la façon dont je travaille, le reflet de mes compétences en paléographie, en organisation, de mon acquisition d’expérience. Ce n’est en aucun cas une étude historique objective de mes ancêtres, meme de ceux que je retrouve facilement.
    J’avais vu passer l’étude, et j’avais été surprise qu’on travaille sur ce genre de matériel pour faire des analysies historiques …
    Encore une petite remarque, si je devais recommencer ma généalogie aujourd’hui, je changerais certaines petites choses, comme noter toujours avec précision toutes les sources des infomrations que je réunis, mais je ne changerais pas une chose : j’essaierai toujours sur certaines lignées qui m’importent d’aller d’abord le plus loin possible dans le temps, pour redescendre ensuite en prenant mon temps

  9. Bonjour Sophie et bravo pour cet article très intéressant,
    Comme toi, je suis étonné par la mise en évidence d’un biais sexiste et d’un taux de fécondité inférieur à la réalité.
    Tu donnes, je penses, de bonnes explications.
    Comme toi, je remarque de plus en plus d’arbres Geneanet ou Filae de plus en plus et de mieux en mieux complétés.
    Nous sommes sur la bonne voie.
    Laurent

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *


Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.