Comment répondre à la question "Quelles sont mes origines ?"

En commençant ma généalogie, je me suis vite aperçu que mes ancêtres paternels venaient essentiellement du poitou alors que je nous croyais nantais avant tout ! En remontant dans les générations, des ancêtres d'autres régions apparaissent, déclenchant chez moi un nouvel intérêt pour ces lieux qui m'étaient auparavent indifférents. C'est ainsi que j'ai commencé à me poser la question de mes origines géographiques. D'où viennent mes ancêtres et comment quantifier la part de chaque lieu dans mon identité ? Bien sûr, l'identité est avant tout une construction psychologique et sociale, mais la généalogie et la découverte de la provenance géographique de ses ancêtres procède justement de cette construction. Par exemple, me découvrant un ancêtre de Seine-Maritime, je me sens maintenant un peu normand !

D'autres se sont penchés sur la question, comme Rémi Costantino sur ingénéalogie qui présente une réflexion profonde sur le sujet en deux parties (partie I, partie 2). Cependant, Je trouve la méthode beaucoup trop complexe et ne répondant pas complètement à ma définition des origines.

Beaucoup se pose la question de savoir si c'est le lieu de naissance ou le lieu où la personne à le plus vécue qu'il faut prendre en compte. Je pense que cette question perd de sa pertinance quand on constate que rare sont nos ancêtres à être nés à un endroit et à avoir vécu à un autre très éloigné (les grandes migrations sont rares avant la fin du XIXe siècle). Et quand bien même, les parents de cet ancêtre ont toutes les chances d'être nés et d'avoir vécu au lieu de naissance de leur enfant. Ainsi même s'il n'a pas vécu à un endroit, il en a surement l'identité. Par exemple, ma femme, née en Auvergne, est fille de réfugiés espagnols et se sens autant auvergnate qu'espagnole !
Je propose donc de définir les origines géographiques d'une personne comme une somme pondérée des lieux de naissance des individus de son arbre d'ascendance, la personne considérée inclue. Cette pondération tient compte de la génération de l'individu (plus la génération est ancienne, moins elle pèse dans la somme) et du nombre d'individus dans la génération.

Tentons de modéliser mathématiquement le problème. Commençons par poser les définitions suivantes :

  • G n , la génération de rang n , n [0, N ] ( G 0 étant la personne considérée et N étant le rang de la génération la plus ancienne)
  • W n , le coefficient de pondération lié à la génération de rang n , n 0
  • ω i(n) l , le coefficient de pondération lié à l'individu i, né dans le lieu l de la génération de rang n , i(n) [1, 2 n]
  • P l , le poids du lieu l dans les origines géographiques de la personne représentée par la génération G 0

Le poids P l du lieu l dans les origines géographiques de la personne représentée par la génération G 0 est le poids que l'on cherche à calculer pour chaque lieu de naissance des individus de l'arbre :

P l = n=0 N W n i=1 2n ω i(n) l

De manière évidente le coefficient de pondération lié à un individu est identique à tous les individus d'une génération donnée, et nous donne ω i(n) l = 1 2 n

Comment choisir W n ? Autrement dit, pour combien contribue la génération de rang n dans le calcul de P l ? Une première approche est de se dire que le poids d'une génération décroit de manière linéaire de 1 quand n = 0 à 0 quand n = M + 1 , à savoir 1 - n N+1 . Afin de normaliser le résultat, il convient d'avoir une somme de tous les individus sur toutes les générations égale à 1 , permettant ainsi la comparaison entre personnes. Or, n=0 N+1 1 - n N+1 = N + 2 2 . Par conséquent :

Wn = 1 - n N + 1 N + 2 2 = 2 N + 1 - n N + 1 N + 2

Le problème avec cette approche linéaire est que le poids d'une génération dépend du nombre de générations prises en compte N. La comparaison entre deux individus ne peut donc se faire qu'au même niveau de génération, sans quoi cela ne veut plus rien dire. Ensuite, à mon avis, cette fonction linéaire ne donne pas assez de poids aux premières générations qui ont vraiment un sens pour nous (lieu de naissance de nos parents et grands parents, voire arrières grands parents) par rapport aux générations précédentes.

C'est pourquoi, je propose d'utiliser une suite géométrique convergeante de raison 1 q qui permet à la fois de donner plus de poids aux premières générations et de normaliser le résultat quelque soit le nombre de générations puisque l'on somme sur un nombre infini de génération ( N= ). De plus, la part de lieux d'origine inconnue est prise en compte ! Comme n=0 1 q n = q q - 1 , on obtient :

Wn = 1 q n q q - 1 = q - 1 qn

Il reste alors à déterminer une valeur pour q. Je propose de la calculer telle que les 4 premières générations compte pour 75% de la totalité, à savoir :

n=0 3 1 q n n=0 1 q n = 0,75

Ce qui donne :

q = 1,414213563

Yapuka écrire un petit programme pour faire ça et produire des cartes et graphiques pour illustrer sa généalogie !

La discussion continue ailleurs

URL de rétrolien : https://www.jourand.net/trackback/58

Fil des commentaires de ce billet