Estimation indirecte de l'âge : modèles probabilistes et approche statistique Isabelle SÉGUY 1,2 Luc BUCHET 2,1 Henri CAUSSINUS 3, Daniel COURGEAU 1 1.

Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Probabilités et statistiques au lycée
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Localisation fine de QTL par déséquilibre de liaison Simon BOITARD Durée : octobre 2003-septembre 2006 Laboratoire : BIA (biométrie et intelligence artificielle)
Estimation ponctuelle Estimation par intervalle de confiance
Les Variables statistiques continues
Université de Ouagadougou
Collecte de données F. Kohler.
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Optionnel de Statistique appliquée À la lecture critique d’articles
Nombre de sujets nécessaires en recherche clinique
ASSOCIATION entre caractères qualitatifs
Les TESTS STATISTIQUES
Dr DEVILLE Emmanuelle J D V 12/07/2006
Autour d’une expérience aléatoire simple:
Statistique descriptive
variable aléatoire Discrète
AUTOUR DE LA LOI NORMALE
2. Expériences aléatoires et modélisation
Tests de comparaison de moyennes
Les lois des probabilités
Méthodes de Biostatistique
RECONNAISSANCE DE FORMES
Les probabilités ... la valeur d'un hasard est égale à son degré d'improbabilité. Milan Kundera.
1 - Construction d'un abaque Exemple
Thème 6 : l'échantillonnage et l'enquête
Régression linéaire simple
Mathématiques Les statistiques et probabilités en STI2d/STL
Comprendre la variation
Groupe 1: Classes de même intervalle
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Comprendre la variation dans les données: Notions de base
Les probabilités.
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
ÉCHANTILLONNAGE AU FIL DES PROGRAMMES Stage : nouveaux programmes de première Novembre 2011.
Principes de tarification de base
Lectures Volume du cours : Chapitre 7
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
1 - Programme de Seconde (juin 2009) Statistique et probabilités
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
Rappels de statistiques descriptives
Théorème de la limite centrale l’inférence statistique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Test d'hypothèse pour des proportions:
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Intervalles de confiance pour des proportions L’inférence statistique
Probabilités et Statistiques Année 2010/2011
Concepts fondamentaux: statistiques et distributions
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
12/05/2009J.Wirotius (interne)1 Méthode capture - recapture Méthodologie.
1 Gestion des voitures médecins d'Urgences-Santé Michel Gendreau Émilie Frot¹ Gilbert Laporte Frédéric Semet¹ Centre de recherche sur les transports Université.
Échantillonnage (STT-2000)
Échantillonnage (STT-2000)
MODULE FTH 2007 Diversité génétique
Statistique Descriptive Les Paramètres de Tendance Centrale
L2S4M3 Méthode clinique 1 : Examen psychologique et tests CM N°2
ECHANTILLONAGE ET ESTIMATION
Introduction aux statistiques Intervalles de confiance
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Bienvenue au cours MAT-350 Probabilités et statistiques.
STATISTIQUE DESCRIPTIVE
Transcription de la présentation:

Estimation indirecte de l'âge : modèles probabilistes et approche statistique Isabelle SÉGUY 1,2 Luc BUCHET 2,1 Henri CAUSSINUS 3, Daniel COURGEAU 1 1 Institut National dÉtudes Démographiques ; 2 CEPAM-UMR 7264, CNRS-Université de Nice-Sophia-Antipolis 3 Université Paul Sabatier, Toulouse Toute estimation indirecte de lâge requiert un modèle reliant lobjet à estimer (lâge calendaire) aux données disponibles (lindicateur biologique dâge). Aucune liaison déterministe ne peut être espérée : le modèle est donc probabiliste et lestimation relève de la statistique. XXVIIe Congrès international de la population de lUIESP, Busan, Corée du sud, août 2013 Dans le cadre dun groupe de travail pluridisciplinaire « Mesures de lâge sans état civil », soutenu par la Fondation du Campus Condorcet, nous avons examiné lextension de ces méthodes à des problèmes ressortissant à des domaines différents mais se présentant formellement de façon similaire (seule la loi a priori des p j demande à être repensée). Ainsi, en médecine légale, un expert est appelé à estimer un âge calendaire j en fonction dobservations anatomiques i, sur un sujet décédé ou sur un individu vivant dont lâge est inconnu (Chariot, 2010). La méthode est aussi applicable en démographie quand il sagit de réaffecter un âge civil à des personnes dont la déclaration dâge est soumise à des variations opportunistes. Applications en médecine légale et en sciences sociales A partir des données de référence (tableau 2), une condition dinvariance biologique assurant la permanence de la distribution de lindicateur biologique à âge calendaire donné, permet destimer les probabilités p i/j par les fréquences n ij /n.j. Tableau 2. Distribution observée du couple « âge – indicateur biologique » dans un échantillon de référence. Ces probabilités satisfont les relations (1) et (2) Quantile5%10 %25 %50 %75 %90%95 % Probabilité dâge 50 ans Probabilité dâge < 30 ans Les calculs confirment donc, avec un degré de vraisemblance évaluable, quil sagit bien dhommes ayant atteint lâge adulte malgré une vie très active, voire dangereuse, comme en témoignent les observations paléopathologiques. Application en archéologique funéraire et en paléopathologie Pour évaluer lâge calendaire de ces individus connaissant le stade dâge biologique atteint i = 3, il faut les considérer comme issus de la même population que celle de la nécropole, dont on a préalablement estimé la structure par âges par la procédure dinférence bayésienne. (cf. communication en session 292) Lestimation ponctuelle de la probabilité que lâge soit supérieur ou égal à 50 ans est Lestimation ponctuelle de la probabilité que lâge inférieur à 30 ans est La précision de ces estimations est fournie par les densités de la figure 2 et numériquement par quelques quantiles (tableau 3). Tableau 3. Quelques quantiles correspondant aux densités de la figure 2 - On voit que la probabilité de la première classe dâge est estimée avec une précision assez faible (entre 0.60 et 0.75 avec la probabilité ½), mais elle na que 5 chances sur 100 dêtre inférieure à ( 1/2) et 25 chances sur 100 dêtre inférieure à La seconde probabilité, très faible, est estimée avec une précision élevée autour de sa médiane Elle na que 5 chances sur 100 dêtre supérieure à et 25 sur 100 dêtre supérieure à Deux homme ont été inhumés, non pas dans la nécropole de Frénouville (France), mais non loin, à proximité dun gué (Bellengreville). Leur morphologie très robuste les distingue des habitants gallo-romains de Frénouville, et les séquelles darthrose observées suggèrent des individus plutôt âgés, tandis que le stade biologique atteint (3) les désignerait comme matures. Sagit-il dindividus de plus 50 ans comme le suggère létat de leurs ossements, ou de jeunes adultes fortement atteints ? Age supérieur à 50 ans sachant le stade: 3 Age inférieur à 30 ans sachant le stade: 3 Figure 2. Distribution (densité) des probabilités conditionnelles considérées, avec (en rouge) les quantiles à 5, 50 et 95%. Probabilités dun âge supérieur ou égal à 50 ans (gauche) et dun âge inférieur à 30 ans (droite) pour un individu de stade 3 Références : CHARIOT Patrick. Quand les médecins se font juges: la détermination de l'âge des adolescents migrants. Chimères, 2010, no 3, p CAUSSINUS Henri, and COURGEAU Daniel. Estimating age without measuring it: A new method in paleodemography. Population (english edition), 2010, vol. 65, no 1, p SÉGUY Isabelle, CAUSSINUS Henri, COURGEAU Daniel, BUCHET Luc. Estimating the age structure of a buried adult population: a new statistical approach applied to archaeological digs in France. American Journal of Physical anthropology, 150, 2013, p. 170–18 SÉGUY Isabelle, BUCHET Luc. With the contributions of Henri Caussinus and Daniel Courgeau.Handbook of Paleodemography. Springer Series: INED Population Studies, Vol. 2. (Original French edition published by the INED, Paris, 2011). 2014, V, 220 p. (Caussinus, Courgeau, 2010 ; Séguy, Caussinus, Courgeau, Buchet, 2013 ; communication en session 292) Comment estimer lâge calendaire j dun individu isolé sachant le stade dâge biologique atteint i, cest-à-dire comment estimer les probabilités p j/i pour un i, donné et j =1,…c. La formule ( 2 ) fournit une estimation ponctuelle de p j/i. Mais cest insuffisant, il faut indiquer la marge dincertitude de lestimation ponctuelle par sa loi de probabilité. Avec la loi de probabilité des p i/j tirée des données de référence et la loi de probabilité des p j obtenue ci-dessus, on tire au hasard un échantillon de p i/j (pour le stade i considéré et pour j =1,…,c) et un échantillon de p j (j=1,…,c) ; la formule ( 2 ) fournit alors un échantillon de p j/i simulant sa loi de probabilité. Deux types de questions se posent La loi de probabilité conjointe de lâge biologique dun sujet (défini par un stade i, allant de 1 à r) et de son âge calendaire (défini par une classe dâge j, allant de 1 à c) est exprimée dans le tableau 1, avec les notations : i : probabilité que le stade dâge biologique soit i et p j : probabilité que lâge calendaire soit j p j/i : probabilité quun individu soit dâge calendaire j, sachant que son stade dâge biologique est i p i/j : probabilité quun individu ait atteint le stade dâge biologique i, sachant que son âge calendaire est j p ij : probabilité que le stade dâge biologique soit i et lâge calendaire j Formalisation du problème Tableau 1. Loi de probabilité du couple « âge – indicateur biologique ». Comment estimer la structure par âges dune population, cest-à-dire les probabilités p j (j=1,…c) ? Une estimation des probabilités i est tirée des observations anthropologiques du site étudié, qui fournissent les nombres (m 1,…, m i, …, m r ) dindividus dans les différents stades biologiques, sur un échantillon total de m individus. La formule ( 1 ) et lutilisation convenable de cette information et de celle apportée par les données de référence permettent lestimation des p j. En pratique, nous avons proposé une méthode bayésienne qui part dune loi a priori convenable des p i/j et des p j et fournit la réponse sous forme de lois a posteriori. La loi a posteriori de chaque p j donne non seulement une estimation ponctuelle de ce paramètre (par sa moyenne), mais encore une information sur la précision de cette estimation Cette précision peut être illustrée par des intervalles de crédibilité permettant par exemple de comparer plusieurs sites entre eux (figure 1 avec probabilités de survie) Figure 1. Frénouville, IVe siècle ap JC (à gauche) et VIe-VIIe siècles (a droite): Intervalles de crédibilité pour les probabilités de survie (à 90% en vert, à 50% en rouge),