La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Léchantillonnage Jean-Sébastien Pierre UMR 6553 20/01/2009.

Présentations similaires


Présentation au sujet: "Léchantillonnage Jean-Sébastien Pierre UMR 6553 20/01/2009."— Transcription de la présentation:

1 Léchantillonnage Jean-Sébastien Pierre UMR /01/2009

2 Plan 1. Introduction 1. Introduction 2. Léchantillonnage aléatoire 2. Léchantillonnage aléatoire Simple Simple Séquentiel en deux étapes Séquentiel en deux étapes 3. Léchantillonnage stratifié 3. Léchantillonnage stratifié Mise en œuvre et analyse Mise en œuvre et analyse Optimisation Optimisation 4. Léchantillonnage en grappes 4. Léchantillonnage en grappes Mise en œuvre et analyse Mise en œuvre et analyse Optimisation Optimisation

3 Introduction « Pas de modèle sans échantillon, pas déchantillon sans modèle » Un professionnel du prêt-à-porter « Les tissus, disponibles en quantité limitée, ne peuvent être ni repris ni échangés. Par contre vous pouvez obtenir un échantillon de chacun des tissus pour un prix modique. » La boutique A&A,

4 Le dictionnaire Robert 1. Vx Étalon de mesure. (1636) Mod. Type réglementaire de certains matériaux de construction. Bois d'échantillon. Brique, pavé d'échantillon. Mar. Bâtiment de fort, de petit, de faible échantillon, suivant la largeur et l'épaisseur des pièces de construction. 1. Vx Étalon de mesure. (1636) Mod. Type réglementaire de certains matériaux de construction. Bois d'échantillon. Brique, pavé d'échantillon. Mar. Bâtiment de fort, de petit, de faible échantillon, suivant la largeur et l'épaisseur des pièces de construction. 2. (1407) Cour. Petite quantité d'une marchandise qu'on montre pour donner une idée de l'ensemble. Les échantillons d'une gamme de produits. Échantillons de vin, de café. Un cahier d'échantillons (d'étoffe). Une palette d'échantillons (de peinture). Boîte, jeux d'échantillons à usage commercial. Þ collection, présentoir. « Il étale ses échantillons, lentement, devant le client » (Maurois). « Quel danger, quelle folie de choisir sur des échantillons » (Sarraute). 2. (1407) Cour. Petite quantité d'une marchandise qu'on montre pour donner une idée de l'ensemble. Les échantillons d'une gamme de produits. Échantillons de vin, de café. Un cahier d'échantillons (d'étoffe). Une palette d'échantillons (de peinture). Boîte, jeux d'échantillons à usage commercial. Þ collection, présentoir. « Il étale ses échantillons, lentement, devant le client » (Maurois). « Quel danger, quelle folie de choisir sur des échantillons » (Sarraute). Spécimen remarquable d'une espèce, d'un genre. Þ représentant. « Une très jolie servante, charmant échantillon de la beauté des femmes de Malaga » (Gautier). Spécimen remarquable d'une espèce, d'un genre. Þ représentant. « Une très jolie servante, charmant échantillon de la beauté des femmes de Malaga » (Gautier). Fig. Aperçu. « Je voulus lui donner un échantillon de mon talent » (Rousseau). Þ exemple. Fig. Aperçu. « Je voulus lui donner un échantillon de mon talent » (Rousseau). Þ exemple. 3. Spécialt (Statist.) Fraction d'une population destinée à être étudiée par sondage. panel. 3. Spécialt (Statist.) Fraction d'une population destinée à être étudiée par sondage. panel. 4. Inform. Élément d'une suite discrète résultant de l'échantillonnage d'une grandeur analogique. 4. Inform. Élément d'une suite discrète résultant de l'échantillonnage d'une grandeur analogique.

5 Pourquoi échantillonner ? Impossibilité daccéder Impossibilité daccéder À tous les individus dune population À tous les individus dune population À la totalité dune aire À la totalité dune aire => On procède donc par inférence => On procède donc par inférence Echantillonnage Echantillonnage Sondage Sondage

6 Deux grandes stratégies Aléatoire Aléatoire Simple Simple Stratifié Stratifié En grappe ou par degrés En grappe ou par degrés Systématique Systématique Transects et grilles Transects et grilles Décimation/quantisation Décimation/quantisation Échantillonnage temporel Échantillonnage temporel

7 Limites du cours On se limitera à léchantillonnage aléatoire On se limitera à léchantillonnage aléatoire Les problèmes de léchantillonnage systématique seront abordés dans dautes UE à propos de Les problèmes de léchantillonnage systématique seront abordés dans dautes UE à propos de La statistique spatiale La statistique spatiale Lanalyse des séries chronologiques Lanalyse des séries chronologiques

8 2. Léchantillonnage aléatoire Simple Séquentiel en deux étapes

9 Echantillonnage aléatoire simple Définition Définition Les individus de la population sont tous équivalents Les individus de la population sont tous équivalents Le nombre dindividus à échantillonner est déterminé à lavance Le nombre dindividus à échantillonner est déterminé à lavance Chaque individu de la population a la même probabilité a priori dêtre choisi Chaque individu de la population a la même probabilité a priori dêtre choisi Le choix dun individu ne favorise ni ne défavorise le choix ultérieur daucun autre individu de la population (tirages indépendants) Le choix dun individu ne favorise ni ne défavorise le choix ultérieur daucun autre individu de la population (tirages indépendants)

10 Les individus ou unités déchantillonnage Naturels Naturels Animaux, plantes individualisées Animaux, plantes individualisées Arbitraires Arbitraires Unités de surface, de volume, de poids Unités de surface, de volume, de poids 0.25 m 2 de prairie 0.25 m 2 de prairie 1dm 3 deau dans un étang 1dm 3 deau dans un étang 1k de sol 1k de sol Attention alors ! Attention alors ! Population biologique Population biologique Population statistique Population statistique

11 Deux mode de tirage Avec remise Avec remise Ou non exhaustif Ou non exhaustif La probabilité de sélection reste constante au cours de léchantillonnage La probabilité de sélection reste constante au cours de léchantillonnage Sans remise Sans remise Ou exhaustif Ou exhaustif La probabilité de sélection saccroît au cours de léchantillonnage La probabilité de sélection saccroît au cours de léchantillonnage

12 Une approximation Dans les très grandes populations, on considère souvent léchantillonnage comme avec remise, même lorsquil ny a pas remise Dans les très grandes populations, on considère souvent léchantillonnage comme avec remise, même lorsquil ny a pas remise Dans les populations plus petites, il y aura lieu de prendre en compte le taux de sondage f = n/N Dans les populations plus petites, il y aura lieu de prendre en compte le taux de sondage f = n/N

13 Le modèle statistique

14 Les paramètres de léchantillon Moyenne de léchantillon : Moyenne de léchantillon : Variance de léchantillon : Variance de léchantillon :

15 Paramètres et estimateurs La moyenne est un estimateur sans biais de la moyenne de la population La moyenne est un estimateur sans biais de la moyenne de la population La variance s 2 est un estimateur biaisé par défaut (mais asymptotiquement sans biais) de la variance de la population La variance s 2 est un estimateur biaisé par défaut (mais asymptotiquement sans biais) de la variance de la population

16 Voir annexe polycopiée

17 Le biais

18

19 La précision déchantillonnage Quelle connaissance avons nous de la moyenne de la population ?

20 Les mesures de précision La variance La variance Incommode (exprimée dans le carré des unités) Incommode (exprimée dans le carré des unités) Lerreur standard Lerreur standard Utilisée par les anglo-saxons Utilisée par les anglo-saxons Le coefficient de variation Le coefficient de variation Utilisé par les agronomes Utilisé par les agronomes Le ½ intervalle de confiance Le ½ intervalle de confiance Cest un véritable encadrement Cest un véritable encadrement

21 La précision est Proportionnelle à lécart-type de la moyenne (en général de lestimateur) ou erreur standard sur la moyenne Proportionnelle à lécart-type de la moyenne (en général de lestimateur) ou erreur standard sur la moyenne Comment la calcule-t-on ? Comment la calcule-t-on ? Population infinie Population infinie Ou tirage avec remise Ou tirage avec remise Population finie Population finie Et tirage sans remise Et tirage sans remise

22 estimateurs Population infinie Population infinie Ou tirage non exhaustif Ou tirage non exhaustif Population finie Population finie Et tirage exhaustif Et tirage exhaustif

23 Le demi intervalle de confiance On sait « encadrer » la moyenne avec une probabilité derreur définie par lintervalle de confiance (voir annexe) On sait « encadrer » la moyenne avec une probabilité derreur définie par lintervalle de confiance (voir annexe) Ou, si n < 30 Ou, si n < 30

24 Précision absolue et relative La quantité : La quantité : Ou, pour n>30 Ou, pour n>30 Sera utilisée comme « précision absolue » La quantité Sera utilisée comme « précision absolue » La quantité Sera nommée : « précision relative Sera nommée : « précision relative

25 Un exemple La taille du parasitoïde leptomastix dactylopii

26 Lanimal

27 Léchantillon On a prélevé au hasard 50 individus femelles à partir de cochenilles du manioc provenant dun champ du congo (données André Biassangama) On a prélevé au hasard 50 individus femelles à partir de cochenilles du manioc provenant dun champ du congo (données André Biassangama) > print(biassang) numer tail long fec strate numer tail long fec strate …………………………………………………………………………

28 Exemple : taille de leptomastix > attach(biassang)# définition du jeu de données > sd sd<-sqrt(var(tail)/n)# calcul de lerreur standard > qnorm( )# calcul de z (alpha/2) [1] > d d<-sd*qnorm( )# précision absolue > d [1] > mean(tail)# taille moyenne (mm) [1] > mean(tail)-d# borne inférieure [1] > mean(tail)+d# borne supérieure [1]

29 Encadrement de la moyenne : La taille moyenne de la population d de la population des femelles du parasitoïde Leptomastix dactylopii est estimée à 1.78 mm La taille moyenne de la population d de la population des femelles du parasitoïde Leptomastix dactylopii est estimée à 1.78 mm On peut affirmer – avec 5% des chances de se tromper – quelle est comprise entre 1.63 et 1.93 mm On peut affirmer – avec 5% des chances de se tromper – quelle est comprise entre 1.63 et 1.93 mm

30 La précision absolue et relative La moyenne est connue à plus ou moins 0.15 mm près La moyenne est connue à plus ou moins 0.15 mm près Cest à dire à 8.3% près Cest à dire à 8.3% près > d/(mean(tail))*100 [1]

31 Contrôler la précision déchantillonnage La base du travail pratique

32 Comment évolue la précision ?

33 Le gain marginal de précision La dérivée de la précision relative donne le gain marginal par unité supplémentaire déchantillonnage. La dérivée de la précision relative donne le gain marginal par unité supplémentaire déchantillonnage.

34 Calculer leffectif nécessaire 1. Définir lobjectif à atteindre 1. Définir lobjectif à atteindre Le risque accepté (le plus souvent 0.05) Le risque accepté (le plus souvent 0.05) La précision absolue ou relative désirée La précision absolue ou relative désirée 2. Déterminer la variance de la population 2. Déterminer la variance de la population On a souvent besoin dun pré-échantillonnage On a souvent besoin dun pré-échantillonnage 3. Déterminer n 3. Déterminer n

35 Un paradoxe ! « Pour faire un bon échantillonnage faites en dabord un mauvais » (J.S. Pierre, pensées)

36 La détermination de n De la définition de la précision De la définition de la précision On déduit : On déduit :

37 Et si on parlait argent ? On définit : On définit : Leffort déchantillonnage : cest n Leffort déchantillonnage : cest n Le coût de prise en charge de léchantillonnage C o Le coût de prise en charge de léchantillonnage C o Fabrication des cadres, pièges, coût du trajet, affrètement dun bateau, etc… Fabrication des cadres, pièges, coût du trajet, affrètement dun bateau, etc… Le coût unitaire de prélèvement dun individu c Le coût unitaire de prélèvement dun individu c Mesuré en temps de travail, en euros, en litres de fuel (chalutier) etc… Mesuré en temps de travail, en euros, en litres de fuel (chalutier) etc… Le coût total de léchantillonnage : Le coût total de léchantillonnage :

38 Optimisation Stratégies de type « minimax » Stratégies de type « minimax » Maximiser linformation (minimiser la précision) Maximiser linformation (minimiser la précision) En minimisant, ou au moins en maîtrisant les coûts En minimisant, ou au moins en maîtrisant les coûts Pas de solution universelle Pas de solution universelle

39 Exemple La taille moyenne de la population de Leptomastix est connue à 8.3% près avec un échantillon de 50 femelles La taille moyenne de la population de Leptomastix est connue à 8.3% près avec un échantillon de 50 femelles Quel échantillon est nécessaire pour atteindre une précision de 5% sur cette moyenne ? Quel échantillon est nécessaire pour atteindre une précision de 5% sur cette moyenne ?

40 Solution Ecrivons la formule de la précision relative Ecrivons la formule de la précision relative On cherche à résoudre linégalité : On cherche à résoudre linégalité : Donc : Donc :

41 Numériquement : On prendra n=137 On prendra n=137 Commenter Commenter

42 Léchantillonnage séquentiel en deux étapes Doit-on refaire un échantillon de 137 individus ?

43 Non ! Il est licite de compléter léchantillon de 50 individus à 137 Il est licite de compléter léchantillon de 50 individus à 137 Cest à dire daller prélever aux hasard = 87 nouveaux individus Cest à dire daller prélever aux hasard = 87 nouveaux individus Cette procédure sappelle : « échantillonnage séquentiel en deux étapes » Cette procédure sappelle : « échantillonnage séquentiel en deux étapes »

44 Ouverture Un échantillonnage est dit séquentiel sil est conduit par étapes jusquà un critère darrêt. Un échantillonnage est dit séquentiel sil est conduit par étapes jusquà un critère darrêt. Léchantillon est alors dit informatif il renseigne au fur et à mesure sur la précision atteinte ou sur dautres critères darrêt Léchantillon est alors dit informatif il renseigne au fur et à mesure sur la précision atteinte ou sur dautres critères darrêt Deux types principaux : Deux types principaux : Echantillonnage séquentiel à précision fixée Echantillonnage séquentiel à précision fixée Echantillonnage décisionnel Echantillonnage décisionnel Voir par exemple le livre de Frontier : stratégies déchantillonnage en écologie Voir par exemple le livre de Frontier : stratégies déchantillonnage en écologie

45 3. Léchantillonnage stratifié Du bon usage des strates

46 Que faire si la variance des individus est élevée ? Lobtention dune bonne précision est alors extrêmement coûteuse Lobtention dune bonne précision est alors extrêmement coûteuse Mais la population est peut-être très hétérogène ? Mais la population est peut-être très hétérogène ? On peut alors la diviser en sous populations plus homogènes On peut alors la diviser en sous populations plus homogènes On gagne alors beaucoup de précision On gagne alors beaucoup de précision

47 Mise en oeuvre Le modèle statistique change

48 Une nouvelle vision de la population Et des paramètres Et des paramètres S1 S2S3

49 Définition des strates Les strates forment une partition de la population Les strates forment une partition de la population Cest à dire que leurs intersections sont deux à deux vides (elles sont disjointes) Cest à dire que leurs intersections sont deux à deux vides (elles sont disjointes) Leur réunion est la population totale Leur réunion est la population totale

50 Hypothèse : Les variances « intra » sont inférieures à la variance totale Les variances « intra » sont inférieures à la variance totale

51 Les poids des strates A chaque strate est affectée un poids : la proportion de la population totale quelle représente A chaque strate est affectée un poids : la proportion de la population totale quelle représente w 1,w 2,w 3, en général w i w 1,w 2,w 3, en général w i

52 Léchantillon stratifié On tire un échantillon aléatoire simple de taille n i dans la strate i. On tire un échantillon aléatoire simple de taille n i dans la strate i. Léchantillon complet est de taille n Léchantillon complet est de taille n On appelle allocation le poids de la strate i dans léchantillon On appelle allocation le poids de la strate i dans léchantillon Si le poids de la strate dans léchantillon est égal au poids de la strate dans la population on dit que lallocation est proportionnelle Si le poids de la strate dans léchantillon est égal au poids de la strate dans la population on dit que lallocation est proportionnelle

53 Lestimateur stratifié On nomme x ij la valeur mesurée sur le j ième individu de la strate i On nomme x ij la valeur mesurée sur le j ième individu de la strate i On note x i. la moyenne du sous- échantillon de la strate i On note x i. la moyenne du sous- échantillon de la strate i On a le choix entre deux estimateurs de la moyenne de la population : On a le choix entre deux estimateurs de la moyenne de la population :

54 Comparaison. a) biais Le premier estimateur est biaisé, sauf si lallocation est proportionnelle Le premier estimateur est biaisé, sauf si lallocation est proportionnelle Le second est sans biais à partir du moment où le poids des strates dans la population est connu sans erreur Le second est sans biais à partir du moment où le poids des strates dans la population est connu sans erreur

55 Comparaison. b) variance, précision Le second estimateur est de variance inférieure au premier Le second estimateur est de variance inférieure au premier

56 Optimisation On va optimiser lallocation sous une contrainte de coût

57 Fonction de coût Coût de prise en charge + coût de prélèvement des unités de chaque strate : Coût de prise en charge + coût de prélèvement des unités de chaque strate :

58 Le problème Minimiser la variance de lestimateur Minimiser la variance de lestimateur Par rapport aux n i Par rapport aux n i Sous la contrainte Sous la contrainte Problème de minimisation sous contrainte Problème de minimisation sous contrainte

59 Technique du Lagrangien Ou du multiplicateur de Lagrange Ou du multiplicateur de Lagrange Voir annexe 2 Voir annexe 2 On trouve : On trouve :

60 Intervalle de confiance et précision Lestimateur stratifié de la moyenne est distribué comme un t à n-m degrés de liberté Lestimateur stratifié de la moyenne est distribué comme un t à n-m degrés de liberté Doù lintervalle de confiance : Doù lintervalle de confiance : Et la précision Et la précision

61 Application à Leptomastix La strate 1 représente 70% des hôtes dans la nature, la strate 2 30% La strate 1 représente 70% des hôtes dans la nature, la strate 2 30% Corriger lestimation de la moyenne de la population Corriger lestimation de la moyenne de la population Estimer son intervalle de confiance et sa précision Estimer son intervalle de confiance et sa précision Lallocation est-elle optimale ? Lallocation est-elle optimale ?

62 Intérêt des strates Comment juger de lintérêt de la stratification ? Comment juger de lintérêt de la stratification ? Par analyse de variance Par analyse de variance Une technique qui permet de comparer la variance inter-strate avec la variance intra- strate Une technique qui permet de comparer la variance inter-strate avec la variance intra- strate Plus le F est grand, plus la stratification est intéressante Plus le F est grand, plus la stratification est intéressante A linverse, si F est non significatif, la stratification est dépourvue dintérêt A linverse, si F est non significatif, la stratification est dépourvue dintérêt

63 Exemple Taille de Leptomastix Taille de Leptomastix > attach(biassang) > anova(lm(tail~strate),test="F") Analysis of Variance Table Response: tail Df Sum Sq Mean Sq F value Pr(>F) Df Sum Sq Mean Sq F value Pr(>F) strate e-11 *** Residuals Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

64 Contrôle graphique

65 4. Léchantillonnage en grappes Ou échantillonnage du premier degré (échantillonnage par degrés)

66 Définition La population peut être subdivisé en unités primaires ou grappes La population peut être subdivisé en unités primaires ou grappes Chaque grappe contient un certain nombre dindividus ou grains Chaque grappe contient un certain nombre dindividus ou grains Le tirage au hasard seffectue en deux phases Le tirage au hasard seffectue en deux phases Choix de m grappes Choix de m grappes Choix de n grains par grappe Choix de n grains par grappe Analogie : strates très nombreuses, on ne peut les sonder toutes Analogie : strates très nombreuses, on ne peut les sonder toutes

67 Image de la population et du tirage Grappe sondée Grappe non sondée Grain sondé Grain non sondé

68 Un schéma hiérarchique Population Grappes Grains

69 A est une variable aléatoire attachée à la grappe, despérance nulle et de variance (variance intergrappes) A est une variable aléatoire attachée à la grappe, despérance nulle et de variance (variance intergrappes) est une variable aléatoire attachée à chaque grain, despérance nulle et de variance (variance résiduelle ou intra grappe) est une variable aléatoire attachée à chaque grain, despérance nulle et de variance (variance résiduelle ou intra grappe) Par ailleurs, les Ai et ij sont indépendants Par ailleurs, les Ai et ij sont indépendants 2.1. Modèle statistique

70 2.2. Estimateurs On se limitera au cas simple où les grappes sont deffectifs égaux, et où on tire un nombre constant de grains par grappe. Dans ces conditions la moyenne générale de léchantillon : On se limitera au cas simple où les grappes sont deffectifs égaux, et où on tire un nombre constant de grains par grappe. Dans ces conditions la moyenne générale de léchantillon : est un estimateur sans biais de µ est un estimateur sans biais de µ

71 Démonstration : Il suffit dappliquer le modèle : Il suffit dappliquer le modèle :

72 Sa variance Dépend à la fois de et de Dépend à la fois de et de

73 Finalement Léchantillonnage du premier degré est dautant moins précis que les grappes sont plus différentes les unes des autres. Sans considérations de coût, si le produit n.m est fixé, la précision est optimale pour n=1 (un seul grain par grappe). On voit bien les limites de cette stratégie : il est alors impossible destimer Léchantillonnage du premier degré est dautant moins précis que les grappes sont plus différentes les unes des autres. Sans considérations de coût, si le produit n.m est fixé, la précision est optimale pour n=1 (un seul grain par grappe). On voit bien les limites de cette stratégie : il est alors impossible destimer

74 Grappes et analyse de variance Modèle danalyse de variance aléatoire Modèle danalyse de variance aléatoire Un F important signifie que les grappes sont très différentes entre elles, relativement homogènes au niveau intra Un F important signifie que les grappes sont très différentes entre elles, relativement homogènes au niveau intra Incite à faire porter leffort sur les grappes plutôt que sur les grains Incite à faire porter leffort sur les grappes plutôt que sur les grains Estimation des composantes de la variance Estimation des composantes de la variance

75 Analyse de variance SourceSCEdlCMF Totalnm-1 SCE T /(nm-1) Inter (B) m-1 SCE B /(m-1) CM B /CM W Intra (W) nm-m SCE W /(nm-m)

76 Optimisation

77 Le problème doptimisation Minimiser la variance de la moyenne Minimiser la variance de la moyenne En déterminant à lavance le coût total de lopération En déterminant à lavance le coût total de lopération Combien de grappes ? Combien de grappes ? Combien de grains par grappe ? Combien de grains par grappe ? Il faut déterminer Il faut déterminer Le coût de prise en charge dune grappe Le coût de prise en charge dune grappe Le coût de prélèvement dun grain Le coût de prélèvement dun grain

78 On forme le lagrangien Sous la fonction de coût : Sous la fonction de coût :

79 Dérivation par rapport à n et m

80 Et finalement : Evidemment, on en déduit m à partir de la fonction de coût Evidemment, on en déduit m à partir de la fonction de coût Grappe chère Grain cher Grains variables Grappes variables + de grains/grappe + de grappes + de grains/grappe + de grappes

81 Bilan On ne fait pas un échantillonnage en grappes pour gagner de la précision On ne fait pas un échantillonnage en grappes pour gagner de la précision En général, au contraire, on en perd par rapport à léchantillonnage aléatoire simple En général, au contraire, on en perd par rapport à léchantillonnage aléatoire simple On ladopte pour sa commodité et son faible coût On ladopte pour sa commodité et son faible coût Noubliez pas de loptimiser dès que vous avez de linformation sur les deux composantes de la variance ! Noubliez pas de loptimiser dès que vous avez de linformation sur les deux composantes de la variance !

82 5. Autres plans déchantillonnage Echantillonnage par degrés, échantillonnage en différentes occasions, échantillonnage par régression

83 Echantillonnage par degrés Généralisation de léchantillonnage en grappes Généralisation de léchantillonnage en grappes Echantillonnage en grappe = échantillonnage du premier degré Echantillonnage en grappe = échantillonnage du premier degré Echantillonnage du second degré : Echantillonnage du second degré : On tire au hasard des unités primaires On tire au hasard des unités primaires Dans chaque unité primaire on tire au hasard des unités secondaires Dans chaque unité primaire on tire au hasard des unités secondaires Dans chaque unité secondaire des unités tertiaires (grains) Dans chaque unité secondaire des unités tertiaires (grains) En anglais : cluster sampling En anglais : cluster sampling

84 Exemple Etude de la croissance des brochets au Canada : Etude de la croissance des brochets au Canada : Unités primaires = lacs Unités primaires = lacs Unités secondaires = barques Unités secondaires = barques Unités tertiaires = brochets (grains) Unités tertiaires = brochets (grains) Analyse : Analyse : Analyse de variance hiérarchisée (nested) Analyse de variance hiérarchisée (nested) Estimation des composantes de la variance Estimation des composantes de la variance Ici : trois composantes Ici : trois composantes Entre lacs Entre lacs Entre barques Entre barques Entre brochets (résiduelle) Entre brochets (résiduelle)

85 Echantillonnage à différentes occasions On tire au hasard un certain nombre dindividus dans une population On tire au hasard un certain nombre dindividus dans une population On les repère On les repère On mesure une caractéristique plusieurs fois (occasions) On mesure une caractéristique plusieurs fois (occasions) Exemples : croissance sur des animaux ou plantes marquées Exemples : croissance sur des animaux ou plantes marquées Analyse : « mesures répétées » (repeated measures) Analyse : « mesures répétées » (repeated measures)

86 Echantillonnage par régression On mesure une caractéristique peu coûteuse x sur un très grand nombre N dindividus On mesure une caractéristique peu coûteuse x sur un très grand nombre N dindividus Sur un sous-échantillon aléatoire de taille n, on mesure une autre caractéristique, très coûteuse, y Sur un sous-échantillon aléatoire de taille n, on mesure une autre caractéristique, très coûteuse, y Ce sous échantillon permet destimer le coefficient de corrélation entre les deux caractéristiques Ce sous échantillon permet destimer le coefficient de corrélation entre les deux caractéristiques Lestimation précise de la moyenne de x permet alors de corriger la moyenne de y Lestimation précise de la moyenne de x permet alors de corriger la moyenne de y

87 Exemple Chez Leptomastix dactylopii on mesure : Chez Leptomastix dactylopii on mesure : La taille sur 1000 individus La taille sur 1000 individus La taille et la fécondité sur 50 dentre eux La taille et la fécondité sur 50 dentre eux

88 Exemple > mean(tail)# Echantillon de 50 [1] > mean(tail2)# Echantillon de 1000 [1] > lm(fec~tail)->m1 # Régression fécondité / taille > m1 Call: lm(formula = fec ~ tail) Coefficients: (Intercept) tail > mean(fec)# Echantillon de 50 [1] > mean(tail2)-mean(tail)->bt# Biais sur la taille > bt*m1$coeff[2]+mean(fec)# Correction du biais fécondité [1] >

89 Variance de lestimateur par régression On le donne ci dessous sans démonstration : On le donne ci dessous sans démonstration : Variance habituelle Coefficient de corrélation entre x et y

90 Suite de lexemple > # Variance de la moyenne fécondité > var(fec)/50 [1] > #correction par la corrélation avec la taille > cor(tail,fec) [1] > (1-cor(tail,fec))*var(fec)/50 [1] > v v<-(1-cor(tail,fec))*var(fec)/50 > # Erreur standard > sqrt(v) [1] > # précision > sqrt(v)*1.96 [1] > #précision relative > sqrt(v)*1.96/mean(fec)*100 [1] # 1.31% grace à la mesure des 1000 tailles >

91 Conclusions En forme de conseils

92 Conclusions Connaître les plans types est fondamental Connaître les plans types est fondamental Il est essentiel de savoir définir Il est essentiel de savoir définir Ses objectifs (précision, erreur de décision) Ses objectifs (précision, erreur de décision) Ses moyens Ses moyens Loptimisation permet de gagner du temps et de largent Loptimisation permet de gagner du temps et de largent Faites simple et si possible standard Faites simple et si possible standard Evitez les plans « astucieux » quon ne sait pas traiter ou qui se révèlent coûteux Evitez les plans « astucieux » quon ne sait pas traiter ou qui se révèlent coûteux


Télécharger ppt "Léchantillonnage Jean-Sébastien Pierre UMR 6553 20/01/2009."

Présentations similaires


Annonces Google