23/05/2016 Déterminer la taille des échantillons notion sous-jacente : puissance d'un test Claire Chabanet fonction F4, étendre l'écran configurer le diaporama, mode presentateur (moniteur2) affichage diaporama clic droit, options du pointeur, option des fleches de direction, visible dans diaporama, pour pointer, Ctl + clic gauche de souris ATTENTION : il faut la souris (le pad ne fonctionne pas pour pointer) code R associé (démo puissance + mise en œuvre) : # 23 mai 2016 # R3.2.2 ######################################## # en complément du powerpoint puissance_23_05_2016-v7.pptx # démo install.packages("TeachingDemos") install.packages("tkrplot") library(TeachingDemos) run.power.examp() # faire successivement les modif ci-dessous, commenter la puissance # n=10 # sd=3 # delta=2 # alpha=.10 # comment trouver les fonctions R utiles ? install.packages("sos") library(sos) findFn("power") help.start() search engine and keywords browse keywords htest (statistical inference) edition, rechercher, power # calcul de tailles d'échantillon # test de Student power.t.test(power=0.80,delta=1.2,sd=.5, sig.level=0.05) # n = 4 install.packages(“pwr”) library(pwr) pwr.t.test(power=0.80,d=1.2/0.5, sig.level=0.05) # n = 4 # ANOVA ?power.anova.test power.anova.test(groups=4,between.var=1,within.var=3,power=0.80) # n=12 groupmeans=c(120,140,130,150) power.anova.test(groups=length(groupmeans), between.var=var(groupmeans), within.var=500,power=0.90) # n=15 # 2 proportions power.prop.test(p1=0.50,p2=0.75,power=0.90,sig.level=0.05) # n=77 # 1 proportion h=2*asin(sqrt(.60))-2*asin(sqrt(.50)) # taille de l’effet = .20 pwr.p.test(h=.20,power=0.80,sig.level=0.05,alternative='greater') # # test du Chi2 prob=matrix(c(.15,.15,.15,.15,.16,.16,.04,.04),ncol=4,byrow=T) ES.w2(prob) # calcul taille effet w pwr.chisq.test(w=0.30,df=3,sig.level=0.05,power=.80) # N=121 # corrélation pwr.r.test(r=.5,power=.8,sig.level=.05) # n=29
Objectifs Choix a priori de la taille des échantillons : 23/05/2016 Objectifs Choix a priori de la taille des échantillons : contraintes : financières, humaines ‘calcul de puissance’ calcul de n qui permettra de mettre en évidence (espérer mettre en évidence) un effet d’une taille donnée, avec une probabilité donnée ? contingences matérielles ou humaines : contraintes financières, contraintes de temps, nb expérimentateurs, matériel expérimental limité Au delà de ces contraintes, taille d’échantillon, qui, on l’espère, permettra de mettre en évidence un effet d’une certaine taille, avec une certaine probabilité. Comme d’habitude en stat, c’est une affaire de proba. D’où le plan de la présentation
Plan puissance d’un test risque de première espèce 23/05/2016 Plan puissance d’un test risque de première espèce risque de deuxième espère puissance les leviers de la puissance d’un test (démo) déterminer la taille d’échantillon (R) trouver les fonctions R calculs dans différents cas de figure 2 parties partie 1 : notions pour comprendre : risque alpha, risque beta, puissance, sur quels paramètres agir pour contrôler la puissance partie 2 : comment faire
Puissance d’un test Hypothèse nulle, hypothèse alternative 23/05/2016 Puissance d’un test Hypothèse nulle, hypothèse alternative ex : essai randomisé : traitement visant à augmenter le poids population, 1 échantillon aléatoire, individus répartis aléatoirement en 2 groupes : contrôle et traité Y = gain de poids Q : 𝜇 𝑡𝑟𝑎𝑖𝑡é > 𝜇 𝐶𝑡𝑙 ? test de Student pour 2 éch indépendants (unilatéral) observations indépendantes, variances homogènes, normalité hypothèse nulle : 𝐻 0 : 𝜇 𝑡𝑟𝑎𝑖𝑡é = 𝜇 𝐶𝑡𝑙 hypothèse alternative : 𝐻 1 : 𝜇 𝑡𝑟𝑎𝑖𝑡é > 𝜇 𝐶𝑡𝑙 ex : essai randomisé : 1 pop. on extrait un échantillon, par tirage aléatoire (simple). répartition aléatoire dans 2 groupes. 1 groupe est traité, l’autre sert de contrôle. Q orientée : moy traité > moy contrôle, (élevage) moy traitée < moy contrôle, (lutte anti obésité) test unilatéral obs indépendantes (< protocole) : tirage aléatoire dans la population répartition aléatoire en 2 groupes animaux en box individuels (pas de compétition pour nourriture) pas de mesures répétées pas de données groupées visualisation graphique : homogénéité des variances, formes des distributions
Puissance d’un test Statistique de test pour décider entre 𝐻 0 et 𝐻 1 23/05/2016 Puissance d’un test Statistique de test pour décider entre 𝐻 0 et 𝐻 1 𝑥 𝑡𝑟𝑎𝑖𝑡é = moy échantillon traité, 𝑥 𝐶𝑡𝑙 = moy échantillon contrôle 𝑡= 𝑥 𝑡𝑟𝑎𝑖𝑡é − 𝑥 𝐶𝑡𝑙 écart−type de la différence = 𝑥 𝑡𝑟𝑎𝑖𝑡é − 𝑥 𝐶𝑡𝑙 s/ 𝑛 1 +s/ 𝑛 2 si 𝑡>𝑠𝑒𝑢𝑖𝑙 (𝑠𝑒𝑢𝑖𝑙= 𝑡 𝑛 1 + 𝑛 2 −2 ) , on rejette 𝐻 0 sinon, on conserve 𝐻 0 (par défaut… on n’a pas les moyens de rejeter) on n’a pas réussi à rejeter… ce qui ne veut pas dire qu’il n’existe pas de différence en réalité autre conclusion possible avec un effectif plus grand statistique basée sur l’écart entre les moyennes. standardisation : diviser par l’écart type de la différence des moyennes (statistique sans unité) -> comparer la statistique calculée à une quantité lue dans une table de student. Ainsi, la statistique de test suit une loi de student. S = écart-type compromis : (n1-1) S1^2 + (n2-1) S2^2 S= sqrt(------------------------------------------------) n1+n2-2 S1=sqrt(somme (x-moy)^2/(n1-1)) C’est pour cela que l’hyp d’homogénéité des variances est importante.
H Puissance d’un test distribution de la statistique de test 23/05/2016 Puissance d’un test H distribution de la statistique de test densité de probabilité on a calculé la statistique de test distribution sous H0, si les moyenne traité et contrôle sont égales. distribution centrée sur 0 (valeur la plus probable), -5, 5 très improbables si H0 vraie proba associée à chaque valeur -> densité de proba. l’aire sous la courbe : 1 =proba statistique entre –infini et +infini. -2 2 valeurs possibles de la statistique
H Puissance d’un test région de rejet 23/05/2016 Puissance d’un test règle de décision entre H0 et H1 : choix de 𝜶 (alpha) risque de première espèce (risque de rejeter à tort) H réalité conclusion H0 H1 OK erreur 𝜶 densité de probabilité 𝜶 région de rejet comment décider H0 ou H1 ? si la stat est trop grande, moy traité est très grande pr à moy Ctl, des preuves en faveur du rejet de H0. à partir de quand cette stat est assez grande pour rejeter H0 ? une question de proba. choix du risque de première espèce, alpha (souvent 5%). risque de rejeter à tort. sur le schéma : proba, région sous la courbe. définit la région de rejet. définit une valeur critique au delà de laquelle on rejete H0, suffisamment de preuves à l’encontre de H0, risque de rejeter à tort plus petit que 5% (choisi a priori. on peut choisir un autre risque). valeur critique = quantile associé à 5% affichage du tableau réalité/conclusion (se lit ligne par ligne). en ligne, réalité : on est soit sous H0, soit sous H1 (pas les 2 à la fois). en colonne, conclusion du test, aléatoire (dépend des données, peut varier si on recommence). si H0 vraie, on est sous la courbe (proba 1 : aire sous courbe = 1). si stat de test < valeur critique, on conserve H0. c’est OK, on ne s’est pas trompé. si stat de test > valeur critique (peut arriver avec une proba de 5%), on rejette H0. à tort. le risque de faire une telle erreur est appelé risque alpha, ou risque de première espèce. insister sur la lecture en ligne du tableau ‘réalité – conclusion’ : réalité fixe, conclusion aléatoire. valeur critique (quantile associé à 5%) valeurs possibles de la statistique
1−𝛽 𝛽 𝛼 H H Puissance d’un test puissance 23/05/2016 Puissance d’un test risque (beta) de deuxième espèce (risque d’accepter à tort) 𝛽 réalité conclusion H0 H1 OK erreur 𝜶 𝛽 H H 1 𝛽 arbitrage entre les risques et 𝜶 𝛽 1−𝛽 supposons H0 fausse. On est sous H1. on ne sait pas positionner H1, on ne connait pas la vraie différence -> pointillé résultat aléatoire, densité de proba décalée, décalage inconnu risque de première espèce alpha choisi = règle de décision = zone de rejet. définit une zone de conservation de H0 alors que H1 est vraie, de proba beta. C’est le risque de deuxième espèce : risque de conserver H0 à tort. Sous H1, zone au delà de la valeur critique de proba 1-beta, correspond au rejet de H0 sachant H1 vraie -> puissance du test. risque alpha détermine risque beta. Si alpha diminue, on beta augmente (vice versa). -> compromis à trouver entre alpha et beta. impossible diminuer les 2 risques à la fois. choix de alpha implique un certain choix pour beta, et un certain choix de puissance de test. alpha et beta sont liés. alpha et la puissance sont liés. revenons au tableau réalité/conclusion : réalité : H1 vraie. si statistique > valeur critique, rejet de H0, conclusion OK. si statistique < valeur critique, conserver H0, erreur. proba beta : risque de 2ième espèce. En résumé, lorsqu’on fait un test, on décide H1, ou on décide de conserver H0 (parce qu’on n’a pas assez de preuves pour rejeter H0). On a 2 erreurs possibles : rejeter à tort ou accepter à tort. On a 2 risques d’erreur, l’erreur de première espèce alpha, et l’erreur de deuxième espèce beta. On choisit a priori le risque d’erreur de première espèce, alpha. On choisit souvent 5%, mais on peut aussi choisir 20%, 10%, 1%, 1 pour mille ou 1 pour 10000, selon les conséquences d’une erreur de décision. Du choix de alpha, et de la réalité (H1), découle le risque de deuxième espèce beta, et la puissance du test. 𝛼 puissance
Puissance d’un test récapitulatif définition de la question posée 23/05/2016 Puissance d’un test récapitulatif définition de la question posée choix de la population cible poser H0 et H1 (uni ou bilatéral) constitution des échantillons, mesures statistique de test règle de décision choix de en découlent et (qu’il est possible d’évaluer pour une alternative donnée) 𝛽 1−𝛽 𝛼
Puissance d’un test De quoi dépend la puissance d’un test ? 23/05/2016 Puissance d’un test De quoi dépend la puissance d’un test ? démonstration graphique : dans R : > install.packages("TeachingDemos") > install.packages("tkrplot") > library(TeachingDemos) > run.power.examp() pour installer R : aller sur le site cran.r-project.org choisir un site miroir (proche de chez vous) : cliquer sur mirrors (en haut à gauche) Download R for windows suivre les instructions d’installation en prenant les options par défaut à l’issue de l’installation, une icône R apparait sur le bureau. cliquer sur l’icône pour ouvrir R. taper les comandes dans la fenêtre R console (ou faire du copier/coller pour coller les commandes dans cette fenêtre). Une autre option : installer Rstudio (autre interface utilisateur). conseillé. rstudio.com
Puissance d’un test : TeachingDemos, run.power.examp() 23/05/2016 Puissance d’un test : TeachingDemos, run.power.examp() test de Student unilatéral distribution de la différence des moyennes sous 𝐻 0 sous 𝐻 1 sd : standard deviation se : standard error 𝑠𝑒=𝑠𝑑 𝑛 faire varier : 𝑛 standard deviation (𝜎) la vraie différence (𝛿) risque alpha (𝛼) démo : ex artificiel : comparer 2 moyennes, test de Student unilatéral. si écart-type connu, la stat suit une loi normale (et pas une loi de student) (loi normale représentée, mais très proches : loi normale = loi de student avec ddl infini) densité de la différence de moyennes (brute, non standardisée, ce n’est pas la statistique de student ici). rouge, distribution de la stat de test sous H0. bleu, distribution de la stat de test sous UNE hypothèse alternative H1. notations : sd : c’est l’écart type se : c’est l’écart type de la moyenne. alpha : 5%, détermine zone de rejet (aire rouge sous H0). si vraie différence = 1, puissance = probabilité associée à l’aire bleue sous H1. puissance inférieure à 50%. faire varier de façon interactive, n (n=10) standard devieation (3) true différence (2) alpha (.10)
Puissance d’un test : TeachingDemos, run.power.examp() 23/05/2016 Puissance d’un test : TeachingDemos, run.power.examp() faire varier : 𝑛 standard deviation (𝜎) la vraie différence (𝛿) risque alpha (𝛼) 𝑥 = 𝑥 𝑖 𝑛 𝑉𝑎𝑟( 𝑥 )= 𝜎 2 𝑛 𝑛 , 𝑉𝑎𝑟( 𝑥 ) n=10 écart-type de la moyenne diminue (divisé par racine de 10) plus grande précision dans l’estimation de la moyenne -> densité de distribution plus reserrée. puissance augmente. devient supérieure à 50%.
Puissance d’un test : TeachingDemos, run.power.examp() 23/05/2016 Puissance d’un test : TeachingDemos, run.power.examp() faire varier : 𝑛 standard deviation (𝜎) la vraie différence (𝛿) risque alpha (𝛼) si variabilité du phénomène plus grande : sd=3. densités sous H0 et H1 plus étalées. aire en rouge qui matérialise alpha reste à 5%. aire en bleue sous H1, la puissance du test diminue. inférieure à 50%.
Puissance d’un test : TeachingDemos, run.power.examp() 23/05/2016 Puissance d’un test : TeachingDemos, run.power.examp() faire varier : 𝑛 standard deviation (𝜎) la vraie différence (𝛿) risque alpha (𝛼) si vraie différence plus grande : 2. densité de probabilité sous H1 (courbe en bleu) plus décalée à droite. puissance augmente. devient supérieure à 50%.
Puissance d’un test : TeachingDemos, run.power.examp() 23/05/2016 Puissance d’un test : TeachingDemos, run.power.examp() faire varier : 𝑛 standard deviation (𝜎) la vraie différence (𝛿) risque alpha (𝛼) alpha =10% aire en rouge sous H0 correspond à une probabilité de 10%. plus grande. risque alpha est plus grand -> risque beta plus petit. puissance plus grande.
Puissance d’un test la puissance (1−𝛽) d’un test dépend de : 23/05/2016 Puissance d’un test la puissance (1−𝛽) d’un test dépend de : la taille des échantillons (𝑛) la variabilité du phénomène (standard deviation : 𝜎 (sigma), s ou sd) la vraie différence dans la pop (delta : 𝛿) du risque de première espèce (𝛼) (relation inverse entre 𝛼 et 𝛽) 5 paramètres liés entre eux : 𝑛, 𝜎, 𝛿, 𝛼, 1−𝛽 On déduit le dernier à partir des 4 autres : calcul de 𝑛 à partir des 4 autres calcul de 1−𝛽 à partir des 4 autres cette démo montre : puissance dépend de la taille des échantillons, de la variabilité du phénomène (sigma), de la vraie différence (delta), du risque de permière espèce choisi (alpha). 5 paramètres liés entre eux. 2 utilisations possibles (au moins) : calculer n : quelle taille d’échantillon pour détecter une différence delta, avec une probabilite 1-beta calculer puissance du test
Déterminer la taille d’échantillons 23/05/2016 Déterminer la taille d’échantillons Comment trouver les fonctions R utiles ? > install.packages("sos") > library(sos) > findFn("power")
Déterminer la taille d’échantillons Comment trouver les fonctions R utiles ? > help.start() Search Engine and Keywords (clic) Browser keywords available for searching the help system (clic) htest (statistical inference) (clic) edition, rechercher, power (clic) package::fonction
Déterminer la taille d’échantillons 23/05/2016 Déterminer la taille d’échantillons quelques fonctions R : Fonction Package power.t.test / pwr.2p.test pwr pwr.t.test pwr.2p2n.test pwr.t2n.test pwr.r.test power.anova.test pwr.chisq.test pwr.anova.test pwr.f2.test power.prop.test lmmpower.lme longpower pwr.p.test lmmpower.gee De nombreux autres packages existent qui permettent de realiser des calculs de puissance. Parmi eux, on peut citer les packages PoweR, PowerTOST, powerMediation, simsem, MBESS, CP, powerAnalysis, rpsychi, powerpkg, haplo.stats, stats. et beaucoup d’autres…
Taille d’échantillon et test de Student 23/05/2016 Taille d’échantillon et test de Student test de Student : delta : différence de moyennes que l’on souhaite mettre en évidence (effet scientifiquement significatif) sd : standard deviation : variabilité du phénomène : écart-type > power.t.test(power=0.80,delta=1.2,sd=.5, sig.level=0.05) # n = 4 package pwr: fonctions pwr.t.test, pwr.t2n.test : d = delta / sd = taille de l’effet > install.packages(“pwr”) > library(pwr) > pwr.t.test(power=0.80,d=1.2/0.5, sig.level=0.05) # n = 4 Rq : Ici, sd = standard deviation = écart-type dans pop (et non pas l’écart-type de la différence des moyennes de la diapo 5). taille d’échantillon = taille pour chaque groupe. attention, la différence à mettre en évidence peut être définie par la différence entre les moyennes, ou par la taille de l’effet, où la taille de l’effet est le rapport entre la différence des moyennes et l’écart-type (sd). Vérifier dans l’aide en ligne. En donnant delta ou d, on décrit le scénario que l’on souhaite pouvoir détecter. C’est pareil dans tous les cas de calcul de puissance (un peu plus complexe ans certains cas). package pwr (créé par Stéphane Champely, Lyon1) : conforme aux notations de Cohen test de Student pour données appariées : cf. Champely p.16 il faut aussi la corrélation r entre les mesures appariées. d=mu_x – mu_y / (sqrt(sdx^2+sdy^2-2r.sdx.sdy)) ou d=mu_x-mu_y/ (sd sqrt(2(1-r)) )
Taille d’échantillon et ANOVA 23/05/2016 Taille d’échantillon et ANOVA ANOVA 1 facteur : > ?power.anova.test > power.anova.test(groups=4,between.var=1,within.var=3,power=0.80) # n=12 si on souhaite mettre en évidence des écarts entre moyennes au moins égaux à ceux précédemment reportés : > groupmeans=c(120,140,130,150) > power.anova.test(groups=length(groupmeans), between.var=var(groupmeans), within.var=500,power=0.90) # n=15 scénario que l’on souhaite pouvoir détecter : between.var : variance between : variance inter groupe : carré moyen associé au facteur (dans table ANOVA, ligne correspondant au facteur testé, colonne carré moyen, ou mean square). within.var : variance intra groupe : variance résiduelle : erreur pure : c’est la variance qui correspond à la variabilité incompressible, à la variabilité naturelle, biologique, qu’on ne peut pas expliquer (dans table ANOVA, ligne résidu, colonne carré moyen). autre possibilité : la fonction pwr.anova.test du package pwr : pwr.anova.test(f=0.5,k=3,power=.80,sig.level=.05)
Taille d’échantillon et proportions 23/05/2016 Taille d’échantillon et proportions Comparaison de 2 proportions : > power.prop.test(p1=0.50,p2=0.75,power=0.90,sig.level=0.05) # n=77 Comparaison d’une proportion à une valeur de référence : quelle taille d’échantillon pour détecter un écart positif de 10% par rapport à une proportion de référence de 50% (si test unilatéral) ? > library(pwr) > h=asin(sqrt(.60))-asin(sqrt(.50)) # taille de l’effet = .20 > pwr.p.test(h=.20,power=0.80,sig.level=0.05,alternative=“greater”) # n=155 transfo asin(sqrt) -> loi dont l’écart-type ne dépend plus des proba de succès 2 asin(sqrt(p)) suit loi N(2 asin(sqrt(pi)), 1/sqrt(n))
Taille d’échantillon et test du Chi2 23/05/2016 Taille d’échantillon et test du Chi2 Test du Chi2 : (package pwr) ex : un chercheur veut montrer qu’il existe des préférences différentes entre hommes et femmes pour 4 emballages A, B, C, D quelle taille pour le panel de conso, composé à 40% de femmes ? le chercheur suppose les hommes indifférents à l’emballage, et les femmes ayant une préférence 4 fois plus grande pour les produits A et B (répartition des choix du type .40 .40 .10 .10 pour les femmes) répartition des choix sous H1 : 𝑃 𝑜𝑏𝑠 : A B C D Hommes .15 .15 .15 .15 .60 Femmes .16 .16 .04 .04 .40 .31 .31 .19 .19 1 répartition des choix sous H0 : 𝑃 𝑡ℎ : ex : Hommes – A : .31 x .60 taille de l’effet calcul sur les proba (pas sur les effectifs) 𝑤= 𝑃 𝑜𝑏𝑠 − 𝑃 𝑡ℎ 2 𝑃 𝑡ℎ Un chercheur (marketing) : déterminer la pref des conso pour 4 formes de packaging d’un nouveau produit. panel de 100 conso qui choisissent chacun leur emballage préféré. réalise un test du Chi2, à 5%, sur la distribution des préférences, contre l’hyp nulle d’absence de préférence. Quelle est la puissance du test ? Champely : https://pbil.univ-lyon1.fr/R/pdf/puissance.pdf H0 : indépendance entre choix et sexe, même distribution (répartition) des choix (préférences) entre hommes et femmes Pobs : proba de choix sous H1 Pth : proba de choix sous H0 w : taille de l’effet (attention : w : calcul à partir des proba, chi2 : calcul à partir des effectifs)
Taille d’échantillon et test du Chi2 23/05/2016 Taille d’échantillon et test du Chi2 𝑤= 𝑃 𝑜𝑏𝑠 − 𝑃 𝑡ℎ 2 𝑃 𝑡ℎ = 2(.15−.31∗.60) 2 .31∗.60 + 2(.15−.19∗.60) 2 .19∗.60 + 2(.16−.31∗.40) 2 .31∗.40 + 2(.04−.19∗.40) 2 .19∗.40 = .30 > library(pwr) > prob=matrix(c(.15,.15,.15,.15,.16,.16,.04,.04),ncol=4,byrow=T) > ES.w2(prob) # calcul taille effet w pour test du Chi2 d’association = 0.30 > pwr.chisq.test(w=0.30,df=3,sig.level=0.05,power=.80) # N=121 ES = effect size = calcul de w possible calculer taille de l’effet à la main, ou avec fonction ES.w2. fournir des probabilités, celles d’un scénario sous H1, que l’on souhaiterait mettre en évidence.
Taille d’échantillon et corrélation 23/05/2016 Taille d’échantillon et corrélation Test de nullité d’une corrélation : (package pwr) > pwr.r.test(r=.5,power=.8,sig.level=.05) # n=29
Calcul de puissance… a priori ! 23/05/2016 Calcul de puissance… a priori ! Déterminer les tailles d’échantillon a priori delta = différence minimale que l’on souhaite détecter, = différence ‘significative’ au sens biologique Pas de “calcul de puissance” a posteriori : si une expérience montre un résultat non significatif, ne pas utiliser la différence obtenue pour faire un calcul de puissance. si cette différence n’est pas significative, l’intervalle de confiance de cette différence recouvre la valeur 0, la différence n’est pas évaluée précisément, c’est comme si cette différence était nulle. L’utiliser pour un calcul de puissance n’a pas de sens… même si cette pratique est proposée dans certains guides, elle est clairement déconseillée dans d’autres.
23/05/2016 Pour aller plus loin Cohen (1988) Statistical power analysis for the behavioral sciences. Lawrence Erlbaum associates, publishers. Tests statistiques paramétriques : Puissance, taille d’effet et taille d’échantillon (sous R), Stéphane Champely, université Lyon 1 (2006) https://pbil.univ-lyon1.fr/R/pdf/puissance.pdf Déterminer la taille des échantillons, notion sous-jacente : puissance d’un test Claire Chabanet, Fabrice Dessaint (2016) https://wiki.inra.fr/wiki/cascisdi/download/Main/WebHome/puissance-v5.pdf la référence : Cohen Champely : auteur du package pwr. se base sur les notation de Cohen, notamment sur la définition de la taille d’effet utilisée par Cohen. (attention, la définition peut varier d’un auteur à un autre). fiche puissance : autre manière d’y accéder (mais version antérieure) : intranet, services d’appui, informatique, logiciels, R, déterminer la taille des échantillons