TP2: Statistique & Probabilité Intervalle de confiance et test d’hypothèses.

Slides:



Advertisements
Présentations similaires
Corrélation Position du problème Définition covariance (X,Y) r =
Advertisements

Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Tests de comparaison de pourcentages
Probabilités et statistique en TS
AUTOUR DE LA LOI NORMALE
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Tests de comparaison de moyennes
Méthodes de Biostatistique
Analyse de la variance : ANOVA à un facteur
Nombre de sujets nécessaires en recherche clinique
Le test t.
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Simulation d’un processus de Poisson
Cédric LAOUENAN 20/11/2008 Tests statistiques Cédric LAOUENAN 20/11/2008
Intervalles de confiance pour des proportions L’inférence statistique
ANOVA à 1 facteur en groupes de mesure indépendants
TESTS NON PARAMETRIQUES
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
LOI NORMALE LOI STUDENT ECHANTILLONS ET TESTS DE MOYENNE
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Probabilités et statistique MQT-1102
ECHANTILLONAGE ET ESTIMATION
Introduction aux statistiques Intervalles de confiance
Défi Desjardins Mars 2014 Centre d’Expertise en Modélisation et Recherche.
GESTION DE PORTEFEUILLE 3bis Catherine Bruneau RISQUE & PROBABILITE.
1 M2 Biomatériaux- Cours n°3 1 - Rappels du cours n°1 et La statistique inférentielle Fluctuation d’échantillonnage, Théorème central limite Estimation.
Cours de Biostatistiques 14 avril 2012 Noémi ARDITI Delphine COUDRAY.
1 Biostatistique et lecture critique d’articles médicaux Pr A Venot UFR SMBH Université Paris 13.
Mediator 9 - Un outil de développement multimédia 3AC Techno/Informatique.
Maths en Jean : Nager dans le brouillard. Présentation du sujet Une personne part du bord de la plage et nage 500 mètres en ligne droite dans une direction.
Plans d'expérience Méthode Taguchy Analyse de la variance Anavar.
LCA UFR SMBH (DCEM)1 Analyse critique d ’articles évaluant l ’intérêt de nouveaux tests à visée diagnostique Alain Venot UFR SMBH Campus virtuel SMBH
1 M2 Biomatériaux- Cours n°4 1 - Rappels du cours n°1 et 2 et Introduction au principe des test statistiques.
Résolutions et réponses Epreuve n° 4 – CM2 Résolutions et réponses Epreuve n° 4 – CM2 RALLYE MATH 92 2 ème Édition RALLYE MATH 92 2 ème Édition.
1 M1 MQSE 1 - L’outil statistique pour tirer des conclusions dans un monde de variabilité 2 - Utiliser la statistique: se confronter au hasard 3 - La statistique:
FACTORY systemes Module 5 Page 5-1 Les outils clients Wonderware FORMATION InSQL 7.0.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Aurélien Besnard.  Des fréquences (points-contacts) évaluées sur…  …des transects choisis dans…  …des Aires de Présence (de surfaces évaluées) dans…
Chapitre 2 Variables aléatoires 1. Variables aléatoires : définition Résultat d’une expérience dont l’issue est multiple (VARIABLE) et imprévisible (ALÉATOIRE)
Chapitre 6 Les tests d ’ hypoth è se 2 – Les tests du  2 (chi 2)
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
1 Plan du cours Introduction Notions de mécanique : force, énergie, travail, puissance… Température et chaleur Systèmes, transformations et échanges thermodynamiques.
1 M1 MQSE Cours n°2 1 - Rappels du cours n°1 2 - La statistique: un outil pour décrire.
Chapitre 5 Interprétation des données d’enquête 1.
ENCG de Fès DU Finance et Ingénierie Bancaire Décisions d'investissement et de financement Chapitre 2 - Evaluation et choix d'investissements en situation.
Évaluation – Panorama 16 À l’étude…. Unité 16.1 Tu dois être capable de déterminer le caractère étudié d’une recherche de données :  qualitatif  quantitatif.
 a été réalisé et optimisé pour Microsoft Office PowerPoint L’utilisation d’une version inférieure supprime les effets visuels.  correspond aux.
Étude des émissions diffuses avec l’expérience H.E.S.S. Tania Garrigoux.
Les Statistiques.
Réalisé par : Sébastien Lachance MATHS 3 E SECONDAIRE LesSTATISTIQUES.
II. Les variables quantitatives
Régression linéaire (STT-2400) Section 3 Préliminaires, Partie II, La loi multinormale Version: 8 février 2007.
Individus Illustratifs (Supplémentaires) Individus jugés « intrinsèquement différents » Individus jugés « atypiques » Exemple Exemple :classe différente,
Chapitre 5 Interprétation des données d’enquête 1.
Eléments de correction. Exercice 1. Méthodes d’interpolation et cartes de températures (7 points) Présentation de la carte et des enjeux de la représentation.
En prélude Quelques brefs rappels 1. Moyenne  Un exercice (3.6, p. 34) o Données o Quelle est la densité moyenne de l’ensemble formé par le Bénin et.
FACULTE DE MEDECINE DE CONSTANTINE DEPARTEMENTs DE PHARMACIE ET DE MEDECINE DENTAIRE ENSEIGNEMENT GRADUE Année Universitaire EPIDEMIOLOGIE ANALYTIQUE.
ORACLE, WP3 meeting1 Quels outils pour évaluer risques & opportunités? Quels nouveaux développements de méthodologies? Pascal Yiou LSCE.
Faculté de Médecine de Marseille, Université de la Méditerranée Laboratoire d’Enseignement et de Recherche sur le Traitement.
Chapitre 4: Variation dans le temps  Les données : audience totale en milliers (tableau 4.1, p. 47, extrait) o Origine : enquête sur les habitudes d’écoute.
Chapitre 13 : Echantillonnage
Introduction aux statistiques Intervalles de confiance
POL1803: Analyse des techniques quantitatives
Transcription de la présentation:

TP2: Statistique & Probabilité Intervalle de confiance et test d’hypothèses

σ² connue n grand n petit <120 Loi Normale Loi de Student à n-1 ddl σ² inconnue

2 échantillons indépendants (et donc à covariance nulle!) σ² connues – loi normale σ² inconnues mais supposées égales Petit échantillon - Student ddl= (n 1 -1) + (n 2 -1) Grand échantillon – Normal avec s²

2 échantillons appariés (2x même phénomène; différence = variable)

Grand échantillon 1. Pour une proportion π 2. Pour une différence de proportions Note: Pour un petit échantillon, Student ne s’applique pas.

avec f i fréquence absolue De manière aléatoire, on a tiré un petit échantillon de 10 cotes provenant d'un concours national en calcul statistique. Ces cotes sont les suivantes : (a) Calculez la moyenne et l'écart-type de cet échantillon. (b) Construisez un intervalle de confiance (95%) pour la moyenne des cotes du concours national

avec f i fréquence absolue (a)Moyenne de l'échantillon = ∑ X i / n = 673 / 10 = 67,3. La cote moyenne est de 67,3 pts. Variance et écart-type d’échantillon: s 2 = ∑ (X i – ) 2 / n-1 = 386,1 / 9 = 42,9 s = 6,55. (X i – )(X i – )² 713,713,69 746,744, ,35,29 724,722, ,310, ,318, ,328, ,328, ,353, ,7161,29 =67,30386,1

avec f i fréquence absolue (b) L'intervalle de confiance pour la moyenne d'une population pour laquelle la variance exacte (σ²) est inconnue est déterminé à l'aide de l'écart-type de l'échantillon (s) et de la distribution du t de Student avec dll = 9. μ = ± t.025 s / √n μ = 67,3 ± 2,26 * 6,55 /√10 = 67,3 ± 4,68 μ Є [62,62 ; 71,98]

Le propriétaire d'un élevage de poulets s'intéresse au poids moyen des animaux prêts à la vente issus de son établissement. Il a tiré au hasard un échantillon de 8 poulets prêts à la vente. La pesée a donné les résultats suivants (poids exprimés en grammes) : (a) Calculez la moyenne et l'écart-type de cet échantillon. (b) Construisez un intervalle de confiance (95%) pour la moyenne des animaux prêts à la vente

(a) Moyenne de l'échantillon = ∑ X i / n = 7629 / 8 = 953,6. Le poids moyen des poulets prêts à la vente, repris dans l'échantillon est de 953,6 gr. Variance = s 2 = ∑ (X i – ) 2 / n-1 = 77119,87 / 7 = 11017,12 Ecart-type = s = 105,0. (X i – )(X i – )² , , , , , , , , , , , , ,3751, , ,14 953, ,87

(b) L'intervalle de confiance pour la moyenne d'une population pour laquelle la variance exacte (σ²) est inconnue est déterminé à l'aide de l'écart- type de l'échantillon (s) et de la distribution du t de Student avec dll = 7. Ainsi, μ = ± t.025 s / √n μ = (953,6 ± 2,36 * 105 /√8) = 953,6 ± 87,61 μ Є [865,99 ; 1041,21]

Considérons deux échantillons indépendants d'hommes et de femmes dont on observe le salaire hebdomadaire (en milliers de francs) : Calculez un intervalle de confiance (95%) pour la différence entre la moyenne des salaires hebdomadaires des hommes et celle des salaires hebdomadaires des femmes de la population. HommesFemmes

Intervalle de confiance pour la différence entre la moyenne des salaires perçus d'une part, par les hommes et d'autre part, par les femmes, nous allons devoir appliquer la formule suivante : μ H - μ F = ( H - F ) ± t.025 s p * √(1/n H + 1/n F ) 2 échantillons indépendants (et donc à covariance nulle!) σ² inconnues mais supposées égales Petit échantillon - Student ddl= (n 1 -1) + (n 2 -1)

Moyenne des hommes = H = ∑ X iH / n = 80 / 5 = 16. Moyenne des femmes = F = ∑ X iF / n = 55 / 5 = 11. t.025 avec dll = (n 1 -1) + (n 2 -1) = (5-1)+(5-1) = 8 t.025 = 2,31 la variance commune est estimée comme suit : s p 2 = {∑ (X iH – H ) 2 + ∑ (X iF – F ) 2 } / {(n H - 1) + (n F – 1)} s p 2 = ( ) / (4 + 4) = 15,75 Ecart-type commun = s p = 3,968 L'intervalle de confiance à 95% : μ H - μ F = (( ) ± 2,31 * 3,97 *√(1/5) + (1/5)) = (5 ± 5,78) μ H - μ F Є [-0,78 ; 10,78 ]

Supplément pour calcul variance d’échantillons Variance pour les hommes = s H 2 = ∑ (X iH – H ) 2 / n-1 = 86 / 4 = 21,5. Ecart-type pour les hommes = s H = 4,64. Variance pour les femmes = s F 2 = ∑ (X iF – F ) 2 / n-1 = 40 / 4 = 10. Ecart-type pour les femmes = s F = 3,16.

Calcul des valeurs critiques du test Par exemple pour le test de la moyenne : H 0 : µ ≤ C H 1 : µ > C Valeur de Z ou de T sous H 0 Z car σ est connue et donc une loi normale σ inconnue, on utilise s calculée sur l’ échantillon; on a une loi de Student Cas d’une proportion, la variance d’ échantillon est donnée par P(1-P)/n On a une loi de Student

Un juge américain de la ville de Boston a, au cours de sa carrière, désigné 700 personnes faisant partie de la population de la ville pour être jurés lors de ses procès. 15% de ces personnes étaient des femmes. Or, la ville de Boston compte 29% de femmes éligibles à cette fonction. (a) Si π désigne la probabilité qu'un juré choisi par le juge soit une femme, comment doit être libellé H 0 pour tester l'impartialité du juge dans son choix quant au sexe ? (b) Calculez la probabilité critique (p.c.) unilatérale pour H 0 ? (c) Au seuil de α = 5%, peut-on rejeter H 0 ?

(a) Puisqu'il y a 29% de femmes éligibles à la fonction de juré dans la ville de Boston, l'hypothèse nulle d'impartialité de choix du juge doit donc être : H 0 : π = 0,29. (b) P = 0,15 Ecart-type estimé = √(0,15 * 0,85 / 700) = 0,01349 t = (0,15 – 0,29) / 0,01349 = -10,4. Prob (P ≤ π )= Prob (T ≤ t = -10,4) = Prob (T ≥ t = 10,4)  0 Pour un grand échantillon (n = 700), on peut consulter les tables de la loi normale ou de la loi de Student. On constate ainsi que la probabilité que Z > 10,4 ou T > 10,4 est très faible et proche de zéro. En conclusion, la crédibilité de l'hypothèse nulle d'impartialité du juge est très faible !

(c) Prob (P ≤ π ) = Prob (T ≤ t = (P - π) / s p ) = Prob (T ≥ -t = -(P - π) / s p ) = 0,05 Par symétrie, on observe que la valeur critique du t de Student pour un seuil de 5% (pour un grand échantillon) est de -1,64. Puisque la valeur observée (-10,4) se trouve largement en deçà (queue de distribution, à gauche), on peut également rejeter l'hypothèse nulle.

Le design de la boîte de céréales influe-t-il sur la satisfaction des consommateurs ? Pour le savoir, une firme de marketing a distribué deux boites de céréales de même contenu mais de présentations différentes (Old et New) à 2500 familles. Résultat : 830 familles préfèrent Old ; 1220 familles préfèrent New et 450 familles sont indifférentes. New est-il « supérieur » à Old ? Pour vos calculs, ne considérez que les familles émettant une préférence pour Old ou New.

Hypothèse nulle: pas d’effet donc les familles sont indifférentes entre les deux versions de céréales (autant de familles choisissent l’un ou l’autre): H 0 : π = 0,5. Hypothèse alternative: les familles préfèrent la version New : H1 : π > 0,5. Proportion observée de personnes préférant la boite de céréales New: P = 0,595 (= 1220 / 2050) Ecart-type estimé = √P (1 – P) / n = √(0,595 * 0,405 / 2050) = 0,01083

Nous obtenons ensuite la valeur du t = (0,595 – 0,50) / 0,01083 = 8,76. Prob (P > π )= Prob (T > t = 8,76)  0 A nouveau, pour un grand échantillon (n = 2050), on peut consulter les tables de la loi normale ou de la loi de Student. On constate ainsi que la probabilité que Z > 8,76 ou T > 8,76 est très faible et proche de zéro. Autrement dit, la crédibilité de l'hypothèse nulle d'indifférence entre les deux emballages est très faible !

On a recueilli deux échantillons d'oeufs pondus dans deux localités différentes. On répartit ces oeufs selon leurs poids (7 classes) et leur lieu de ponte. Le poids des oeufs pondus en A est-il significativement inférieur au poids des oeufs pondus en B ? LieuPoids(Centres de classe)TotalMoye nne s2s2 2,53,54,55,56,57,58,5 A ,351,22 B ,451,47

Hypothèse nulle est telle que le poids des oeufs pondus en A et en B sont similaires: H 0 : μ A - μ B = 0. Hypothèse alternative est que le poids des oeufs pondus en A est inférieur au poids des oeufs pondus en B: H1 : μ A μ A - μ B < 0. Variances inconnues mais de grands échantillons : écart-type = √(1,22 / 457) + (1,47 / 488) = 0,07537 z = (valeur estimée – hypothèse nulle) / écart-type estimé = [(5,35 – 5,45) – 0] / 0,07537 = -1,3267. La probabilité que Z 1,32 s'élève à 0,093, soit 9,3%. Une probabilité critique de plus de 9% (probabilité de rejeter H0 alors qu’elle est vraie) sera considérée comme élevée (>5%). On peut donc accepter Ho.