La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Statistique Étude d’un caractère Présentation des résultats

Présentations similaires


Présentation au sujet: "Statistique Étude d’un caractère Présentation des résultats"— Transcription de la présentation:

1 Statistique Étude d’un caractère Présentation des résultats
Calcul des indicateurs Interprétation Étude simultanée de deux caractères Tableau de contingence Conditionnement Ajustement

2 Étude d’un caractère 1. Tri des données Utilisation des outils
Diagramme en tiges et feuilles

3 Soit une série de 45 valeurs de taux d’hémoglobine (en g.L1)
105, 120, 125, 126, 126, 130, 132, 133, 134, 135, 138, 138, 141, 144, 146, 148, 148, 148, 149, 150, 150, 150, 151, 151, 153, 153, 154, 154, 155, 156, 156, 158, 160, 160, ….., 179 Médiane Tige Feuilles 10 5 1 11 12 13 14 19 15 32 16 41 17 45 Quartiles : 1er quartile : la plus petite valeur observée telle que, au moins 25% des données lui soient inférieures ou égales. Site Euler : Lexique et Fiches n° 470

4 Indicateur de centralité Indicateur de dispersion
2. Caractérisation d’une série statistique Indicateur de centralité Indicateur de dispersion Médiane Quantiles, intervalle interquartile….. Moyenne Écart type

5 Diagramme en boîte Fiches Euler : 470 – 1460 – 1461 min D1 Q1 me Q3 D9
Tige Feuilles 10 5 1 11 12 13 14 19 15 32 16 41 17 45 Diagramme en boîte Fiches Euler : 470 – 1460 – 1461 min D1 Q1 me Q3 D9 max

6 Comparaison de 2 séries

7 Fréquences par rapport à la population totale
Séries statistiques à deux variables 1. Deux variables qualitatives : étude fréquentielle Groupe sanguin et facteur Rhésus ( naissances dans des maternités de France) effectifs O A B AB Total R 3 566 3 968 753 385 8672 R– 576 578 110 64 1328 4142 4546 863 449 10 000 Fréquences par rapport à la population totale fréquences O A B AB Total R 0,3566 0,3968 0,0753 0,0385 0,8672 R– 0,0576 0,0578 0,0110 0,0064 0,1328 0,4142 0,4546 0,0863 0,0449 1 Fréquences marginales : f (O) = 0, f (R+) = 0,8672 Fréquences partielles ou conjointes : f (O  R) = 0,3566

8 Fréquences conditionnelles
Fréquences par rapport à une sous - population fréquences O A B AB Total R 0,3566 0,3968 0,0753 0,0385 0,8672 R– 0,0576 0,0578 0,011 0,0064 0,1328 0,4142 0,4546 0,0863 0,0449 1 Fréquence de R+ sachant O : Conséquence : Fréquence de O sachant R+:

9 Arbre de répartition des fréquences
AB f (OR+) =f O(R+)f (O) f (O)

10 2. Deux variables quantitatives Nuage de points, point moyen
Ajustement Sur chaque individu d’une population de n individus, on mesure deux variables, x et y. Les valeurs prises par x et y pour un individu donné sont notées xi et yi. On cherche s’il existe une relation simple entre x et y. Exemple

11 Probabilités Introduction : simulation d’épreuves aléatoires et fluctuation d’échantillonnage Existence d’un modèle théorique, loi de probabilité Conditionnement et indépendance

12 1. Existence d’un modèle théorique
F G Nombre de Filles F G F G F G F G 1. Existence d’un modèle théorique familles de 4 enfants : nombre de filles Simulation Valeurs possibles 1 2 3 4 probabilités

13 2. Probabilités conditionnelles Groupes sanguins et facteur rhésus
Total R 3566 3968 753 384 8672 R– 576 578 110 64 1328 4142 4546 863 449 10 000 Choix d’une personne au hasard dans la population P(O) = 0,4142 P(R) = 0,8672 P(O  R) = 0,3566 Probabilité de R+ sachant O : Conséquence : Propriété : La probabilité sachant O est une nouvelle probabilité sur le même univers. Fiches Euler :

14 3. Indépendance f RH+ (O)  f (O) f O (RH+)  f (RH+)
Fréquences conjointes et fréquences marginales fréquences O A B AB Total R 0,3566 0,3968 0,0753 0,0385 0,8672 R– 0,0576 0,0578 0,011 0,0064 0,1328 0,4142 0,4546 0,0863 0,0449 1 Fréquences conditionnelles, selon le groupe sanguin Fréquences conditionnelles, selon le facteur rhésus fO(...) fA(...) fB(...) fAB(...) RH+ 0,861 0,873 0,857 RH– 0,139 0,127 0,143 Total 1 O A B AB Total fRH+(...) 0,411 0,458 0,087 0,044 1 fRH–(...) 0,434 0,435 0,083 0,048 f RH+ (O)  f (O) f O (RH+)  f (RH+)

15 Définition de l’indépendance
Deux événements A et B, tels que P(A)  0 et P(B)  0 sont indépendants si et seulement si PB(A) = P(A). La réalisation de B ne modifie pas la valeur de la probabilité de A. Soit deux événements A et B, tels que P(A)  0 et P(B)  0. Deux événements A et B, tels que P(A)  0 et P(B)  0 sont indépendants si et seulement si P (AB) = P(A)P(B). Fiche Euler : 446

16 Nombre de filles dans une famille de 4 enfants
A : « l’ainé est une fille » B : « la famille compte exactement deux filles » Les événements A et B sont indépendants. C : « la famille compte au moins deux filles » Les événements A et C ne sont pas indépendants

17 1er cas : Tirages sans remise
Arbre de probabilité Deux tirages successifs dans une urne contenant 3 boules blanches et deux boules noires. 1er cas : Tirages sans remise N1 B2 B1 N2

18 2ème cas : Tirages avec remise
Deux tirages successifs dans une urne contenant 3 boules blanches et deux boules noires. 2ème cas : Tirages avec remise N1 B2 B1 N2 Tirages indépendants

19 Application : Test de dépistage
On dispose d’un test de dépistage pour une maladie qui peut affecter les individus d’une certaine population. Événements : M : « être malade » T + : « présenter un test positif » T – : « présenter un test négatif » Malades Non Malades Total Test Positif Vrais Positifs Faux Positifs Test Négatif Faux Négatifs Vrais Négatifs

20 Étalonnage : données statistiques et définition d’un modèle
Sensibilité : Prévalence : p = P(M) Spécificité : Utilisation du test et calcul de probabilités Comment interpréter le résultat d’un test qui aurait été pratiqué sur un individu appartenant à la population considérée ? Quelle est la probabilité, sachant que le test est positif, d’être malade ? Valeur Prédictive Positive : Quelle est la probabilité, sachant que le test est négatif, de n’être pas malade ? Valeur Prédictive négative :

21 Valeur Prédictive Positive : Valeur Prédictive Négative :
Sensibilité : Valeur Prédictive Positive : Valeur Prédictive Négative : Spécificité : Prévalence : p = P(M) M p 1 p Un exemple p  VPP(p) est croissante p  VPN(p) est décroissante

22 Dépendance ou causalité
L’indépendance : une propriété numérique du modèle probabiliste choisi. Lancer d’un dé à 6 faces. Les faces 1 et 2 sont blanches, les faces 3, 4, 5 et 6 sont rouges A: « numéro pair » et B : « face blanche » 1er cas : modèle équiprobable P(A) = , P(B) = , P(AB) = P(AB) = P(A)P(B) A et B sont indépendants 2ième cas p1 = p2 = p3 = p4 = p5 = 0,165 et p6 = 0,175 P(A) = 0,33 + 0,175 = 0,505 P(B) = 0,33 , P(AB) = 0,165 P(A)P(B) = 0,16665 P(AB)  P(A)P(B) A et B ne sont pas indépendants


Télécharger ppt "Statistique Étude d’un caractère Présentation des résultats"

Présentations similaires


Annonces Google