Statistique Étude d’un caractère Présentation des résultats

Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Probabilités et statistiques au lycée
Programme de première Probabilités conditionnelles Indépendance
Test statistique : principe
Statistiques à une variable
Statistique et probabilité Série n° 1
Les Variables statistiques continues
5 critères de qualité d'un test
Situation du problème :
ASSOCIATION entre caractères qualitatifs
1. Les caractéristiques de dispersion. 11. Utilité.
ASSOCIATION entre caractères qualitatifs

Notions de variable aléatoire et de probabilité d’un événement
Moyenne, écart type et incertitude de mesure.
Statistique et probabilités au collège
Statistique et probabilités
Probabilités au collège
Statistique descriptive
Construction de Box-Plot ou diagrammes en boîtes ou boîtes à moustaches Construire une boîte à moustaches …
1 Analyse de la variance multivariée Michel Tenenhaus.
variable aléatoire Discrète
Quelques calculs de probabilités
Les PROBABILITÉS conditionnelles
Christelle Scharff IFI 2004
Probabilités.
Septième étape : travailler avec des graphes probabilistes
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Groupe 1: Classes de même intervalle
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
TECHNIQUES QUANTITATIVES APPLIQUEES A LA FINANCE
Statistique descriptive
Baccalauréat professionnel trois ans
La traitement des données
La Distribution des Données
L’OFFRE ET LA DEMANDE.
Contrôle « rapide » Indiquer votre série GAUCHE ou DROITE
Les regroupements numériques et les diagrammes à boîte

Aire d’une figure par encadrement
Coefficient de corrélation linéaire
Let’s Train ! Cet exercice est un questionnaire à choix multiples constitué de plusieurs questions indépendantes . Pour chacune d’elles, une seule des.
Régression linéaire multiple : hypothèses & interprétation
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Elaboré par M. NUTH Sothan
1 - Programme de Seconde (juin 2009) Statistique et probabilités
On cherche des renseignements sur p.
Probabilités et Statistiques
1 Introduction à la théorie des tests. 2 Plan I- choix entre 2 paramètres de tendance centrale Choix entre 2 proportions pour un caractère qualitatif.
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
Introduction à l’analyse statistique
Chapitre 3 :Algèbre de Boole
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Christophe Genolini INSERM U669 / Université de Paris X.
Rappels de statistiques descriptives
Fabienne BUSSAC STATISTIQUES 1. VOCABULAIRE
Probabilités et cannabis
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Évaluation des examens complémentaires
STATISTIQUES – PROBABILITÉS
Seconde partie Cours de seconde
Terminale STG 2006 Statistiques à deux variables
Thème: statistiques et probabilités Séquence 6: Probabilités (Partie 1) Capacités : Déterminer la probabilité d’événements dans des situations d’équiprobabilité.
Statistique Descriptive Les Paramètres de Tendance Centrale
Statistiques Première partie Cours de première S.
BIOSTATISTIQUES Définitions.
Mesures de description des valeurs des variables
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Transcription de la présentation:

Statistique Étude d’un caractère Présentation des résultats Calcul des indicateurs Interprétation Étude simultanée de deux caractères Tableau de contingence Conditionnement Ajustement

Étude d’un caractère 1. Tri des données Utilisation des outils Diagramme en tiges et feuilles

Soit une série de 45 valeurs de taux d’hémoglobine (en g.L1) 105, 120, 125, 126, 126, 130, 132, 133, 134, 135, 138, 138, 141, 144, 146, 148, 148, 148, 149, 150, 150, 150, 151, 151, 153, 153, 154, 154, 155, 156, 156, 158, 160, 160, ….., 179 Médiane Tige Feuilles 10 5 1 11 12 0 5 6 6 13 0 2 3 4 5 8 8 14 1 4 6 8 8 8 9 19 15 0 0 0 1 1 3 3 4 4 5 6 6 8 32 16 0 0 3 4 4 5 6 8 8 41 17 0 2 2 9 45 Quartiles : 1er quartile : la plus petite valeur observée telle que, au moins 25% des données lui soient inférieures ou égales. Site Euler : Lexique et Fiches n° 470

Indicateur de centralité Indicateur de dispersion 2. Caractérisation d’une série statistique Indicateur de centralité Indicateur de dispersion Médiane Quantiles, intervalle interquartile….. Moyenne Écart type

Diagramme en boîte Fiches Euler : 470 – 1460 – 1461 min D1 Q1 me Q3 D9 Tige Feuilles 10 5 1 11 12 0 5 6 6 13 0 2 3 4 5 8 8 14 1 4 6 8 8 8 9 19 15 0 0 0 1 1 3 3 4 4 5 6 6 8 32 16 0 0 3 4 4 5 6 8 8 41 17 0 2 2 9 45 Diagramme en boîte Fiches Euler : 470 – 1460 – 1461 min D1 Q1 me Q3 D9 max

Comparaison de 2 séries

Fréquences par rapport à la population totale Séries statistiques à deux variables 1. Deux variables qualitatives : étude fréquentielle Groupe sanguin et facteur Rhésus (10 000 naissances dans des maternités de France) effectifs O A B AB Total R 3 566 3 968 753 385 8672 R– 576 578 110 64 1328 4142 4546 863 449 10 000 Fréquences par rapport à la population totale fréquences O A B AB Total R 0,3566 0,3968 0,0753 0,0385 0,8672 R– 0,0576 0,0578 0,0110 0,0064 0,1328 0,4142 0,4546 0,0863 0,0449 1 Fréquences marginales : f (O) = 0,4142 f (R+) = 0,8672 Fréquences partielles ou conjointes : f (O  R) = 0,3566

Fréquences conditionnelles Fréquences par rapport à une sous - population fréquences O A B AB Total R 0,3566 0,3968 0,0753 0,0385 0,8672 R– 0,0576 0,0578 0,011 0,0064 0,1328 0,4142 0,4546 0,0863 0,0449 1 Fréquence de R+ sachant O : Conséquence : Fréquence de O sachant R+:

Arbre de répartition des fréquences AB f (OR+) =f O(R+)f (O) f (O)

2. Deux variables quantitatives Nuage de points, point moyen Ajustement Sur chaque individu d’une population de n individus, on mesure deux variables, x et y. Les valeurs prises par x et y pour un individu donné sont notées xi et yi. On cherche s’il existe une relation simple entre x et y. Exemple

Probabilités Introduction : simulation d’épreuves aléatoires et fluctuation d’échantillonnage Existence d’un modèle théorique, loi de probabilité Conditionnement et indépendance

1. Existence d’un modèle théorique F G Nombre de Filles F ............................ 4 G ............................ 3 F ............................ 3 G ............................ 2 F ............................ 2 G ............................ 1 F ............................ 1 G ............................ 0 1. Existence d’un modèle théorique familles de 4 enfants : nombre de filles Simulation Valeurs possibles 1 2 3 4 probabilités

2. Probabilités conditionnelles Groupes sanguins et facteur rhésus Total R 3566 3968 753 384 8672 R– 576 578 110 64 1328 4142 4546 863 449 10 000 Choix d’une personne au hasard dans la population P(O) = 0,4142 P(R) = 0,8672 P(O  R) = 0,3566 Probabilité de R+ sachant O : Conséquence : Propriété : La probabilité sachant O est une nouvelle probabilité sur le même univers. Fiches Euler : 326 - 436

3. Indépendance f RH+ (O)  f (O) f O (RH+)  f (RH+) Fréquences conjointes et fréquences marginales fréquences O A B AB Total R 0,3566 0,3968 0,0753 0,0385 0,8672 R– 0,0576 0,0578 0,011 0,0064 0,1328 0,4142 0,4546 0,0863 0,0449 1 Fréquences conditionnelles, selon le groupe sanguin Fréquences conditionnelles, selon le facteur rhésus fO(...) fA(...) fB(...) fAB(...) RH+ 0,861 0,873 0,857 RH– 0,139 0,127 0,143 Total 1 O A B AB Total fRH+(...) 0,411 0,458 0,087 0,044 1 fRH–(...) 0,434 0,435 0,083 0,048 f RH+ (O)  f (O) f O (RH+)  f (RH+)

Définition de l’indépendance Deux événements A et B, tels que P(A)  0 et P(B)  0 sont indépendants si et seulement si PB(A) = P(A). La réalisation de B ne modifie pas la valeur de la probabilité de A. Soit deux événements A et B, tels que P(A)  0 et P(B)  0. Deux événements A et B, tels que P(A)  0 et P(B)  0 sont indépendants si et seulement si P (AB) = P(A)P(B). Fiche Euler : 446

Nombre de filles dans une famille de 4 enfants A : « l’ainé est une fille » B : « la famille compte exactement deux filles » Les événements A et B sont indépendants. C : « la famille compte au moins deux filles » Les événements A et C ne sont pas indépendants

1er cas : Tirages sans remise Arbre de probabilité Deux tirages successifs dans une urne contenant 3 boules blanches et deux boules noires. 1er cas : Tirages sans remise N1 B2 B1 N2

2ème cas : Tirages avec remise Deux tirages successifs dans une urne contenant 3 boules blanches et deux boules noires. 2ème cas : Tirages avec remise N1 B2 B1 N2 Tirages indépendants

Application : Test de dépistage On dispose d’un test de dépistage pour une maladie qui peut affecter les individus d’une certaine population. Événements : M : « être malade » T + : « présenter un test positif » T – : « présenter un test négatif » Malades Non Malades Total Test Positif Vrais Positifs Faux Positifs Test Négatif Faux Négatifs Vrais Négatifs

Étalonnage : données statistiques et définition d’un modèle Sensibilité : Prévalence : p = P(M) Spécificité : Utilisation du test et calcul de probabilités Comment interpréter le résultat d’un test qui aurait été pratiqué sur un individu appartenant à la population considérée ? Quelle est la probabilité, sachant que le test est positif, d’être malade ? Valeur Prédictive Positive : Quelle est la probabilité, sachant que le test est négatif, de n’être pas malade ? Valeur Prédictive négative :

Valeur Prédictive Positive : Valeur Prédictive Négative : Sensibilité : Valeur Prédictive Positive : Valeur Prédictive Négative : Spécificité : Prévalence : p = P(M) M p 1 p Un exemple p  VPP(p) est croissante p  VPN(p) est décroissante

Dépendance ou causalité L’indépendance : une propriété numérique du modèle probabiliste choisi. Lancer d’un dé à 6 faces. Les faces 1 et 2 sont blanches, les faces 3, 4, 5 et 6 sont rouges A: « numéro pair » et B : « face blanche » 1er cas : modèle équiprobable P(A) = , P(B) = , P(AB) = P(AB) = P(A)P(B) A et B sont indépendants 2ième cas p1 = p2 = p3 = p4 = p5 = 0,165 et p6 = 0,175 P(A) = 0,33 + 0,175 = 0,505 P(B) = 0,33 , P(AB) = 0,165 P(A)P(B) = 0,16665 P(AB)  P(A)P(B) A et B ne sont pas indépendants