III Probabilités ✔ Mots clés : tirage aléatoire, densité de probabilité ✔ Savoir calculer ces valeurs ✔ Connaître les principales fonctions statistiques.

Slides:

Advertisements

Présentations similaires

L’échantillonnage & Ses Fluctuations

Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =

Probabilités et statistiques au lycée

D.Gile statscrit1 LUTILISATION DES STATISTIQUES INFERENTIELLES DANS LA RECHERCHE : REFLEXIONS CRITIQUES

STATISTIQUE INFERENTIELLE L ’ESTIMATION

Thomas G. Dietterich Approximate Statistical Tests for Comparing

RECONNAISSANCE DE FORMES

Programme de première Probabilités conditionnelles Indépendance

Notion de probabilité.

Le discours indirect.

Les tests d’hypothèses (I)

Inférence statistique

Comparaison de plusieurs moyennes observées

Les TESTS STATISTIQUES

Les TESTS STATISTIQUES

Échantillonnage-Estimation

Dr DEVILLE Emmanuelle J D V 12/07/2006

Notions de variable aléatoire et de probabilité d’un événement

Corrélations et ajustements linéaires.

Les tests d’hypothèses

Probabilités au collège

Nicolas Bourbaki.

variable aléatoire Discrète

Fluctuations d’une fréquence selon les échantillons, Probabilités

2. Expériences aléatoires et modélisation

Tests de comparaison de moyennes

Introduction aux probabilités

DEA Perception et Traitement de l’Information

Comprendre la variation dans les données: Notions de base

La loi des signes.

Les probabilités.

La corrélation et la régression

La puissance statistique

La puissance statistique

La corrélation et la régression

Chapitre 4 La probabilité

Test d'hypothèse pour des proportions:

Probabilités et cannabis

Probabilités et Statistiques

STATISTIQUES – PROBABILITÉS

Fabienne BUSSAC PROBABILITÉS 1. VOCABULAIRE

Probabilités (suite).

Terminale STG 2006 Statistiques à deux variables

Thème: statistiques et probabilités Séquence 6: Probabilités (Partie 1) Capacités : Déterminer la probabilité d’événements dans des situations d’équiprobabilité.

STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES

III Probabilités ✔ Mots clés : épreuve, événement, probabilité, probabilité conditionnelle, théorème de Bayes, événements indépendants ✔ Savoir estimer.

CHAPITRE 3. Acquisition d’information et révision des croyances

Quelques commentaires sur les tests statistiques

Probabilités et Statistiques

Rappel de statistiques

Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.

Échantillonnage (STT-2000)

Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.

Plan 1. Probabilités conditionnelles 2. Indépendance en probabilité

1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.

Chap. 3 Récursion et induction. Les définitions par récurrence consistent à construire des objets finis, à partir d'autres, selon certaines règles. Les.

ECHANTILLONAGE ET ESTIMATION

Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.

Introduction aux statistiques Intervalles de confiance

Cours de Biostatistique

UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.

Enseignante: A. GUERRAB. Introduction : la théorie des probabilités La théorie des probabilités est une science qui a pour but l’étude des expériences.

Chapitre 1 Probabilités 1.

Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.

TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.

Bienvenue au cours MAT-350 Probabilités et statistiques.

Transcription de la présentation:

III Probabilités ✔ Mots clés : tirage aléatoire, densité de probabilité ✔ Savoir calculer ces valeurs ✔ Connaître les principales fonctions statistiques

Induction - Déduction Général (principes) Particulier (applications) Déduction Général Particulier Induction

La démarche statistique est inductive Population Échantillon Induction On parle aussi d'inférence statistique

Le problème de l'induction La population présente une grande variabilité. Cela va empêcher de conclure avec certitude sur la population à partir des données acquises sur un échantillon. Mais on a tout de même acquis de l'information!

Le problème de l'induction Exemple : On veut vérifier que la pose d'un engrais a un effet sur la taille des plantes traitées Exemple 1 Exemple 2 Faible variabilité => peu d'ambiguïté Forte variabilité => on a besoin de statistiques poussées conclure

L'apport des probabilités Variabilité ⇒ Incertitude Données sur l'échantillon ⇒ Information La théorie des probabilités permet de valoriser l'information tout en prenant en compte l'incertitude Comparez : ✗ «Cette voiture peut encore rouler un bon nombre de kilomètres » ✔ « Je vends une bonne centaine de voitures de ce type chaque année, et je peux dire que vous avez 95% de chances de rouler entre et km sans panne majeure. »

Probabilités Notions Lois de probabilité Probabilités conditionnelles Paradoxes

III – 1) Qu'est ce qu'une probabilité ? ✔ Mots clés : Épreuve, événement, probabilité

Cadre de la notion de probabilité Lorsqu'on parle d'une probabilité on doit impérativement indiquer : ➢ de quelle épreuve aléatoire on traite ➢ à quel événement se rapporte cette probabilité

Épreuve Épreuve = Expérience reproductible, mais dont le résultat n'est pas prévisible, et pour laquelle on peut définir l'ensemble des résultats possibles.

Épreuve Épreuve ? OuiNon Vérification si une côte a été polluée par une marée noire Détermination du groupe sanguin d'un individu pris au hasard Sondage : qu'avez vous fait entre 20h et 21h hier soir ? ✗ Non reproductible ✗ Ensemble des résultats possibles non connus ✔

Événement Événement = sous-ensemble des résultats possibles de l'épreuve. Événement élémentaire = événement composé d'un seul résultat. Univers des événements = ensemble de tous les résultats possibles de l'épreuve

Événement Événements 4 événements possibles A,B,AB,O Détermination du groupe sanguin de deux individus pris au hasard 16 événements élémentaires : (A,A),(A,B),(A,AB),...,(B,A),... mais aussi «le premier individu est du groupe A » composé de 4 éléments Concentration de Na + dans un échantillon d'eau quelconque du littoral français Une infinité d'événements mais dont on sait ≥ 0 Détermination du groupe sanguin d'un individu pris au hasard

Combinaison d'événements On peut combiner les événements : Union Intersection Complémentaire

Union d'événements Union des événements A et B = A ∪ B= Événement réalisé lorsque A ou B est réalisé. Exemple : L'individu est de groupe sanguin A ou B Diagramme de Venn :

Intersection d'événements Intersection des événements A et B = A∩B= Événement réalisé lorsque A et B sont réalisés simultanément Exemple : Le groupe sanguin de cet individu est O = {Le groupe sanguin de cet individu est O ou A} ∩ {Le groupe sanguin de cet individu est O ou B} Diagramme de Venn :

Événements incompatibles Événements incompatibles = La réalisation de l'un entraîne la non- réalisation de l'autre. Leur intersection est nulle A∩B= ∅ (similaire à 2 ensembles disjoints) Exemple : {Le groupe sanguin de cet individu est A} et {Le groupe sanguin de cet individu est B} Diagramme de Venn :

Événement contraire Événement contraire de A = Ã = Événement tel que : 1) son union avec A donne l'univers des événements 2) Il est incompatible avec A Exemple : A={L'individu est de groupe sanguin A} Ã ={L'individu n'est pas de groupe sanguin A} Diagramme de Venn : A Ã

Lois de Morgan

Il y a de l'ordre dans le hasard !

Loi empirique des grands nombres Si on répète l'épreuve un grand nombre de fois n en comptabilisant le nombre d'occurrences de l'événement A, n A le rapport n/n A tend vers une valeur comprise entre 0 et 1. Cette valeur est la probabilité associée à l'événement A

Définition fréquentiste de la probabilité Événement A associé à l' épreuve E = limite du rapport du nombre d'occurrences de l'événement A sur le nombre d'épreuves E effectuées

La probabilité est bornée 0 ≤n A ≤n ⇒ 0≤p(A)≤1 Événement certain = événement dont la probabilité vaut 1 Événement impossible = événement dont la probabilité vaut 0 Exemples : p(U)=1 p( ∅ )=0

Probabilité a priori Avant même l'exécution de l'épreuve, il existait une probabilité que l'événement se réalise. C'est la probabilité a priori. L'existence de cette limite en est une démonstration expérimentale.

Probabilité conditionnelle Si on applique des restrictions à l'épreuve, (typiquement en supposant qu'un événement B est déjà réalisé) la probabilité de réalisation de l'événement A pour la nouvelle épreuve est modifiée. La nouvelle probabilité est appelée probabilité conditionnelle de l'événement A sachant B. On note p(A/B)

Probabilité conditionnelle Exemple : On tire au hasard un individu dans une population Or cette population est déjà connue :

Probabilité a priori Sous certaines hypothèses (souvent d'équiprobabilité) on peut déterminer a priori les probabilités d'occurrence d'un événement. Exemple : lancer de dé, jeu du « pile ou face » On emploie alors souvent les mathématiques combinatoires (combinaisons, arrangements,...) C'est ce que vous avez fait en terminale !

Paradoxe des camions prospecteurs Un forage pétrolier coûtant cher, on se livre au préalable à des campagnes de prospection estimant une probabilité de trouver du pétrole ou non en forant à un endroit donné. Cette probabilité conduira en fonction de sa valeur, des coûts, et des réserves estimées (en probabilité elles aussi) à la décision de forer ou non. Un premier camion prospection, en début de campagne de mesure : Probabilité de présence de pétrole : 57% Un deuxième camion prospection, en fin de campagne de mesure : Probabilité de présence de pétrole : 24% Le foreur : « Il n'y a pas de pétrole » Probabilité de présence de pétrole : 0% Quelle est la vraie probabilité ?

Attention au terme « probabilité » Ce paradoxe se résout en remarquant que la notion d'épreuve ne s'applique pas ici. Il n'y a pas de hasard. La «probabilité » décrite ici est simplement due à un manque de connaissance. Pour manier ce concept, on utilise la théorie des possibilités (L. Zadeh, 1978), qui a un formalisme similaire.

Les pièges des probabilités Les probabilités vous réservent beaucoup de surprises ! ✗ On ne connaît pas bien les ordres de grandeur ✗ On ne précise pas toujours les épreuves associées ➔ C'est source de confusion ✗ On n'insiste pas assez sur l'aspect répétitif de ces expérience. ✗ L'événement dont on parle n'est pas pertinent Ces carences sont souvent utilisées lors de la manipulation d'opinion.

Ordre de grandeur mal connu Paradoxe de l'anniversaire « Incroyable. Lors de ma soirée d'anniversaire, il y avait deux personnes ayant la même date de naissance » La probabilité pour que ceci arrive est de plus de 50% (démontrez le). Ce n'est pas incroyable

Confusion des épreuves Paradoxe du prisonnier

Pertinence de l'événement Paradoxe de la voyante « L'astrologie a raison. La rubrique astrologie de mon journal a prédit hier une mauvaise chance à tous les gens de signe balance. Or justement mon petit frère -balance- a été blessé en voiture. » 1) La « prédiction » est très vague 2) Il y a eu en 2003, blessés de la route. Soit en moyenne, blessés par jour. Supposant que 1/12 des blessés sont balances, ça fait une moyenne 25.3 personnes de signe balance blessées sur la route ce jour-là. La prédiction « des balances seront accidentées sur les routes aujourd'hui » sera donc certainement réalisée.

Aspect répétitif de l'épreuve Paradoxe de la pilule contraceptive « Je suis tombée enceinte alors que le taux de réussite de ma pilule contraceptive est de 99.9%. Ce n'est vraiment pas de chance » Ce taux de réussite impressionnant est en fait calculé par rapport. En une année, avec une moyenne de 2 rapports par semaine, quelle est la probabilité d'échec de la contraception ? (52*2) ~ 10%

III – 2) Lois de probabilités ✔ Mots clés : Loi des probabilités totales, Loi des probabilités composées, probabilité conditionnelle, théorème de Bayes.

Loi des probabilités totales

Cas particulier sur un échantillon

Loi des probabilités composées

Événements indépendants A est indépendant de B si

Événements indépendants ? Attention aux tirages aléatoires dans des populations 2 tirages aléatoires successifs dans une population ne sont pas indépendants. C'est surtout visible si la population est de petite taille Exemple : On prend un individu au hasard dans un groupe. C'est un homme. Quelle est la probabilité que le prochain individu tiré au hasard soit une femme ? Groupe A = {6 hommes, 4 femmes} Groupe B = {6000 homes, 4000 femmes}

Loi des probabilités totales Si deux événements A et B sont incompatibles :

Loi des probabilités totales Si deux événements A et B sont incompatibles : Notamment :

Table de contingence Considérons deux types d'événements : A : {l'échantillon d'eau est d'origine marine} B : {l'échantillon d'eau a une concentration en plomb supérieure au seuil sanitaire} On estime les probabilités des événements suivants : A ∩B = {eau marine polluée} Ã∩B = {eau douce polluée} A∩B = {eau marine non polluée} Ã∩B = {eau douce non polluée}

Table de contingence Exemple : méiose Polluée Non polluée Total 1/4 1/2 Marine 1/4 1/2 Douce 1/2 1 Total

III – 3) Les pièges des probabilités ✔ Mots clés : Loi des probabilités totales, Loi des probabilités composées, probabilité conditionnelle, théorème de Bayes.

III – 3) Variables aléatoires ✔ Mots clés :

III – 4) Fonction d'une variable aléatoire ✔ Mots clés :

Sources de variabilité (1) Imprécision La mesure est répétée deux fois dans les mêmes conditions expérimentales Les résultats sont légèrement différents. Ce n'est pas une erreur mais la résultante de toute une série d'événements incontrôlés

Sources de variabilité (1) Imprécision La mesure est répétée deux fois dans les mêmes conditions expérimentales Les résultats sont légèrement différents. Ce n'est pas une erreur mais la résultante de toute une série d'événements incontrôlés

Sources de variabilité Imprécision ≠ Inexactitude Si la mesure effective diffère de la valeur réelle, on parle alors d'inexactitude. Elle souvent due à une erreur dans le protocole expérimental. Elle est aussi introduite lorsqu'on étudie un échantillon peu représentatif de la population. Attention : l'inexactitude peut être masquée par l'incertitude

Sources de variabilité (2) Différences individuelles Les éléments de l'échantillon sont différents.

Sources de variabilité (3) Différences factorielles Les éléments placés dans un environnement différent ont des propriétés différentes. On cherche souvent à caractériser de telles différences.

Sources de variabilité Variabilité résiduelle = imprécision + variabilité individuelle Variabilité totale = variabilité résiduelle + variabilité factorielle

Sources de variabilité Population Facteur = a Facteur = b Facteur = c El 1 El 2 El 3 Incertitude Variabilité individuelle Variabilité factorielle Bruit Information

Repérer les sources de variabilité (1) Imprécision : faire la mesure 2 fois, dans les mêmes conditions, sur le même élément. (2) Variabilité individuelle : faire la mesure dans les mêmes conditions, sur au moins 2 éléments. (3) Variabilité factorielle : faire la mesure dans les mêmes conditions, sur au moins 2 éléments sur 2 niveaux de ce facteur.

Réduire les sources de variabilité (1) Imprécision : Améliorer la technique de mesure (2) Variabilité individuelle : Standardiser l'expérience en ne mélangeant pas différentes groupes dans l'étude. Bien définir la population (3) Variabilité factorielle : Irréductible. La variabilité factorielle est souvent ce que l'on veut mettre en évidence.

La démarche statistique est inductive Population Échantillon Induction

Définitions Population = ensemble sur lequel porteront les conclusions de l'étude. Échantillon = Sous-ensemble de la population dans lequel seront collectées les données de l'étude.

Stratégie de l'estimation Population N éléments Paramètres, 2,... Échantillon n éléments Paramètres,s 2,... Probabilités C n p échantillons de taille n Variables aléatoires X,S 2,... Sondage Constitution des tous les échantillons possibles Estimation

Paradoxe des statistiques Une étude cherche à préciser si un facteur a un effet sur une variable. On pourra : - éventuellement prouver la validité de l'hypothèse - mais jamais l'infirmer ! En effet, dans ce dernier cas, on ne pourra pas conclure car bruit > signal

Test d'hypothèse Test d'hypothèse = détermination de la plausibilité qu'un paramètre d'un modèle prenne des valeurs différentes dans des populations distinctes, afin de mettre en évidence, ou non, un effet d'un facteur expérimental sur une population.

Hypothèse statistique Hypothèse nulle (ou principale) H0 On pose aussi l'hypothèse «alternative » H1

Hypothèse statistique Hypothèse nulle (ou principale) H0 On pose aussi l'hypothèse «alternative » H1

Test d'hypothèse Test d'hypothèse = détermination de la plausibilité qu'un paramètre d'un modèle prenne des valeurs différentes dans des populations distinctes, afin de mettre en évidence, ou non, un effet d'un facteur expérimental sur une population.

Hypothèse statistique Hypothèse nulle (ou principale) H0 On pose aussi l'hypothèse «alternative » H1

Hypothèse statistique Hypothèse nulle (ou principale) H0 On pose aussi l'hypothèse «alternative » H1