Chapitre 1 Probabilités 1.

Slides:



Advertisements
Présentations similaires
Algorithmique et simulation
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
CHAPITRE 7 Probabilités
Probabilités et statistiques au lycée
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Notions de probabilité
Programme de première Probabilités conditionnelles Indépendance
Notion de probabilité.
Inférence statistique
Les TESTS STATISTIQUES
Dr DEVILLE Emmanuelle J D V 12/07/2006
Notions de variable aléatoire et de probabilité d’un événement
Remy JOST IG mathématiques
Probabilités au collège
Statistiques et probabilités en première
Statistique descriptive
variable aléatoire Discrète
Statistiques et probabilité :
Enseigner les Probabilités en Bac Pro 3 ans
Fluctuations d’une fréquence selon les échantillons, Probabilités
Quelques calculs de probabilités
Les PROBABILITÉS conditionnelles
2. Expériences aléatoires et modélisation
Probabilités.
Probabilités et statistiques
Les lois des probabilités
Mathématiques Les statistiques et probabilités en STI2d/STL
Groupe 1: Classes de même intervalle
Introduction aux probabilités
Comprendre la variation dans les données: Notions de base
Les probabilités.
Cours ‘ Interprétation de la preuve ’ (5)
Les bases des probabilités
Conception et analyse des algorithmes Les algorithmes probabilistes
Objectifs: Etudier l’hétérogénéité des caractères au sein de la composante environnementale de la variance résiduelle Pour cela on tente de minimiser les.
Contrôle « rapide » Indiquer votre série GAUCHE ou DROITE
Des épreuves pratiques aux TP Des exemples en probabilités
Probabilités Série n°1.
Calcul de probabilités
Introduction aux probabilités
Méthodes de Biostatistique
CHAPITRE 6 LES PROBABILITES.
Probabilités et cannabis
Micro-intro aux stats.
Probas-Stats 1A novembre 10 1 Probabilités et Statistiques Année 2010/2011
M2 Sciences des Procédés - Sciences des Aliments
STATISTIQUES – PROBABILITÉS
Fabienne BUSSAC PROBABILITÉS 1. VOCABULAIRE
Probabilités et Statistiques
Terminale STG 2006 Statistiques à deux variables
Thème: statistiques et probabilités Séquence 6: Probabilités (Partie 1) Capacités : Déterminer la probabilité d’événements dans des situations d’équiprobabilité.
Principales distributions théoriques
Rappels Variables nominales :
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Chapitre 4 Variables aléatoires discrètes
Probabilités et Statistiques
Post-optimisation, analyse de sensibilité et paramétrage

MODULE FTH 2007 Diversité génétique
Probabilités et Statistiques
Plan 1. Probabilités conditionnelles 2. Indépendance en probabilité
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ECHANTILLONAGE ET ESTIMATION
Evaluation des examens complémentaires dans la démarche médicale
Introduction aux statistiques Intervalles de confiance
Chapitre 3 Lois de probabilité 1. Lois discrètes 2. Loi de Bernoulli (ou loi alternative simple) variable de Bernoulli On appelle variable de Bernoulli.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Transcription de la présentation:

Chapitre 1 Probabilités 1

Introduction Un exemple simple : On a découvert un nouveau traitement contre une maladie mortelle  Etape 1: Mise en évidence de l’effet positif du traitement chez la souris Sans traitement: 1 chance sur 2 de survie pour les souris Que fait-on maintenant ? 2

Introduction On va prendre un certain nombre de souris, ici N=20, à qui on donne le traitement On observe 13 souris survivantes Le traitement a-t-il un effet bénéfique ? (augmentation de la probabilité de survie des souris?) 3

Introduction Aurait-on conclu à un effet bénéfique si on avait observé 11 survivants? 12 survivants? 14? 15? Où se situe la limite? 4

Introduction En s’appuyant sur du calcul de probabilité, les statistiques permettent de répondre à cette question Nombre de cas de survie Pas d’effet du traitement où effet négatif 5

Introduction En s’appuyant sur du calcul de probabilité, les statistiques permettent de répondre à cette question Nombre de cas de survie Pas d’effet du traitement où effet négatif Effet net 6

Introduction En s’appuyant sur du calcul de probabilité, les statistiques permettent de répondre à cette question Nombre de cas de survie Pas d’effet du traitement où effet négatif Effet net Impossible de conclure intuitivement => statistiques 7

Introduction En s’appuyant sur du calcul de probabilité, les statistiques permettent de répondre à cette question Nombre de cas de survie Pas d’effet du traitement où effet négatif Effet net Impossible de conclure intuitivement => statistiques MORALITE: les statistiques permettent de tirer le maximum d’informations sur nos données 8

Introduction Sur quel critère décide-t-on que 13 est un résultat probant? 9

Introduction Sur quel critère décide-t-on que 13 est un résultat probant? On souhaiterait connaître la probabilité qu’un placebo donne de si bons résultats (cad avoir au moins 13 survivants). Comment calculer cette probabilité? Il faudrait faire l’expérience un très grand nombre de fois pour voir à quelle fréquence on atteint « par hasard » un résultat aussi bon que celui du traitement. Problèmes: - c’est long! - ça coûte cher! 10

Introduction Solution alternative: Sans traitement les chances de survie sont les mêmes qu’en jouant à pile ou face  Modèle de la pièce: au lieu d’inoculer la maladies à 20 souris on lance une pièce 20 fois 11

Introduction Solution alternative: Sans traitement les chances de survie sont les mêmes qu’en jouant à pile ou face  Modèle de la pièce: au lieu d’inoculer la maladies à 20 souris on lance une pièce 20 fois Avantages: - ça ne coûte pas cher - c’est moins long 12

Introduction Solution alternative: Sans traitement les chances de survie sont les mêmes qu’en jouant à pile ou face  Modèle de la pièce: au lieu d’inoculer la maladies à 20 souris on lance une pièce 20 fois Avantages: - ça ne coûte pas cher - c’est moins long Inconvénients: - c’est quand même un peu long - ça marche parce que la probabilité est de 50% 13

Introduction Dernière option: les mathématiques On calcule directement la probabilité à l’aide de la loi binomiale (cf plus loin)  p = Avantages: - ça ne coûte pas cher - c’est rapide - on a accès à la probabilité exacte - ce sont des maths et on aime ça! 14

Objectifs de la partie proba-stats 15 Contrairement à la science physique, la biologie doit gérer en permanence avec la variabilité individuelle. Exemple: - Chute d’un corps: il suffit de mesurer l’écart du point de chute à la verticale pour connaître le sens et la force du vent - effet du tabagisme sur le taux de cholestérol: il ne suffit pas de comparer le taux de cholestérol chez un fumeur et un non-fumeur  l’objectif de cette partie est d’initier à l’analyse de données en biologie.

Objectifs de la partie proba-stats 16 - exemple tabagisme/cholestérol: mesure du taux de cholestérol chez 100 individus F2.11NF1.57F2.27F1.48NF0.99NF1.65NF1.73NF1.99NF2.15NF2.13 NF1.49F1.87NF1.89NF2.51F1.75F1.83F2.05NF1.87F2.24F2.52 NF1.62F2.33F0.97F1.80F2.23NF1.60NF1.59NF2.19NF2.63NF2.31 NF2.54NF1.57F2.06NF1.30NF1.83F2.29NF2.34F1.86F1.72F1.12 F1.93F1.39NF2.79NF2.15NF2.61NF1.87NF0.81F1.16NF2.13F2.34 F2.19F1.94F2.50NF2.77F1.68F2.24F2.49NF1.48NF1.99NF2.40 NF2.04NF1.96NF1.20F2.35F0.83F2.33NF2.10F2.12NF1.70F2.31 F1.68F2.24F1.96F2.97NF1.38NF1.96NF2.13NF1.37F3.06NF2.65 NF1.72NF 1.7NF1.65F2.25F2.52F2.44F2.60F1.82F1.87F2.16 F2.22NF1.92NF1.48NF2.93NF1.94NF3.15F1.86F1.52NF1.29NF1.66 NF1.52NF1.78F1.38F1.83F2.18NF2.26NF1.93NF1.41F2.88F1.92 NF2.39F1.96F2.14F1.43NF2.47NF1.99F1.36F1.48NF2.16NF0.77 NF2.28F2.76NF1.78NF1.89NF0.93F2.45NF1.16NF1.79F1.44F2.23 F1.58NF1.69F2.02F2.59NF1.67F2.02F1.64NF2.08NF2.31F2.05 F1.86F1.32NF1.81NF1.44F1.64NF1.44NF2.14NF1.94NF2.63NF1.70 NF1.40NF2.23F1.76NF2.31NF1.49NF2.24NF1.72F2.53NF1.55F1.67 F0.89F1.54NF2.18NF1.69F1.90NF1.99NF1.33F1.87F2.06NF1.45 NF2.49F2.01NF2.36F2.27NF2.76NF1.86F2.53NF1.24F1.93F1.97 F1.74NF1.68NF3.05F1.45NF1.98F2.63NF1.64NF2.18NF1.41NF2.18 F2.16NF2.26F1.32NF2.04NF2.61F2.93F1.99F2.03F2.59F1.83

Objectifs de la partie proba-stats 17 On ne peut pas laisser les données comme ça (manque de visibilité)  Besoin d’outils de synthèse (moyenne, graphique,…) STATISTIQUES DESCRIPTIVES

Objectifs de la partie proba-stats 18 On aimerait savoir s’il existe une différence liée au tabagisme au-delà de la variabilité individuelle STATISTIQUES INFERENTIELLES Mise en équation du problème biologique (modélisation statistique) Calcul de probabilités Tests statistiques/ estimation

Objectifs de la partie proba-stats 19 Programme des cours/TD/TT: - Calcul de probabilités - Statistiques descriptives: résumer des données par des indicateurs (moyennes, variances,…) et les représenter par des graphes (histogrammes,…) - Statistiques inférentielles: 1) estimation d’une moyenne et d’une proportion et incertitude liée à ces estimations 2) ma moyenne/fréquence est-elle conforme à ce que j’attends? 3) y a-t-il un écart de moyenne/fréquence entre deux groupes? 4) liaison entre variables (ex: réponse à un traitement / stade d’un cancer)

Evaluation 20 2 QCM 2*10% de la note finale 1 problème: 25% de la note finale TTs 20% de la note finale en comptant la partie analyse sur les bactéries

Introduction De manière générale: Les modèles mathématiques permettent de modéliser des expériences aléatoires (cad dont le résultat ne peut être prévu avec une totale certitude). Quelques exemples : 21

Situation mathématique Résultat observable ExpérienceQuestion Pièce à pile ou face Séquence de P et F (ou 0 et 1) Prélèvement de n individus dans une population Sex-ratio = 1 ? Nombre de survivants Taux de succès d’une thérapie? Présence/absence d’une espèce Habitat de l’espèce 22

Situation mathématique Résultat observable ExpérienceQuestion Lancer d’un dé Un entier k  {1,...,6} Période de reproduction d’une espèce (6 périodes de 2 mois) Saison de reproduction priviligiée pour l’espèce? Positionnement aléatoire de points dans un carré n positions Distribution spatiale de n individus (GPS) Agrégation dans certains milieux ? 23

Expérience aléatoire: expérience dont on ne peut pas prédire le résultat de manière certaine Ensemble Ω = tous les résultats possibles d’une expérience aléatoire donnée. Ex: lancé d’un dé: Ω = {1, 2, 3, 4, 5, 6} La notion d’ensemble 24

Déterminé par un critère de réussite de l’expérience Exemple: on jette un dé « tirer 1» = événement élémentaire (marche aussi avec 2, 3, 4, 5 ou 6) « tirer un nombre impair » = événement composé On notera cet événement A = {1, 3, 5}  Ω. La notion d’événement 25

Représentation sous forme de patate Ensemble des événements possibles  A Exemple : dé à six faces  {1,2,3,4,5,6}  {1,3,5} 26

Quelques notations  A événement élémentaire  {3}, événement impossible  événement certain  événements incompatibles  {1,5} disjoints de  {2,6} B 27

Evénements complémentaires : Partie de  complémentaire de A  {2,4,6} paire  A 28

Opérations A = {2,4,6} (paire) ; B={3,6} (multiples de 3) A  B = {2, 3, 4, 6}  : Réunion A B Ω 29

Opérations A = {2,4,6} (paire) ; B={3,6} (multiples de 3) A  B = {6}  : Intersection A B Ω 30

Définition et propriétés d’une probabilité positivité : par exemple: échelle : additivité : d’où 31 une probabilité est toujours comprise entre 0 et 1

Evénements équiprobables Ω = {1,..,6} Exemple du lancé de dé: 6 résultats élémentaires équiprobables Or Donc Généralisation facile: P(résultat élémentaire) = 1 / nombre de résultats possibles 32

Théorème des probabilités totales A B A  B 33

Probabilités conditionnelles Exemple: Population d’élevage avec 30 mâles et 25 femelles. 18 mâles et 4 femelles ont un poids supérieur à 3 Kg. Je considère une femelle au hasard dans ma population. Quelle est la probabilité que son poids soit supérieur à 3 Kg? Raisonnement faux: 55 individus dont 22 font plus de 3 Kg donc P = 22/55 = 0.4 Ce raisonnement est faux car il ne prend pas en compte l’information sur le sexe. On parle alors de probabilités conditionnelles. 34

Probabilités conditionnelles Intuitivement, cette probabilité vaut P= = En divisant en haut et en bas par le nombre total d’individus, et en écrivant F=« l’individu est une femelle », X = « avoir un poids supérieur à 3 Kg » : On parle alors de la probabilité d’ « avoir un poids > 3 Kg (X) » sachant que (ou conditionnellement au fait que) « l’individu est une femelle (F) » 4 25 Nombre de femelles dont le poids est supérieur à 3 Kg Nombre de femelles total 35

Jeu de 32 cartes : Probabilité de tirer successivement 2 valets ? A : 1ère carte est un valet B : 2ème carte est un valet avec Probabilités conditionnelles On peut retourner la formule: 36

Evénements indépendants Exemple de valet mais avec remise de la 1ère carte B réalisé ne modifie rien 37

Décomposition de la probabilité d’un événement Mathématiquement: (A et B deux événements) En utilisant la formule des probabilités conditionnelles: Généralisation: B 1,…, B n n événements disjoints et donc la réunion vaut  A B B ABAB ABAB 38

Décomposition de la probabilité d’un événement Un exemple: dans un lycée, on sait que - 30% de Term. L, 25% d’ S et 45% de ES. - 65% des L font du grec - 15% des S font du grec - 5% des ES font du grec Probabilité qu’un élève pris au hasard fasse du grec? G = événement « faire du grec » P(G) = P(G/L) P(L) + P(G/S) P(S) + P(G/ES) P(ES) = 0.65* * *0.45 =

Décomposition de la probabilité d’un événement Remarque: C’est la formalisation mathématique de ce que l’on fait intuitivement en faisant des arbres X1X1+X2 L ES S G pasG G pasG G pasG 40

Exemple: test sanguin pour un virus (prévalence = 0.01 %) : - positif dans 99% des cas si infecté - 1% de faux positifs Je viens de faire les test, il est positif: quelle est la probabilité que je sois porteur du virus ? Théorème de Bayes Population Deux types de positifs: Vrais positifs Faux positifs  combien de chaque ? 41

Théorème de Bayes V = {la personne testée est porteuse du virus} T = {la personne testée a un test positif} Mise en équation de l’énoncé: P(T / V) = 0.99 P(T / nonV) = 0.01 P(V) = Population = Nombre de vrais positifs = * * 0.99 = 99 Nombre de faux positifs = * * 0.01 = 9999 Proportion de vrais positifs parmi les positifs = 99 / ( ) = 0.01 Conclusion: comme il y a environ 100 fois plus de faux positifs que de vrais positifs, même si je suis positif au test je n’ai qu’une chance sur 100 d’être malade! 42

Théorème de Bayes Théorème de Bayes généralisé B 1,…, B n n événements disjoints et donc la réunion vaut  Ce calcul découle du théorème de Bayes: Soient A et B deux événements, alors 43