La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Loi de probabilité : élément central de la statistique La détermination de la loi de probabilité suivie par une variable va servir aux calculs de probabilité

Présentations similaires


Présentation au sujet: "Loi de probabilité : élément central de la statistique La détermination de la loi de probabilité suivie par une variable va servir aux calculs de probabilité"— Transcription de la présentation:

1 Loi de probabilité : élément central de la statistique La détermination de la loi de probabilité suivie par une variable va servir aux calculs de probabilité de réalisation d'évènements, à la déduction et à l'inférence statistiques. C - Lois de probabilités C - Lois de probabilités 1. Préambule

2 Déduction : prédire, à partir d'une population connue ou supposée connue, les caractéristiques des échantillons qui en seront prélevés Induction (inférence) : prédire les caractéristiques d'une population inconnue à partir des statistiques déterminées dans un échantillon représentatif de cette population. Extrapolation des observations réalisées dans un échantillon à l'ensemble de la population C - Lois de probabilités C - Lois de probabilités 1. Préambule

3 Population taille ? Inaccessible : caractéristique théorique ou attendue Echantillon taille : n (n_échantillon) représentatif : observée On part des seules informations disponibles : et n Un tel échantillon va-t-il nous permettre de préciser la population dont il pourrait être issu ? Risque seuil Risques o et ENCADREMENT DE On étudie les populations à partir déchantillons (représentatifs)

4 Epreuve : expérience - qui peut être reproduite dans les mêmes conditions autant de fois que l'on veut, - dont le résultat n'est pas prévisible - et pour laquelle on peut définir l'ensemble des résultats possibles. L'événement : est un sous ensemble des résultats possibles de l'épreuve. C - Lois de probabilités C - Lois de probabilités 1. Préambule

5 C - Lois de probabilités 1.Préambule 2.Quelques rappels sur les probabilités 3.Définition ; 2 cas à considérer 4.Exemples 5.Loi binomiale 6.Loi de Poisson 7.Calcul de probabilités dans le cas des lois continues 8.Loi normale 9.Passage dune loi binomiale à une loi normale

6 Une épreuve : lancer d'une pièce de 1 Euro - Evénement A : le résultat est 'Face' - n A : fréquence de réalisation de l'événement A - N : nombre de jets - Fréquence relative de réalisation de l'événement A : f A = n A /N C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités Lorsque N est très grand, f A se stabilise à une valeur constante qui est la probabilité de réalisation de l'événement A Evènement impossible (ne se réalisera jamais en pratique) : C : la pièce retombe en équilibre sur la tranche (ni 'pile' ni 'face') P(C)=0

7 P(A) = lim n A /N N C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités P(A) = f A incertitude/erreur sur l'estimation de la probabilité à partir des données d'un échantillon 0 N Loi des grands nombres (Jacques Bernoulli)

8 C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités

9

10 P(A B) = P(A) + P(B) - P(A B) P(A B) = 0 P(A / B ) = P(A B) / P(B) Théorème des probabilités totales Evènements incompatibles : Théorèmes Théorème des probabilités composées Evènements indépendants Exemples, empruntés à l'univers du jeu, servant de rappels Application des probabilités composées à un problème de biotechnologie C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités P(A / B ) = P(A / B ) = P(A) P(A B) = P(A).P(B)

11 C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités Exercice 1 On dispose d'un jeu de 32 cartes. A/ On tire une carte au hasard. Calculer les probabilité des évènements suivants : - tirer une carte rouge ou une carte noire - tirer l'as de coeur - tirer un roi et une reine - tirer un valet ou un as - tirer un roi ou un trèfle - tirer un as ou une carte rouge B/ On tire successivement 2 cartes (tirage non exhaustif / avec remise). Calculer les probabilités des évènements suivants : - tirer 2 fois le roi de pique - tirer 2 as - tirer un as et un valet - tirer un roi et un trèfle - tirer un as et une noire

12 C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités Exercice 2 On dispose d'un jeu de 54 cartes (Poker). Dans une main de 10 cartes, calculer les probabilités dobtenir exactement les évènements suivants : - un carré d'As ; - full aux dames par les valets (3 dames et 2 valets) ; - une suite (ex : 10, valet, dame, roi, as). Exercice 3 Un élevage (50 animaux) est composé de 10 brebis beiges, 12 brebis noires, 15 moutons blancs, 5 moutons beiges à tête noires. Calculer la probabilité d'obtenir (exactement) 5 moutons blancs et 2 brebis lors d'une capture de 10 animaux (au hasard).

13 C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités

14 Exercice 4 : "Séquences de tetrapeptides" On s'intéresse à des peptides de 4 résidus d'acide aminés (parmi les 20 plus fréquemment rencontrés). Répondez aux questions suivantes en considérant, les 2 situations : les 4 acides aminés constituant les peptides sont tous différents ou, au contraire peuvent être quelconques. A combien de peptides différents peut-on s'attendre, à priori? Trouver la probabilité d'obtenir un peptide contenant : 2 résidus proline exactement ; 1 résidu proline et 3 résidus hydrophobes 4 résidus hydrophobes ; au moins 2 résidus aromatiques ; 1 résidu hydrophile et 3 résidus hydrophobes ; le peptide de séquence MAGI ; les résidus dans les proportions suivantes A : 50%, M : 25% et I : 25%

15 C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités Détaillons un calcul Soit A, lévènement {" le peptide contient 2 résidus proline"} Soit B = {" présence dun résidu proline à une position donnée"} Soit C = {" présence dun résidu, autre que proline, à une position donnée"} ; C=NON(B) On ne considère toutes les séquences possibles dans cet exercice! Dans le cas où les 2 résidus non proline sont quelconques (équivalent tirage non exhaustif, avec remise) 1 résidu proline parmi les 20 aas : P(B)=1/20 Il reste 19 aas, autres que proline à choisir sur les autres positions : P(C)=19/20 ; P(C)=P[non(B)]=1-1/20 P(A) = (1/20) 2 x (19/20) 2 x 6 Il y a en effet 6 combinaisons de séquences possibles : proline en positions : 1 et 2, ou 1 et 3, ou 1 et 4, ou 2 et 3, ou 2 et 4, ou 3 et 4 => nombre de combinaisons de 2 éléments parmi 5) P(A) = 6x19 2 /20 4 = 7,20 % Chaque évènement est indépendant (ce qui explique quon multiplie simplement les probabilités) Dans le cas où les 2 résidus non proline sont différents La proline peut toujours être présente en 1 ère, 2 ème, 3 ème ou 4 ème position => 6 possibilités Il reste 19 aas, autres que proline à choisir sur la première des positions non occupée par une proline et enfin 18 aas, autres que proline à choisir sur la dernière position possible parmi 18 résidus (2 étant déjà pris). Ainsi, P(A) = 1/20 x 1/20 x (19/19) x (18/18) x 6 P(A) =6/20 2 = 1,50 %

16 C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités Détaillons un calcul Soit A = {" le peptide contient 1 résidu proline et 3 résidus hydrophobes"} Dans le cas où les 4 résidus sont quelconques 1 résidu proline parmi les 20 aas : 1/20 Parmi les 20 aas les plus fréquents, 8 sont classés comme hydrophobes (A, I, L, M, F, W, Y, V) : 8/20 La proline peut être présente en 1 ère, 2 ème, 3 ème ou 4 ème position => 4 combinaisons possibles P(A) = 1/20 x (8/20) 3 x 4 P(A) = 1/5 x (8/20) 3 = 1,28 % Chaque évènement est indépendant (ce qui explique quon multiplie les probabilités entre elles) Nbre de peptides : 4x8 3 = 2048 Dans le cas où les 4 résidus sont différents La proline peut toujours être présente en 1 ère, 2 ème, 3 ème ou 4 ème position => 4 possibilités Parmi les 19 aas, autres que proline, 8 résidus classés comme hydrophobes (A, I, L, M, F, W, Y, V) : 8/19 Le 2 ème résidus placé, parmi les 18 aas non encore considérés, il en reste 7 hydrophobes : 7/18 Le 3 ème résidus placé, parmi les 17 aas non encore considérés, il en reste 6 hydrophobes : 6/17 P(A) = 1/20 x (8/19) x (7/18) x (6/17) x 4 P(A)= 1/20 x (8/19) x (7/18) x (6/17) + 8/20 x (1/19) x (7/18) x (6/17) + 8/20 x (7/19) x (1/18) x (6/17) + 8/20 x (7/19) x (6/18) x (1/17) P(A) = 4x8x7x6/20x19x18x17 = 1,16 % ; Nbre de peptides : 4x19x18x17

17 C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités On peut retrouver ce résultats en utilisant les arragements A(n,p) Dans le cas où les 4 résidus sont différents Les mêmes résidus placés dans la séquence dans un ordre différent donnent des peptides différents! L'ordre importe donc dans ce problème d'où l'utilisation des arrangements A(n,p) A(n,p) = n!/(n-p)! Il y a A(8,3) arrangements possibles de 3 hydrophobes parmi 8 Et il y a toujours C(4,1) combinaisons possibles dune proline dans une séquence de 4 aas C(n,p)= n!/p!(n-p)! Doù: P(A) = (4!/[3!1!] x 1!/0! x 8!/5!)/(20!/16!) P(A) = (4 x 1 x 8 x 7 x 6) / ( 20 x 19 x 18 x 17) On retrouve bien : P(A) = 4x8x7x6/20x19x18x17 ; Nbre de peptides : 4x1x19x18x17

18 C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités

19 Exercice 5 "L'examen de TP" On fait passer l'examen de TP de biochimie aux étudiants de master d'une grande université (250 inscrits). L'examen consiste en 2 manips, M1 et M2, notées chacune sur 10. Un étudiant "réussit" une manip s'il obtient au moins la note de 5/10 à cette manip. Un étudiant est reçu à lexamen de TP sil obtient la note de 10/20 en ayant réussi les deux manips. On constate que la probabilité de réussir la manip M1 est de 0,5. La probabilité de réussir la manip M2 est, quant à elle, de 0,6. Enfin, la probabilité qu'un étudiant réussisse la manip M2 alors quil a réussit la manip M1 est de 0,8. - Réussir M1et M2 sont-ils deux évènements indépendants ? - Quelle est la probabilité dêtre reçu à lexamen de TP de biochimie ?

20 C - Lois de probabilités C - Lois de probabilités 2. Quelques rappels sur les probabilités

21

22 Exemple de processus déterministe : Loi de Beer-Lamber DO =.l.C On peut suivre une courbe de croissance (vers 620 nm) bactérienne à laide dun spectrophotomètre. La cause C augmente provoque directement le même effet DO augmente. Exemple de processus stochastiques : - Résistance dune souche bactérienne à un antibiotique donné (boîtes de Pétri) - Naissance des alvins quelques jours après laccouplement de 2 poissons

23 C - Lois de probabilités C - Lois de probabilités 3. Définition ; 2 cas à considérer Une loi de probabilité Une loi de probabilité est entièrement définie par lensemble des valeurs possibles prises par la variable aléatoire associée et les probabilités dapparition de chacune de ces valeurs. Dans le cas dune variable aléatoire X discrète, une loi de probabilité est entièrement définie l ensemble des couples (k, p[X=k]) (k Entier, en général) p[X=k] a un sens! Dans cas dune Variable Aléatoire X continue, une loi de probabilité est entièrement définie lensemble des couples (, p[X> ) ( Réel) p[X= ] = 0 ! Prendre p[X< dans la définition reviendrait au même Une définition très simple … … qui demande un peu de précision

24 C - Lois de probabilités C - Lois de probabilités 3. Définition ; 2 cas à considérer

25 Exercice « les pois de Mendel » Soit le croisement de pois à fleurs jaunes (A, caractère dominant) et vertes (a). Calculer la probabilité quune plante à fleurs jaunes de la deuxième génération (cest-à-dire obtenue par croisement de deux hétérozygotes) soit hétérozygote. Solution Soit J : « les fleurs sont jaunes » et H : « la plante est hétérozygote » La probabilité recherchée est P(H / J) (« fleur jaune » est le caractère établit) En se servant de la loi de probabilité établie auparavant : P(H / J) = P(H J )/P(J) P(J) = 3 / 4 (A dominant) H J = {Aa, aA}= H P(H J ) = 2 / 4 P(H / J) = P(H J )/P(J) = 2/3 C - Lois de probabilités C - Lois de probabilités 3. Définition ; 2 cas à considérer

26 Variable(s) statistique(s) (et type) ? Variable(s) aléatoire(s) sous-jacente(s)? Calculer la probabilité dobtenir lun des deux phénotypes [ab] ou [Ab] A vous de jouer … Expression dun caractère impliquant 2 gènes non liés. Dans le cas où 2 gènes non liés sont en cause pour lexpression dun caractère, déterminez la loi de probabilité attendue pour la ségrégation des phénotypes à l'issue du croisement de deux drosophiles hétérozygotes de génotype {AaBb} (A et B dominants). C - Lois de probabilités C - Lois de probabilités 3. Définition ; 2 cas à considérer

27 Croisement {A/a,B/b} X {A/a,B/b}, expression dun caractère impliquant 2 gènes non liés GénotypesPhénotypesProbabilités (proportions attendues) [AABB] [AABb](caractère exprimé) 9/16 [AAbB] [AB] [AaBB] …. [aabb] (caractère non exprimé) [Aabb][ab] … [Ab] 7/16 [aB] C - Lois de probabilités C - Lois de probabilités 3. Définition ; 2 cas à considérer

28 Seule lexpérience permet de décider si les valeurs attribuées aux probabilités sont ou non satisfaisantes pour la description du phénomène étudié. Commentaire … Les évènements (génotypes) ont été pris ici également probables, cest ce qui est observé lorsquon considère les pois étudiés par Mendel (couleur des fleurs). Ce modèle ne convient pas aux primevères pour le caractère des feuilles plates (A) ou ondulées (a) : la fréquence expérimentale du nombre de feuilles plates est en effet voisine de 4/5 (les plantes à feuilles crispées sont moins viables que les plantes à feuille plates). C - Lois de probabilités C - Lois de probabilités 3. Définition ; 2 cas à considérer

29 C - Lois de probabilités C - Lois de probabilités 4. Exemples

30

31 C - Lois de probabilités C - Lois de probabilités 4. Exemples

32 Avec cet exemple nous visualisons : - variable aléatoire = fonction - la loi de probabilité - Calcul de probabilités possible à partir de la distribution - Nous pouvons calculer la moyenne de la distribution

33 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale La solution du problème des épreuves répétées conduit à la loi binomiale. On jette 5 fois de suite une pièce de monnaie non truquée. Quelle est la probabilité dobtenir 2 fois "face" à l'issue des 5 jets ? - Quelle est lépreuve associée ? - Variable de Bernouilli : pour chaque lancé de la pièce, Y =0 si le résultat est Pile (échec/absence caractéristique) ; Y=1 si le résultat est face Face (réussite/présence caractère) -Echantillon ou population ? -Variable aléatoire associée ? -Ensemble des résultats possibles ? -Quelle est la loi de distribution ? -Quels sont la moyenne et l'écart-type de la distribution ? -Représentation graphique

34 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale Vers le calcul dune probabilité : P(X=2) - Variable aléatoire associée ? - Résultats possibles - Si on passait au calculs … - Généralisation du processus

35 Commençons par établir la probabilité : P(X=1)

36

37 Calcul dune probabilité : P(X=2)

38

39 Généralisation du processus : P(X=k)

40

41 C - Lois de probabilités C - Lois de probabilités 5. Loi binomiale

42 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale

43

44

45

46

47 Loi Binomiale X, V. A. discrète, "nombre de réalisations d'un certain événement E lors des n répétitions d'une même épreuve" X B ( n, ) Espérance (moyenne théorique) : n (valeur pas toujours prise par la variable!) variance : n Cependant cette loi est peu pratique à utiliser lorsque n est grand (calculs fastidieux!) Tables de la loi binomiale… Approche par d'autres lois lorsque c'est possible…

48 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale S oit la variable P o = X/N, avec X : VA binomiale. (proportion dindividus satisfaisant à la définition de la VA X) Quelle est la loi de probabilité suivie par P o ? Quels sont la moyenne et la variance de P o ? Espérance :

49 Loi Binomiale P o, V. A. discrète, "proportion de réalisations d'un certain événement E lors des n répétitions d'une même épreuve" P o B ( n, ) Espérance (moyenne théorique) : (valeur pas toujours prise par la variable!) variance : n C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale Les distributions de X et Po sont toutes deux des lois binomiales de paramètres n et mais elles n'ont pas la même moyenne ni la même variance

50 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale A propos de la moyenne dune Loi de probabilité Espérance ou moyenne théorique dune loi de distribution Barycentre de la distribution (valeur pas toujours prise par la variable!)

51 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale Exercice « Le technicien expérimenté » Le technicien dun laboratoire pilote réalise une manipulation très délicate quil ne rate que dans 30 % des cas. Il procède par série de 5 manipulations. Grâce à son expérience, il répète un assez grand nombre de fois ses séries de manipulations dans des conditions pratiquement identiques. La V.A. détude est X = « nombre de manipulations réussies par série de 5 » Quel est le type de la V.A. X ? Représentez graphiquement la distribution de X Quels sont lespérance et lécart-type de cette distribution ? Hypothèse : on supposera sans le démontrer que les manipulations sont toutes indépendantes les unes des autres (effet de la fatigue, impact dun échec ou dune réussite sur la manip suivante non pris en compte)

52 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale Espérance : 3.50 Ecart-type : 1.02

53 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale Exercice "sachets de graines" Un producteur de graines vient de lancer une superbe variété de fleur. Il garantit que seules 2 graines sur 10 ne germent pas. Chaque sachet mis en vente contient 200 graines. a/ Indiquez combien de fleurs peut donner en moyenne un sachet de graines. b/ Quel est l'écart type associé ? c/ Pour obtenir un massif de 500 fleurs, combien de sachets faut-il acheter en moyenne ? (Indiquez votre raisonnement). Vous n'oublierez pas de bien définir la VA sous jacente et d'indiquer sa nature (qualitative, quantitative discrète ou quantitative continue).

54 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale Exercice "sachets de graines " X = « Nombre de graines donnant à une fleur sur un échantillon de 200 graines » =1-2/10=0,8 N=200 =N =200x0,8=160 Variance=N (1- )=200x0,8x0,2=32 =5,7 En moyenne un sachet permet dobtenir 160 fleurs. Il faut donc 4 sachets pour atteindre au moins leffectif de 500 fleurs (3x160=480, insuffisant et 4x160=640, OK!). Rq : On pourra préciser lincertitude en approchant la loi par une distribution normale Avec 3 paquets, seulement 12% de chances (environ) dobtenir plus de 500 graines

55 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale On considère une chaîne polypeptidique de n acides aminés générée de façon aléatoire. Soit n=50, taille de la séquence - Q1 - Quelle est la probabilité de trouver plus de 50% de résidus proline dans cette séquence aléatoire ? - Q2 -Quelle est la probabilité de trouver le tripeptide LLL dans cette séquence polypeptidique ? - Q3 -Un poly L, cest à dire une séquence polypeptidique constituée uniquement du résidu leucine ? Exercice « Séquence Random »

56 - Q1 - P ( P o > 0.5) = P ( X > 25) P o suit une B (50, 0,05) Variable de Bernouilli associée Présence Proline associée à X=1 ; P(X=1)=1/20 Absence Proline (présence de tout autre aa) associée à X=0 ; P(X=0)=19/20=0,95 Application numérique : utiliser table de la loi binomiale ou ordinateur! Exemple : en saisissant LOI.BINOMIALE(25;50;0,05;VRAI) dans Excel, le résultat recherché est le complémentaire à 1 de cette valeur, donc 0 P ( P o > 0.5) = 0 Correction de l' exercice « Séquence Random »

57 - Q2 - Soit n : nombre de résidus dans la séquence polypeptidique ; Soit Nt : nombre de tripeptides dans une séquence de n résidus d'acides aminés Nt = n – 3 +1 Ici : Nt = 50 – 3 +1 = 48 Variable de Bernouilli / Probabilité élémentaire : Pour chaque tripeptide considéré dans la séquence Présence de LLL, W=1 P(W=1)=(1/20) 3 = Absence de LLL, W=0 P(W=0)= = Soit la V.A. Y : "nombre de tripeptides LLL dans la séquence aléatoire de 50 résidus d'aa" Y suit une loi binomiale B (48, ) {Présence de LLL dans la séquence} = (Y > 0) P (Y > 0) = 1 – P(Y=0) P(Y=0) = 1 x 1 x ( ) 48 = P (Y > 0) = 1 – P(Y=0) = = (ordre de grandeur : 1%) - Q3 - La probabilité recherchée est : (1/20) 50, pratiquement nulle! On peut également dans ce cas utiliser l'approximation par la loi de Poisson de paramètre =48x ; P ( 0.006) Saisir sous Excel : =LOI.POISSON(0;0,006;FAUX)

58 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale Une grande marque produit chaque semaine kits de laboratoires prêts à l'emploi, dont ne présentent aucun défaut (85 %). Le service de contrôle-qualité prélève 10 kits au hasard d'une production hebdomadaire pour estimer la qualité de l'ensemble de la fabrication. Quelle est la probabilité que cet échantillon présente autant de kits défectueux que kits bons pour la vente ? Autrement dit, dans un échantillon de 10 kits prélevés au hasard, on a une probabilité de … % pour que 5 kits soient défectueux et 5 bons pour la vente. Est-ce beaucoup ??? Maintenant que l'on sait à quoi s'attendre que faut-il faire ? Comparer l'observation à la prévision … …. Ce sera l'objet des tests statistiques ….

59 C - Lois de probabilités C - Lois de probabilités 5. Loi Binomiale Quelques cas où l'on rencontre de la LOI BINOMIALE :

60 C - Lois de probabilités C - Lois de probabilités 6. Loi de Poisson Que constatons-nous dans cet exemple ? X suit une loi binomiale dont la moyenne est très proche de la variance Et petite pour N plutôt grand Moyenne : n = 0.02*100 = 2 Variance : n = 100*0.02*0.98 = 1.96 Exemple introductif Dans une expérience faite sur des rats, létalement sur la peau dune crème de soin du commerce peut provoquer une réaction allergique dans 20 cas sur Soit X la variable aléatoire "Nombre de rats présentant une réaction allergique après dépôt du produit sur N individus" A/ Quelle loi de probabilité suit X ? B/ Quelle est la probabilité d'observer moins de 3 cas d'allergie sur 100 étalements ? En déduire la probabilité d'observer au plus 3 cas d'allergie sur 100 étalements.

61 C - Lois de probabilités C - Lois de probabilités 6. Loi de Poisson Cas d'application (Siméon Denis Poisson ) Lorsque le nombre d'épreuves n est grand et très petit (proche de 0), la loi Binomiale B (n, ) tend vers une loi de Poisson P ( ) de seul paramètre (espérance et variance de la loi binomiale approchée par la loi de Poisson). La loi de Poisson est une distribution discrète. Elle est tabulée P(X=k) = e - k / k! Côté pratique On vérifiera d'abord que les calculs ne peuvent être approchés par une distribution normale, plus pratique à utiliser

62 C - Lois de probabilités C - Lois de probabilités 6. Loi de Poisson Nous sommes maintenant armés pour résoudre notre exemple introductif Dans une expérience faite sur des rats, létalement sur la peau dune crème de soin du commerce peut provoquer une réaction allergique dans 20 cas sur Soit X la variable aléatoire "Nombre de rats présentant une réaction allergique après dépôt du produit sur N individus" A/ Quelle loi de probabilité suit X ? B/ Quelle est la probabilité d'observer moins de 3 cas d'allergie sur 100 étalements ? En déduire la probabilité d'observer au plus 3 cas d'allergie sur 100 étalements. On va utiliser une loi de poisson de paramètre : =2

63 C - Lois de probabilités C - Lois de probabilités 6. Loi de Poisson Nombre de poissons par mètres cube deau Passages dun ours dans un site des Pyrénées sur une semaine Concentration de bactéries (hématimètre) dans un lac (homogénéité) Nombre dinsectes dune certaine espèce capturés sur un filet en une nuit en forêt amazonienne Nombre de désintégration dun radio-isotope par minute Nombre dappels enregistrés par un standard téléphonique dans une courte période de temps Nombre de skieurs empruntant un télésiège en lespace dune heure dans une petite station alpine Etc… Réels domaines dutilisation dune loi de Poisson Nombre dévènements par unité de volume, de surface, de temps

64 C - Lois de probabilités C - Lois de probabilités 6. Loi de Poisson Exercice « les ours des Pyrénées » Un écologiste étudie le passage des ours, récemment introduits, en un point précis dune rivière séparant un champ dune petite forêt des Pyrénées. A lissue dun contage long et rigoureux, il observe en moyenne 4 individus par jour. a/ Quelle est la probabilité quil détecte précisément 3 ours en lespace de 12 h ? b/ Quelle est la probabilité quil détecte entre 1 et 3 ours en 6 heures ? a/ = 4 individus / j uniformité sur une courte période de temps : = 2 ind. / 12 h calcul de P(X=3) avec X suit une loi de Poisson de paramètre =2 (voir table) P(X=3) =0.18 b/ calcul de P(1 Y 3) avec Y suit une loi de Poisson de paramètre =1 Loi discrète donc P(1 Y 3) = P(Y=1)+P(Y=2)+P(Y=3) (voir table) P(1 Y 3) = = (0.61 est suffisamment précis)

65 C - Lois de probabilités C - Lois de probabilités 7. Calcul de probabilités dans le cas des lois de distribution continues Taux dune hormone en mg/ml Avec la densité de fréquence relative on a facilement accès aux probabilités, associées aux surfaces du diagramme.

66 Taux dune hormone en mg/ml C - Lois de probabilités C - Lois de probabilités 7. Calcul de probabilités dans le cas des lois de distribution continues Lois continues Laugmentation de la taille de léchantillon permet des classes de plus en plus fines et fait tendre la densité de fréquence relative vers une courbe appelée densité de probabilité. Les lois de distributions continues (loi normale, Chi-deux, etc…) sont entièrement caractérisées par l équation de leur fonction de densité de probabilité f(x).

67 C - Lois de probabilités C - Lois de probabilités 7. Calcul de probabilités dans le cas des lois de distribution continues

68

69 C - Lois de probabilités C - Lois de probabilités 8. Loi Normale

70

71 Propriétés de la Loi Normale N, repères graphiques Définition des fonctions de densité de probabilité et de partition Une probabilité est une aire (comme pour toute distribution continue) Loi Normale centrée réduite Changement de variable et conservation des aires Lecture des tables de la Loi Normale centrée réduite Un exemple Bilan de ce quil faut retenir Exercices Loi Log-Normale Passage dune loi Binomiale à une loi Normale

72 C - Lois de probabilités C - Lois de probabilités 8. Loi Normale X

73 C - Lois de probabilités C - Lois de probabilités 8. Loi Normale Z

74 C - Lois de probabilités C - Lois de probabilités 8. Loi Normale X2X2 X1X1 X 0 1 Z1Z1 Z2Z2 Z

75 C - Lois de probabilités C - Lois de probabilités 8. Loi Normale Z 0 t

76 C - Lois de probabilités C - Lois de probabilités 8. Loi Normale 0 Z t

77 C - Lois de probabilités C - Lois de probabilités 8. Loi Normale Du Côté dEXCEL : (loi normale quelconque) - loi.normale renvoie la valeur de P(X

78 C - Lois de probabilités C - Lois de probabilités 8. Loi Normale

79

80 C - Lois de probabilités C - Lois de probabilités 9. Passage dune loi binomiale à une loi normale n=50 =0.5 n =25 =0.7 n(1- =15 Evolution de la forme dune distribution binomiale lorsque n est grand

81 Pratique : Les calculs impliquant une distribution binomiale peuvent, dans certains cas, être approchés par une distribution normale (plus pratique à utiliser) On utilise la moyenne et lécart-type de la Binomiale pour définir la Normale LorsqueX B ( n ) et quen > 5 et n (1- ) > 5 Alorsn > 5 et n (1- ) > 5 les calculs de probabilité peuvent être approchés en utilisant La loi de distribution Y N ( n ) Remarque : Lorsque les conditions ne permettent pas cette approximation, il faut alors essayer … la loi de Poisson … C - Lois de probabilités C - Lois de probabilités 9. Passage dune loi binomiale à une loi normale Cest en fait ainsi que la loi Normale a été (re)découverte par Laplace vers 1800 !

82 Pratique : Les calculs impliquant une distribution binomiale peuvent, dans certains cas, être approchés par une distribution normale (plus pratique à utiliser) On utilise la moyenne et lécart-type de la Binomiale pour définir la Normale LorsqueP 0 B ( n ) et quen > 5 et n (1- ) > 5 Alorsn > 5 et n (1- ) > 5 les calculs de probabilité peuvent être approchés en utilisant La loi de distribution Y N ( ) Remarque : Lorsque les conditions ne permettent pas cette approximation, il faut alors essayer … la loi de Poisson … C - Lois de probabilités C - Lois de probabilités 9. Passage dune loi binomiale à une loi normale

83 Exercice "Kit ou … double?" L'industriel fabricant des kits de biotechnologie a mis en place une technique éliminant les éléments défectueux. A l'issue de cette étape, 99% des kits vendus sont corrects et utilisables sans risque de disfonctionnement. L'industriel vient juste de vendre un lot de 1000 kits à l'un de ses distributeurs. Préoccupé par son image de marque, il a demandé à une jeune stagiaire de lui donner, dans l'heure, la probabilité qu'il y ait plus de 2% de kits défectueux dans le lot vendu. Qu'en serait-il s'il avait vendu : - un lot de kits? - un lot de 100 kits? Tracez les variations de la variance en fonction de la taille de l'échantillon

84 Exercice "Kit ou … double?" Définissons les variables aléatoires utilisables dans cet exercice, X : « Nombre déléments défectueux dans un lot de N kits de biotechnologie vendus » P o : « Proportion déléments défectueux dans un lot de N kits de biotechnologie vendus » Lépreuve de Bernoulli, répétée N fois, associe la probabilité =1-0,99=0,01 (paramètre) à lévènement « un kit pris au hasard est défectueux ». L'industriel vient juste de vendre un lot de 1000 kits à l'un de ses distributeurs. N=1000 X suit la loi binomiale B (1000, 0,01) de moyenne N =10 P o suit la loi binomiale B (1000, 0,01) de moyenne =0,01 et décart type [ (1- )/N] 1/2 =[0,01x0,99/1000] 1/2 =0,0032 P(P o >0,02) = P(X>20) = 1-[P(X=0)+P(X=1)+….+P(X=20)]. Ce calcul impliquant la somme de 21 termes binomiaux est bien trop fastidieux. On sintéresse donc de suite sur lapproximation par une loi Normale. Comme N et N(1- ) sont tous deux supérieurs à 5, cette approximation est possible. Soit Y la variable aléatoire suivant la loi normale N (, [ (1- )/N] 1/2 ), les fluctuation de P o peuvent être approchées par la loi de Y. Pour N=1000 et =0,01, Y suit la loi N (0,01, 0,0032) P(P o >0,02)=P(Y>0,02) P(Y>0,02)=P[Z>(0,02-0,01)/0,0032)], Z suivant la loi normale centrée réduite N (0,1) P(Y>0,02)=P(Z>3,17) P(Z>3,17)=0,00076 Ainsi la probabilité recherchée P(P o >0,02) est proche de 0,08%. Lindustriel peu se rassurer! S'il avait vendu un lot de kits, lapproximation Normale est encore meilleure. La moyenne ne change pas, elle est toujours égale à 0,01 mais lécart type de la loi B (1000, 0,01) valant [0,01x0,99/10000] 1/2 =0, (à peu près 0,001), la position de la valeur 0,02 sur la distribution normale est cette fois à plus de 10 écart-type de la position de la moyenne 0,01! Autrement dit la probabilité recherchée est nulle.

85 Exercice "Kit ou … double?« (suite) S'il avait vendu un lot de 100 kits, N =1, étant inférieur à 5, lapproximation Normale nest cette fois plus possible. La moyenne de la loi B (100, 0,01) suivie par X vaut N =1 et la variance est 0,01x0,99x100=0,0099, valeur très proche de la moyenne. On ne peut donc utiliser la loi de Poisson P (1), de paramètre =1 pour effectuer les calculs. Attention, N=100 donc P(P o >0,02) = P(X>2) P(P o >0,02) = 1-[P(P o =0)+P(P o =0,01)+P(P o =0,02)]=P(X>2) = 1-[P(X=0)+P(X=1)+P(X=2)] P(P o >0,02) =1-[C ,01 0 x0, C ,01 1 x0, C ,01 2 x0,99 98 ] En utilisant la loi P(1), P(P o >0,02) =1-(0,3679+0,3679+0,1839) P(P o >0,02) =0,08, cette fois la probabilité nest pas faible, elle concerne 8 ventes sur 100! Rq : Pour appliquer la loi de Poisson, quelque soit N, il faut (1- ) proche de Tableau des variations de la moyenne, de la variance, de lécart-type de P o et de la probabilité recherchée, en fonction de la taille de l'échantillon : N ,010,010,010,010,01 0,010,00620,00450,00320, ,00010,000040,000020,000010, P(P o >0,02)0,0800,0540,0120, Le risque est donc faible à partir de 500 kits vendus (probabilité de lordre de 1%, ce qui est raisonnable).

86 C - Lois de probabilités C - Lois de probabilités 10. Some more training Exercice : « Les citrons »(extrait de lexamen 2002) Des citrons sont produits dans des conditions reproductibles par une entreprise agroalimentaire du sud de lEspagne pour laquelle vous travaillez. Ces citrons forment une population de référence. Leur diamètre est distribué normalement dans cette population avec une moyenne de 7,0 cm et un écart-type de 1,0 cm. Un dispositif performant permet également de détecter, sur chaque citron, la concentration de pesticide absorbé par l'écorce. Cette grandeur est, elle aussi, distribuée normalement dans la population référence avec une moyenne de 2,5 mg/ml et un écart-type de 0,2 mg/ml. Les citrons sélectionnés pour la vente sont ceux dont le diamètre (*) est compris entre 5,5 et 9,0 cm (inclus) et dont la concentration de pesticide absorbé par l'écorce est inférieure ou égale à 2,8 mg/ml Calculez la proportion de citrons sélectionnés pour la vente dans la population référence. (* Les citrons trop petits nintéressent personne tandis que les citrons trop volumineux ont une écorce trop épaisse et, très souvent, une forme irrégulière déplaisant aux consommateurs).

87 Exercice : « Les citrons »(extrait de lexamen 2002) C - Lois de probabilités C - Lois de probabilités 10. Some more training

88 Exercice "Diamond is the best girl friend... " Tous les ans, le groupe agro-alimentaire DIAMOND (23 usines en Europe) est confronté à une dure réalité : sur cinq réacteurs de la gamme R201 contrôlés, trois en moyenne ont besoin d'une sérieuse révision. Une révision est facturée 500 Euros HT par réacteur. L'usine de Toulouse possède 11 réacteurs de la gamme R201. 1/ Quelle est la probabilité que la facture de la révision de ses réacteurs soit comprise entre 1000 et 1500 Euros HT ? 2/ Quelle est la probabilité qu'elle soit supérieure ou égale à 1500 Euros HT ? 3/ Quel est le coût moyen des réparations ? pour répondre aux questions : Définissez la population et l'échantillon d'étude. Vous allez être amenés à utiliser 2 variables aléatoires. Définissez ces 2 variables. Pour chacune d'elles, vous indiquerez si elle est discrète ou continue. Justifiez vos calculs d'1 ou 2 lignes de commentaires en français.

89 Exercice "Diamond is the best girl friend... " Population : tous les réacteurs en service dans les 23 usines européennes du groupe agro-alimentaire Echantillon : les 11 réacteurs de l'usine de Toulouse Posons X=« Nombre de réacteurs ayant besoin dune révision dans un échantillon de 11 » X, variable quantitative discrète, suit une B (11,3/5) ; =0,6 Appelons R le coût HT dune réparation. R = 500 euros. Posons Z=« Coût des réparations à réaliser dans lusine de Toulouse » Z=R.X, avec R constante P(1000 Z 1500) = P(1000 R.X 1500) P(1000 Z 1500) = P(1000/R X 1500/R) P(1000 Z 1500) = P(2 X 3) P(1000 Z 1500) = P(X=2)+P(X=3) P(1000 Z 1500) = 10x0,6 2 x0, x0,6 3 x0,4 8 P(1000 Z 1500) =0,0024 P(Z 1500) = P(X 3) P(Z 1500) = 1-P(X<3) =1-[P(X=0)+P(X=1)+P(X=2)] P(Z 1500) = 1-[1x0,6 0 x0, x0,6 1 x0, x0,6 2 x0,4 9 ] P(Z 1500) = 1-0,0013 P(Z 1500) = 0,9987 Lespérance de la loi B (11, 0.6) est X =N =11.0,6=6,6 Le coût moyen des réparations est : R. X =500x6,6=3300 euros

90 Exercice : « Du tabac pour la bonne cause » Des études menées sur une exploitation pilote ont montré que la quantité dune protéine recombinante produite par un pied de tabac peut être représentée par un variable normale de moyenne 10 mg et décart-type 2 mg. - Quelle est, dans ces conditions, la probabilité dobserver dans cette exploitation un plan ayant produit plus de 13 mg de protéine ? - On prélève au hasard 50 plans de tabac de lexploitation pilote. Quelle est la probabilité dobserver au moins 3 plans ayant produit chacun plus de15 mg de la protéine recombinante? Il est conseillé de bien définir la VA et la loi suivie par la VA pour répondre aux questions, de faire un schéma si possible. C - Lois de probabilités C - Lois de probabilités 10. Some more training

91 Exercice : « Du tabac pour la bonne cause » Posons X =« quantité en mg dune protéine recombinante produite par un pied de tabac » X suit la loi N (10, 2). Nous recherchons P(X>13). P(X>13)=P[Z>(13-10)/2], Z suivant la loi normale centrée réduite N (0, 1). P(X>13)=P[Z>1,5] P(X>13)=0,0967, soit 10% environ, ce qui nest donc pas négligeable. Posons Y =« nombre de plans de tabac produisant plus de 15 mg de protéine recombinante parmi les 50 plans récoltés» Y suit la loi binomiale B (50, P(X>15)). Il faut au préalable déterminer P(X>15). P(X>15) = P[Z>(15-10)/2] ; P(X>15)=P[Z>2,5]=0,0062 Ainsi, plus précisément, Y suit donc une binomiale B (50, 0,006). On recherche P(Y 3)=P(Y>2)=1-P(Y 2) P(Y 3) = 1-[P(Y=0)+P(Y=1)+P(Y=2)] P(Y 3) = 1-[C ,006 0 x0, C ,006 1 x0, C ,006 2 x0, ] Nous remarquons immédiatement que la probabilité associée à lépreuve de Bernoulli (probabilité élémentaire) est très petite. Ce qui laisse espérer lutilisation dune loi de Poisson. La moyenne de la binomiale est N =50x0,006=0,3 ; la variance est 2 =N 1- 50x0,006x0,994=0,3 Moyenne et variance sont suffisamment proches pour utiliser une loi de poisson de paramètre =0,3. P(Y 3) = 1-[P(Y=0)+P(Y=1)+P(Y=2)] P(Y 3) = 1 - (0,7408+0,2222+0,0333) (Lecture de la table de la loi P (0,3)) P(Y 3) = 0,004 ; probabilité très faible!

92 Exercice : « Le QI » (Une variante de lexercice précédent, daprès un exercice trouvé sur le web. Vous pouvez vous aussi trouver de bons exercices sur le web) On sait que le QI dun individu dans une population peut être représenté par un variable aléatoire de loi N(100, 10). - Quelle est, dans ces conditions, la probabilité dobserver dans cette population un individu ayant un QI de plus de 120 ? - Supposons que lon tire 10 personnes au hasard de cette population, quelle est alors la probabilité dobserver plus de 3 personnes ayant un QI dépassant 110 ? Il est conseillé de bien définir la VA et la loi suivie par la VA pour répondre aux questions, de faire un schéma si possible. C - Lois de probabilités C - Lois de probabilités 10. Some more training


Télécharger ppt "Loi de probabilité : élément central de la statistique La détermination de la loi de probabilité suivie par une variable va servir aux calculs de probabilité"

Présentations similaires


Annonces Google