Bienvenue au cours Mat 350 Probabilités et statistiques
Enseignant Claude Blais Maître d'enseignement ( mathématiques ) Service des enseignements généraux (SEG) Local B-2544 Téléphone: 396-8523 Télécopieur: 396-8513 Adresse électronique: claude.blais@etsmtl.ca
Introduction Pourquoi un cours de statistiques dans un programme en ingénierie ? La résolution d’un grand nombre de problèmes d’ingénierie fait appel à une compréhension de la variabilité ainsi qu’à une connaissance des outils descriptifs et analytiques reliés à la variabilité.
C'est quoi les statistiques? C'est l'art de recueillir, présenter, analyser et utiliser des observations (des données) afin d'aider à la prise de décisions et à la résolution de problèmes. Le premier phénomène qui ressort des observations: la variabilité des données.
Un premier exemple On s'intéresse à un nouvel alliage aluminium et lithium; on analyse sa résistance à la compression. 80 tests sont effectués (les unités sont en psi) Les données sont présentées comme elles ont été recueillies. Ainsi, il n'est pas facile de répondre à une question comme: quel est le pourcentage des tests qui donnent une résistance inférieure à 120 psi?
Les deux types d'études statistiques La statistique descriptive ou statistique déductive La statistique inductive ou inférence statistique
La statistique descriptive La statistique descriptive (ou statistique déductive) s'occupe de la description des données: tableau, graphique, pourcentage, ... La moyenne est de 162,7 psi; L'écart-type est de 33,8 psi; Dans 50% des cas, la résistance est inférieure ou égale à 160 psi; 10% des essais ont donné une résistance à la compression inférieure à 120 psi.
La statistique inductive La statistique inductive (ou inférence statistique) s'occupe de tirer des conclusions générales à partir d'expériences et de faire des prévisions. Dans le contexte de l ’exemple sur la résistance d ’un alliage on pourra affirmer: La résistance moyenne à la rupture de cet alliage se situe entre 155,15 et 170,18 psi . Cette affirmation possède un niveau de confiance de 95%.
Les définitions de base Population et individus Variables Types de variables Échantillon But d'une étude statistique
Population et individus Individu ou unité statistique Une unité distincte chez laquelle on peut observer une ou plusieurs caractéristiques données.
Population et individus Ensemble des individus (ou unités statistiques ) pour lequel on considère une ou plusieurs caractéristiques Taille de la population Le nombre d'individus constituant la population. Notation : N
Variable statistique (1) Une variable est une caractéristique d’une unité statistique susceptible de variations observables. Notation : X , Y , W , ... (MAJUSCULE) Valeurs ou modalités: les différentes valeurs qu’une variable peut prendre. Notation : x1 , x2 , ... (minuscule)
Variable statistique (2) Valeurs possibles tous les résultats possibles a priori si on fait une observation d'une variable Valeur observée résultat a posteriori d'une observation d'une variable
Types de variables Variable qualitative Variable quantitative
Variable qualitative Ses valeurs peuvent être des états, des opinions, des propriétés,... des modalités qui correspondent à des "qualités". On classe une unité statistique dans un groupe ou une catégorie. Nominale: les groupes ne sont pas ordonnés Ordinale: les groupes sont ordonnés
Variable quantitative Ses valeurs sont des nombres réels et correspondent à des quantités. On distingue deux types de variables quantitative : Discrète: les modalités sont dénombrables Continue: les modalités sont définies sur un intervalle continu
Exemple Considérons le questionnaire suivant qui s’adresse à la population étudiante de l’ÉTS. Q1. Avez-vous échoué ou abandonné au moins un cours à votre dernière session? 1. Oui 2. Non Q2. Combien de cours avez-vous réussi à votre dernière session? 1. 0 ou 1 2. 2 ou 3 3. 4 4. 5 ou plus Q3. Combien de cours avez-vous réussi à votre dernière session? ____ Q4. Quelle est votre cote moyenne à l’ÉTS? _____
Exemple (suite) NATURE MODALITÉS Qualitative nominale { oui , non } Qualitative ordinale { 1 , 2 , 3 , 4 } Quantitative discrète { 0, 1 , 2 , … } Quantitative continue [ 0 ; 4,3] Q1. Avez-vous échoué ou abandonné au moins un cours à votre dernière session à temps complet? 1. Oui 2. Non Q2. Combien de cours avez-vous réussi à votre dernière session à temps complet? 1. 0 ou 1 2. 2 ou 3 3. 4 4. 5 ou plus Q3. Combien de cours avez-vous réussi à votre dernière session à temps complet? ____ Q4. Quelle est votre cote moyenne à l’ÉTS? _____
Variable quantitative discrète Ses valeurs a priori sont des nombres isolés les uns des autres. Image géométrique :
Variable quantitative continue Ses valeurs a priori ne peuvent être isolées. Les valeurs se situent donc dans des intervalles de la droite réelle. Image géométrique :
Les variables en résumé
Échantillon Les résultats des observations, portant sur la variable à l'étude, faites sur une partie des individus. (Une observation par individu) Taille de l'échantillon : le nombre d'orbservations dans l'échantillon. Notation : n
But d'une étude statistique Se faire une idée assez juste des variations d'une variable dans une population.
Quelques fondateurs(1) Pierre de Fermat (1601 - 1665) Blaise Pascal (1623 - 1662) Jacques Bernouilli (1654 - 1705) Thomas Bayes (? - 1763) Abraham de Moivre (1667 - 1754)
Quelques fondateurs(2) Karl Friedrich Gauss (1777 - 1855) Francis Galton (1822 - 1911) Karl Pearson (1857- 1936) Ronald Fisher (1890 - 1962)
Représentation graphique Variable qualitative nominale (ou ordinale) Avez-vous échoué ou abandonné au moins un cours à votre dernière session ? Cours échoués Effectifs Fréquences ou abandonnés OUI 95 19,0% NON 405 81,0% 500 1 Effectifs
Représentation graphique Variable quantitative discrète Combien de cours avez-vous réussi à votre dernière session ? ____ Diagramme à bâtons Nombre de Effectifs Fréquences cours réussis 22 0,044 1 16 0,032 2 49 0,098 3 164 0,328 4 243 0,486 5 6 0,012 500 1,000 Effectifs Nombre de cours réussis
Représentation graphique Variable quantitative continue (1) Quelle est votre cote moyenne à l’ÉTS? _____ Cote Effectifs Fréquences (1,3 ; 1,5] 5 0,010 (1,5 ; 1,7] 4 0,008 (1,7 ; 1,9] 8 0,016 (1,9 ; 2,1] 28 0,056 (2,1 ; 2,3] 32 0,064 (2,3 ; 2,5] 65 0,130 (2,5 ; 2,7] 72 0,144 (2,7 ; 2,9] 80 0,160 (2,9 ; 3,1] 81 0,162 (3,1 ; 3,3] 51 0,102 (3,3 ; 3,5] 35 0,070 (3,5 ; 3,7] 23 0,046 (3,7 ; 3,9] 12 0,024 (3,9 ; 4,1] 2 0,004 (4,1 ; 4,3] 500 1 Effectifs Cote
Représentation graphique Variable quantitative continue (2) Cote Effectifs Fréquences Fréq. Cumulées (1,1 ; 1,3] (1,3 ; 1,5] 5 0,01 (1,5 ; 1,7] 4 0,008 0,018 (1,7 ; 1,9] 8 0,016 0,034 (1,9 ; 2,1] 28 0,056 0,09 (2,1 ; 2,3] 32 0,064 0,154 (2,3 ; 2,5] 65 0,13 0,284 (2,5 ; 2,7] 72 0,144 0,428 (2,7 ; 2,9] 80 0,16 0,588 (2,9 ; 3,1] 81 0,162 0,75 (3,1 ; 3,3] 51 0,102 0,852 (3,3 ; 3,5] 35 0,07 0,922 (3,5 ; 3,7] 23 0,046 0,968 (3,7 ; 3,9] 12 0,024 0,992 (3,9 ; 4,1] 2 0,004 0,996 (4,1 ; 4,3] 1 TOTAL 500