Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Probabilités et statistiques au lycée
STATISTIQUE INFERENTIELLE L ’ESTIMATION
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Collecte de données F. Kohler.
Inférence statistique
Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.
Les TESTS STATISTIQUES
Les TESTS STATISTIQUES
Échantillonnage-Estimation
4 Les Lois discrètes.
5 La Loi de Laplace Gauss ou loi Normale
Dr DEVILLE Emmanuelle J D V 12/07/2006
Notions de variable aléatoire et de probabilité d’un événement
Moyenne, écart type et incertitude de mesure.
Les tests d’hypothèses
Statistiques et probabilités en première
variable aléatoire Discrète
Statistiques et probabilité :
Fluctuations d’une fréquence selon les échantillons, Probabilités
2. Expériences aléatoires et modélisation
Statistiques et Probabilités au lycée
Applications des statistiques
Groupe 1: Classes de même intervalle
Introduction aux probabilités
DEA Perception et Traitement de l’Information
Comprendre la variation dans les données: Notions de base
STATISTIQUES – PROBABILITÉS
Chapitre 6 Lois de probabilité.
Algorithmes probabilistes
Distribution d’échantillonnage
Varia Lectures obligatoires dans manuel du cours: Chapitre 5
Introduction aux probabilités
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Scénario Quatre hommes entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones cellulaires.
Théorème de la limite centrale l’inférence statistique
Probabilités et Statistiques
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Probas-Stats 1A novembre 10 1 Probabilités et Statistiques Année 2010/2011
TD4 : « Lois usuelles de statistiques »
STATISTIQUES – PROBABILITÉS
Les Techniques d’enquête quantitative
Intervalles de confiance pour des proportions L’inférence statistique
Fabienne BUSSAC PROBABILITÉS 1. VOCABULAIRE
Probabilités (suite).
Chapitre 3: Variables aléatoires réelles continues
Principales distributions théoriques
L’erreur standard et les principes fondamentaux du test de t
Rappels sur les fonctions et les suites aléatoires
Échantillonnage aléatoire simple
Chapitre 4 Variables aléatoires discrètes
Rappel de statistiques
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
Échantillonnage (STT-2000)
Remise à niveau en statistique Eric Marcon – Module FTH 2006.
Probabilités et Statistiques
Plan 1. Probabilités conditionnelles 2. Indépendance en probabilité
1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.
ECHANTILLONAGE ET ESTIMATION
Distributions d’échantillonnage pour des proportions
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Introduction aux statistiques Intervalles de confiance
Chapitre 3 Lois de probabilité 1. Lois discrètes 2. Loi de Bernoulli (ou loi alternative simple) variable de Bernoulli On appelle variable de Bernoulli.
Les probabilités fournissent une description mathématique de l’incertain c’est-à-dire d’événements « aléatoires ». Introduction aux probabilités Néanmoins,
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Bienvenue au cours MAT-350 Probabilités et statistiques.
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

Plan du cours Introduction Statistique descriptive Echantillonnage Calcul des probabilités et variables aléatoires Inférence statistique Estimation Tests d’hypothèses Régression linéaire 2006/2007

Objectif Pouvoir tirer des conclusions (inférence) sur les paramètres d’une population à partir de statistiques calculées pour un échantillon prélevé dans cette population. Exemples : Sondages, Enquêtes, Expériences, … 2006/2007

Etapes Récolter les données : Analyser les données : Choix de l’échantillon ? Taille de l’échantillon ? Analyser les données : Mesure de l’erreur d’échantillonnage ? Estimation de paramètres ? Test d’hypothèses ? Tirer des conclusions. 2006/2007

Echantillonnage Pourquoi ? Comment ? Réduire les coûts. Ressources (temps, personnes, …) limitées. Population trop grande. Comment ? Eviter les biais (bien représenter l’ensemble de la population). Récolter le plus d’information possible. 2006/2007

Quelques méthodes Echantillon aléatoire simple. Echantillon aléatoire stratifié. Echantillon en grappes. Echantillon systématique. 2006/2007

1. Echantillon aléatoire simple On prélève n observations dans la population, au hasard, de telle sorte que tous les échantillons possibles de même taille ont la même chance d’être obtenus. Exemple : Tirage au sort dans un chapeau. Annuaire téléphonique (biais ?). Comment ? Liste des individus de la population. 2006/2007

2. Echantillon aléatoire stratifié Pour augmenter la quantité d’information si la population peut être subdivisée en plusieurs strates (sous-populations) différenciées par rapport aux variables étudiées. Exemples : Niveaux de revenus, Catégories socio-professionnelles, Classes d’âge, Localisation géographique, … Principe : prélever un échantillon aléatoire simple indépendamment dans chaque strate. Problème : combien d’observations prélever dans chaque strate ? 2006/2007

3. Echantillon en grappes La population est subdivisée en grappes. Exemple : les quartiers d’une ville. On prend un échantillon aléatoire simple de grappes et on inclut dans l’échantillon tous les individus (ou un échantillon – échantillonnage en grappe à 2 niveaux) de chaque grappe choisie. Avantages : Pratique s’il est difficile ou impossible d’obtenir une liste de tous les individus de la population. Permet de réduire les coûts liés à l’échantillonnage. Inconvénient: augmente erreur d’échantillonnage. 2006/2007

4. Echantillon systématique Exemples : Contrôle de qualité, Contrôle de dossiers, de transactions, … Echantillon systématique 1-sur-M : On prélève une première observation au hasard parmi les M premiers individus (pièces produites, dossiers reçus, transactions effectuées, …) et ensuite une tous les M. On prélève une proportion 1/M de la population. 2006/2007

Taille de l’échantillon ? Compromis entre les coûts et l’erreur d’échantillonnage ! D’où la nécessité de pouvoir mesurer l’erreur d’échantillonnage. Réponse : grâce au calcul des probabilités et aux principes de l’inférence statistique. 2006/2007

Plan du cours Introduction Statistique descriptive Echantillonnage Calcul des probabilités et variables aléatoires Inférence statistique Estimation Tests d’hypothèses Régression linéaire 2006/2007

Probabilités Introduction Expérience aléatoire, résultats, événements Notion de probabilité Calcul des probabilités Variables aléatoires Lois de probabilité discrètes et continues 2006/2007

Introduction Jeux de hasard Elections Assurance-vie Economie Météo Gagner au loto, au tiercé ? Elections Probabilité d’être élu ? Assurance-vie Probabilité de survie après x années ? Economie Probabilité de faillite d’une entreprise ? Météo Probabilité d’avoir de la pluie demain ? 2006/2007

Expérience aléatoire Expérience aléatoire : Résultats : Pile ou face, Une des 52 cartes. 2006/2007

Expérience aléatoire Action ou processus qui engendre une observation, et dont on ne peut prédire avec certitude le résultat. Espace échantillon W : ensemble de tous les résultats possibles. Exemple : lancer d’un dé 2006/2007

Evénements Exemples : Evénement A : Obtenir le « 1 » Evénement B : Obtenir un multiple de 3 Evénement C : Obtenir un nombre pair Evénement D : Obtenir un nombre impair 2006/2007

Evénements Définition : sous-ensemble de W Evénements particuliers : Événement simple : ne contient qu’un seul résultat, Événement impossible : ensemble vide, Événement certain : W 2006/2007

Opérations sur les événements Similaires aux opérations sur les ensembles. Implication (inclusion) : Conjonction (intersection) : Evénements mutuellement exclusifs : 2006/2007

Opérations sur les événements Disjonction (réunion) : Différence : Evénement complémentaire (négation) : 2006/2007

Opérations sur les événements Partition de E : tels que : Système complet d’événements : Partition de W. 2006/2007

Exemple 1 – Fraude fiscale On estime à 10% le pourcentage de fraudeurs parmi un groupe de contribuables. On observe que 24% des fraudeurs font appel à un type de déduction fiscale particulier. Seulement 3% des non fraudeurs font appel à ce type de déduction fiscale. Si le contrôleur observe cette déduction dans la déclaration de revenus d’un contribuable, quelle est la probabilité que ce contribuable soit un fraudeur ? 2006/2007

Définition classique des probabilités N résultats possibles ayant tous la même chance de se réaliser. Succès S correspondant à NS résultats. Probabilité de succès : Exemple : Lancer d’un dé 2006/2007

Définition fréquentielle des probabilités n répétitions de l’expérience aléatoire. Nombre de succès : Fréquence : Probabilité (« fréquence théorique ») : 2006/2007

Définition axiomatique des probabilités Pour W fini : P() est une fonction d’ensemble à valeurs réelles, définie sur P(W), avec les axiomes : A1: A2: A3: 2006/2007

Propriétés des probabilités Si un événement E est partitionné en 2 événements E1 et E2 : Extension à plus de 2 événements. Inclusion : 2006/2007

Propriétés des probabilités Pour tout événement E : Complémentaire : Complémentaire de W : 2006/2007

Loi d’addition Pour 2 événements : Exemple : 2006/2007

Loi d’addition Démonstration : Si A et B sont mutuellement exclusifs : 2006/2007

Probabilité conditionnelle Exemple : Supposons que C se soit réalisé : Supposons que B se soit réalisé : Condition 2006/2007

Probabilité conditionnelle Définition : Probabilité conditionnelle de A étant donné B : 2006/2007

Régle de multiplication Pour 2 événements : Exemple : tirage de 2 cartes sans remise dans un jeu de 52 cartes 2006/2007

Règle de multiplication Pour 3 événements : Exemple : tirage de 3 cartes sans remise dans un jeu de 52 cartes Généralisation à plus de 3 événements. 2006/2007

Indépendance stochastique Pour 2 événements : A et B sont (stochastiquement) indépendants ssi : Exemple : 2006/2007

Exemple 1 – Fraude fiscale 2006/2007

Probabilités totales Soit un système complet d’événements : Partition de W telle que Théorème des probabilités totales : 2006/2007

Probabilités totales Exemple : Une société pétrolière envisage l’opportunité d’un forage sur un nouveau site. Trois cas sont possibles : Pas de pétrole (rien), Peu de pétrole (peu), Beaucoup de pétrole (bcp). Probabilités a priori (expériences passées): 2006/2007

Probabilités totales Test séismique en vue d’obtenir plus d’information sur le terrain : 3 résultats possibles : Potentiel du terrain Bas, Moyen, Elevé Précision du test : 2006/2007

Probabilités totales Probabilité d’obtenir un potentiel élevé ? Système complet : rien, peu, bcp 2006/2007

Théorème de Bayes Soit un système complet d’événements : Soit A un événement quelconque : Probabilités a priori : Probabilités a posteriori : 2006/2007

Théorème de Bayes Exemple : site pétrolier probabilité a posteriori : 2006/2007

Prélèvements On prélève n éléments parmi N. Les N éléments sont répartis en deux catégories. Exemple : urne remplie de boules noires et blanches. 2006/2007

Prélèvement avec remise Formule du binôme 2006/2007

Prélèvement sans remise Formule hypergéométrique 2006/2007

Prélèvements Sans remise  avec remise : Extension à plus de 2 catégories d’éléments. 2006/2007

Plan du cours Introduction Statistique descriptive – séries univariées Calcul des probabilités Variables aléatoires et lois de probabilité Statistique descriptive – séries bivariées Méthodes de prévision 2006/2007

Variable aléatoire Variable dont la valeur est déterminée par le résultat d’une expérience aléatoire. Exemples : Nombre de fois où on obtient « face » en lançant deux pièces de 1€. Somme des points obtenus en lançant 2 dés. Temps mis pour traiter une transaction à un guichet d’agence bancaire. 2006/2007

Variable aléatoire Exemple : lancer de 2 pièces de 1€  nombre X de « face » obtenus ? Ex : événement composé des résultats associés à la valeur x 2006/2007

Variable aléatoire 2006/2007

Variable aléatoire Définition : fonction définie sur W à valeurs dans un ensemble V. A chaque w de W, on associe une valeur x : 2006/2007

Variable aléatoire Si V est un ensemble discret, la v.a. est dite discrète. Si V est un ensemble continu, la v.a. est dite continue. 2006/2007

Loi d’une v.a. discrète Loi de probabilité (DP) de X : ssi : 2006/2007

Fonction de répartition Définition : Pour une DP discrète : 2006/2007

Fonction de répartition Propriétés 2006/2007

Paramètres d’une loi discrète Moyenne DO : DP : Exemple : lancer des 2 pièces 2006/2007

Paramètres d’une loi discrète Médiane : cf. distribution observée DO DP n n/2 2006/2007

Paramètres d’une loi discrète Variance : DO : DP : Exemple : lancer des 2 pièces de 1€ Ecart-type : 2006/2007

Espérance mathématique Exemple : On lance un dé. « 6 » : gain de 12€ Point impair : gain de 2€ Point pair (autre que 6) : gain de O€ Espérance de gain : 2006/2007

Espérance mathématique Définition : Variable aléatoire X Fonction Espérance mathématique : Cf. Espérance de gain (jeux de hasard). 2006/2007

Espérance mathématique Cas particuliers : Moyenne : Variance : 2006/2007

Espérance mathématique Propriété 1 : Si b est une constante : Démonstration : 2006/2007

Espérance mathématique Propriété 2 : Si a est une constante : Démonstration : 2006/2007

Espérance mathématique Propriété 3 : Si a et b sont des constantes : Démonstration : 2006/2007

Espérance mathématique Propriété 4 : Variable centrée Si X est une v.a. et m = E(X) : Démonstration : application de la propriété 3 avec : 2006/2007

Espérance mathématique Propriété 5 : Si a et b sont deux constantes, et g(X) et h(X) deux fonctions de X à valeurs réelles : 2006/2007

Variance Notation : Propriété 1 : Si b est une constante : Démonstration : 2006/2007

Variance Propriété 2 : Si a est une constante : Démonstration : 2006/2007

Variance Propriété 3 : Variable centrée Démonstration : 2006/2007

Variance Propriété 4 : Si c est une constante : Démonstration : exercice ! Propriété 5 : Variable centrée réduite Démonstration : 2006/2007

Principales lois discrètes Uniforme Binomiale Bernoulli Poisson Géométrique Binomiale négative Hypergéométrique 2006/2007

Distribution uniforme Définition : Notation : 2006/2007

Distribution uniforme Exemple : point obtenu en lançant un dé. Propriétés : 2006/2007

Distribution uniforme Propriétés : 2006/2007

Distribution binomiale Schéma de Bernoulli : Expérience aléatoire E pouvant donner lieu à un événement E (succès) E est répétée n fois de façon indépendante et dans des conditions uniformes. Exemple : on lance 4 fois une dé, E = { obtenir le 6 } 2006/2007

Formule du binôme Pour un événement E : 2006/2007

Formule du binôme Quelques résultats : 2006/2007

Formule du binôme Exemple : 4 lancés d’un dé 2006/2007

Distribution binomiale Nombre de succès (réalisations de E): X Distribution de X : distribution binomiale Cf. formule du binôme. Notation : 2006/2007

Distribution binomiale Paramètres : 2006/2007

Distribution binomiale 2006/2007

Variables aléatoire continues Variable aléatoire pouvant prendre des valeurs dans un intervalle continu. Infinité de valeurs possibles. Exemple : Roue de la Fortune L’aiguille peut s’arrêter sur n’importe quel point de la circonférence. 2006/2007

Variables aléatoires continues Infinité de valeurs possibles. La probabilité associée à chaque valeur individuelle est donc nulle ! On s’intéresse à la probabilité associée à un intervalle de valeurs. Analogie : distributions groupées et histogramme. 2006/2007

Fonction de densité de probabilité Probabilité associée à un intervalle de valeurs = surface déterminée par l’histogramme. En réduisant la largeur des classes, leur nombre augmente et la forme de l’histogramme se rapproche d’une courbe : la fonction de densité de probabilité. 2006/2007

Quelques distributions continues Distribution uniforme continue. Distribution normale. Distribution t de Student. Distribution 2. Distribution F. 2006/2007

Distribution uniforme (continue) Distribution uniforme sur [a,b] : Exemple : Roue de la Fortune [a,b] = [0°,360°] 2006/2007

Distribution normale Rôle central en statistique. Distribution en cloche (courbe de Gauss) : Dépend de 2 paramètres : m et s 2006/2007

Distribution normale réduite (standard) Cas particulier : m = 0 et s = 1 Propriété : Si X est normale m , s alors : est normale réduite. 2006/2007

Calculs Calcul de la probabilité pour un intervalle donné. Calcul d’une valeur pour une probabilité donnée. Principe : se ramener à la normale réduite. En pratique : table normale ou fonctions dans Excel. 2006/2007

Distribution t de Student Distribution en cloche. Dépend d’un paramètre : n (nb. de degrés de liberté). Moyenne = 0, Variance = n / (n - 2). 2006/2007