La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Comprendre la variation dans les données: Notions de base.

Présentations similaires


Présentation au sujet: "Comprendre la variation dans les données: Notions de base."— Transcription de la présentation:

1 Comprendre la variation dans les données: Notions de base

2 Expérience de la pièce de monnaie

3 La Statistique c est quoi? Cest la science de la collecte, de lorganisation et de linterprétation de faits numériques, ce que lon appelle les données (Moore et McCabe). Collecte: par exemple, lors de la planification des sondages, population cible, organisation de questionnaires, plan de sondage, etc. Organisation: une fois les données obtenues, il faut les traiter, les coder, avant de procéder aux analyses. Interprétation: choix des techniques statistiques, partie scientifique mais aussi artistique.

4 Vocabulaire de base de la statistique: Population: ensemble des personnes, objets ou éléments sur lesquels on veut effectuer l étude.Population: ensemble des personnes, objets ou éléments sur lesquels on veut effectuer l étude. Individu: chacun des éléments de la population.Individu: chacun des éléments de la population. Caractère (variable) : caractéristique relative à chacun des individus de la population et sur laquelle on veut faire porter l étude.Caractère (variable) : caractéristique relative à chacun des individus de la population et sur laquelle on veut faire porter l étude.

5 Les mesures de tendance centrale Moyenne:Moyenne: –Somme des données / Nombre de données.

6 Médiane:Médiane: –La médiane est un nombre tel que la proportion des observations qui lui sont inférieures est tout au plus de 50% et la proportion des observations qui lui sont supérieures est tout au plus de 50%. –P(X Md) 50%.

7 zSi N (ou n) est impair, la médiane correspond alors précisément à la donnée du milieu lorsque les données sont mises en ordre croissant. zSi N (ou n) est pair, la médiane correspond alors à tout nombre situé entre les deux données du centre des données mises en ordre croissant

8 Les mesures de dispersion Maintenant que nous connaissons la tendance centrale d une distribution, nous pouvons nous demander si les valeurs de la variable sont fortement concentrées autour de cette tendance centrale ou, au contraire, si elles sont très différentes, très dispersées.Maintenant que nous connaissons la tendance centrale d une distribution, nous pouvons nous demander si les valeurs de la variable sont fortement concentrées autour de cette tendance centrale ou, au contraire, si elles sont très différentes, très dispersées.

9 L étendue:L étendue: –L étendue d une distribution est la largeur totale de celle-ci. –L étendue = Maximum - Minimum. –Pour une variable continue ou discrète avec valeurs regroupées en classes: l étendue = borne supérieure de la dernière classe - borne inférieure de la première classe.l étendue = borne supérieure de la dernière classe - borne inférieure de la première classe. –Exemples.

10 zLa variance: yLa variance d une distribution ( 2 ) est la moyenne des carrés des écarts, par rapport à la moyenne, de toutes les valeurs de celle-ci.

11 zL écart type: yL écart type d une distribution ( ) est simplement défini comme la racine carré de la variance.

12 Interprétation de l écart type En général on retrouve :En général on retrouve : –une grande proportion des données dans l intervalle [ -, + ] (souvent entre 50 et 70%), –souvent plus de 95% des données dans l intervalle [ - 2, + 2 ], –toutes les données (ou presque 100%) dans l intervalle [ - 3, + 3 ].

13 Représentation graphique des données HistogrammeHistogramme

14 L échantillonnage Notre connaissance, nos attitudes et nos actions sont basés, en grande partie, sur des échantillons. Notre connaissance, nos attitudes et nos actions sont basés, en grande partie, sur des échantillons. Par exemple, lopinion dune personne sur une institution ou une entreprise qui fait des milliers de transactions dans une journée est souvent déterminé par seulement une ou deux rencontres avec cette institution. Par exemple, lopinion dune personne sur une institution ou une entreprise qui fait des milliers de transactions dans une journée est souvent déterminé par seulement une ou deux rencontres avec cette institution.

15 Recensement vs Échantillon Recensement = véritéRecensement = vérité linformation que lon désire est disponible pour tous les individus de la population étudiée. Échantillon = estimation de la véritéÉchantillon = estimation de la vérité linformation nest disponible que pour un sous-ensemble des individus de la population étudiée.

16 Avantages dun échantillon Coût réduitCoût réduit Rapidité accrueRapidité accrue Offre plus de possibilitésOffre plus de possibilités dans certains cas il peut être impossible de faire un recensement (ex: contrôle de qualité) Peut-être plus précis!Peut-être plus précis! cas où une main-dœuvre hautement qualifiée est requise pour la collecte des données

17 Échantillons probabilistes et non probabilistes

18 Les erreurs déchantillonnages Erreur aléatoireErreur aléatoire édifférents échantillons vont produire différentes estimations de la caractéristique de la population à létude Erreurs systématiques - biaisErreurs systématiques - biais ééchantillon non probabiliste ééchantillon probabiliste mais avec un taux élevé de non-répondants éinstrument de mesure biaisé

19 Remarques : Les résultats obtenus dépendent de l échantillon prélevé.Les résultats obtenus dépendent de l échantillon prélevé. Si les échantillons sont prélevés selon les règles de l art, tous les résultats devraient se ressembler.Si les échantillons sont prélevés selon les règles de l art, tous les résultats devraient se ressembler. Pour un tirage aléatoire simple, chaque individu de la population a la même chance d être sélectionné à chaque tirage.Pour un tirage aléatoire simple, chaque individu de la population a la même chance d être sélectionné à chaque tirage. Pour un tirage aléatoire simple, il y a plusieurs échantillons possibles et qui sont différents. Tous les échantillons possibles de même taille ont la même chance d être sélectionnés.Pour un tirage aléatoire simple, il y a plusieurs échantillons possibles et qui sont différents. Tous les échantillons possibles de même taille ont la même chance d être sélectionnés.

20 Quest-ce quune statistique Mesure calculée à partir dun échantillonMesure calculée à partir dun échantillon –Ex: moyenne, écart-type Cette estimation varie donc dun échantillon à lautre.Cette estimation varie donc dun échantillon à lautre. La distribution dune statistique est obtenue à partir de lhistogramme des valeurs potentielles de la statistiqueLa distribution dune statistique est obtenue à partir de lhistogramme des valeurs potentielles de la statistique –Suppose une distribution, comme la distribution normale –On utilise des méthodes de simulation appelées méthodes de Monté-Carlo


Télécharger ppt "Comprendre la variation dans les données: Notions de base."

Présentations similaires


Annonces Google