La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Introduction Les concepts de base Thèmes La statistique - pourquoi? Les statistiques descriptives –Analyse des fréquences Les distributions.

Présentations similaires


Présentation au sujet: "Introduction Les concepts de base Thèmes La statistique - pourquoi? Les statistiques descriptives –Analyse des fréquences Les distributions."— Transcription de la présentation:

1

2

3

4

5

6

7

8 Introduction Les concepts de base

9 Thèmes La statistique - pourquoi? Les statistiques descriptives –Analyse des fréquences Les distributions –Les mesures de tendance centrale Quelle mesure faut-il prendre ? –Les mesures de la dispersion –La relation entre deux variables La statistique inférentielle

10 La statistique sert à... La description des données Inférence: étude des caractéristiques dune population à partir dun sous- ensemble (échantillon) tiré de cette population –Estimation des paramètres –Vérification des hypothèses

11 Présentation de toutes les données

12 La statistique descriptive Les étapes –Poser une question –Élaborer une étude (choix de léchantillon, choix des mesures) –Récolter les données –Décrire les données –Interpréter les données HypothèseDonnéesConclusion

13 Un exemple Question: Développement de la population Méthode: Recensions de la population au Canada

14 Tracé en arborescence

15 Type de variables Variable: Une variable est une caractéristique qui peut supposer plus d'un ensemble de valeurs auquel il est possible d'attribuer une mesure numérique Les variables nominales servent uniquement à catégoriser, aucun ordre et aucune métrique ne correspond à la classification (ex: couleur des yeux) Les variables ordinales fournissent un ordre. Pourtant les intervalles entre les catégories correspondant aux chiffres peuvent être variables (ex: mise en rang des préférences) Les variables par intervalles sont métriques. Des intervalles égaux et mesurables existent entre chacune des catégories, pourtant le point zéro est arbitraire (ex: échelles de température Fahrenheit et Celsius) Les variables de rapport sont des variables par intervalle avec un zéro absolu (ex: les fréquences absolues, léchelle de température Kelvin)

16 Analyse des fréquences

17 Taille des personnes

18 Forme de la distribution Distribution bimodale Distribution symétrique moyenne = médiane = mode Biais positif: moyenne > médiane > mode Biais négatif: mode > médiane > moyenne

19 SPSS - Frequencies

20

21

22 Mesures de la tendance centrale Mode : Valeur ou catégorie dune variable ayant la plus forte fréquence Médiane : Valeur qui divise le nombre des observations dune distribution en deux parts égales Moyenne arithmétique : Somme pondérée des valeurs dune variable

23 Exemple Données: nombre de partenaires sexuelles

24 Calcul du mode La valeur la plus fréquente

25 Calcul de la médiane Trier les observations selon leur ordre de magnitude Identifiez le chiffre au milieu Ex. : Quelle est la médiane de la série suivante ?: 11, 11, 13, 15, 17, 17, 17, 19, 19, 19, 19 et de celle-ci ?: 1,5,6,9,11,12

26 Calcul de moyenne µ = x/n Ex. : la moyenne de 1,2,3,6,6,7,9 est: La somme x est (1+2+3+…+9) = 34 Il y a n = 7 observations µ = 34 / 7 = 4.9

27 Autre types de moyennes Trimean: La somme du 25e quartile (Q1) plus deux fois le 50e quartile (Q2) plus le 75e quartile (Q3) divisé par 4. Donc: (Q1 + (2*Q2) + Q3)/4 Moyenne tronquée (trimmed mean): Avant de calculer la moyenne 5% des valeurs extrêmes sont enlevées (Ex: Notes de patinage artistique)

28 Exemple Tendence centraleFemmesHommes Mode11 Median14 Moyenne Trimean Trimmed mean

29 SPSS - Explore

30

31

32 Quelle mesure faut-il prendre ? Échelle de mesure Distribution des données

33 Distribution Un chercheur pose la question à savoir combien de livres de statistique et de méthodologie possèdent les étudiants. Dans un groupe cours les 5 étudiants ont tous un livre de stats de leurs cours du CEGEP, du Bac et du Doctorat ainsi que deux livres de métho.

34 Dans un autre cours, plusieurs étudiants ont vendu certains livres alors que dautres étudiants ont acheté des livres plus spécialisés.

35 Finalement, dans un autre groupe cours, il y a une personne qui possède maintenant 12 livres.

36 Mesures de la dispersion Pourquoi? Les mesures de tendance centrale décrivent les observations "en général" ou "en moyenne". Les mesures de la dispersion nous informent jusqu'à quel point ces observations sont proche ou loin de leur "moyenne".

37 Létendue La différence entre la valeur la plus grande et la valeur la plus petite. Cette mesure est très sensible aux valeurs extrêmes. Ex: létendu: 13-3 = 10 Femmes: 100Hommes: 253

38 Intervalle semi-interquartile La moitié de la différence entre le 75e quartile (Q3) et le 25e quartile (Q1). Donc: (Q3-Q1)/2. Cette mesure est très peu sensible au valeurs extrêmes. Femmes: 2Hommes: 9

39

40 Écart-type Sommes des carrés (SC) = Variance (s 2 ) = SS/N-1 Écart-type (s) = Femmes: 6.25Hommes: Femmes: 39.08Hommes:

41 Erreur-type

42 La relation entre deux variables

43 La covariance La moyenne du produit des déviations des valeurs des variables par rapport à leur moyenne. Cette mesure varie selon l'échelle de mesure. Ex: On obtient une valeur différente pour la taille quand on la mesure soit en pouce soit en centimètre.

44 La corrélation: La covariance divisée par le produit des écart types des variables Le coefficient de corrélation varie entre -1 et 1. Le signe correspond à la direction de la corrélation. Quand les deux valeurs augmentent ou diminuent ensemble il s'agit d'une corrélation positive. Quand une valeur augmente alors que l'autre diminue il s'agit d'une corrélation négative La taille absolue correspond au degré du lien entre les deux variables

45 Corrélation

46 Sir Francis Galton se posa la question à savoir sil y a un lien entre la taille des parents et la taille de leurs enfants. Il a donc mesuré la taille de 952 parents et de leurs enfants. Exemple Sir Francis Galton

47 Régression vers la moyenne

48 SPSS - Corrélations

49 Fenêtre des variables

50 Output

51 Scatterplot

52

53

54 LE THÉORÈME DES LIMITES CENTRALES La statistique inférentielle

55 Un dé

56 Deux dés

57 Trois dés

58 Quatre dés

59 Le théorème des limites centrales Pour une variable x avec une distribution de moyenne µ et dun écart-type, la distribution déchantillonnage de la moyenne x, basé sur un échantillon aléatoire de la taille n, a: –une forme qui approche la courbe normale pour les tailles déchantillons larges –une moyenne égale à µ et – un écart-type égal à:

60 Les tests dhypothèses Comparaison entre deux moyennes Estimation des paramètres

61 Stendhal (1839) La chartreuse de Parme J'avouerai que j'ai eu la hardiesse de laisser au personnages les aspérités de leurs caractères; mais, en revanche, je le déclare hautement, je déverse le blâme le plus moral sur beaucoup de leurs actions. A quoi bon leur donner la haute moralité et les grâces des caractères français, lesquels aiment l'argent par-dessus tout et ne font guère de péchés par haine ou par amour? Les Italiens de cette nouvelle sont à peu près le contraire.

62 Étude de Stieglitz et al.

63 Intervalle de confiance La moyenne m est un estimé de µ Lerreur-type (se) est un estimé de Dans une distribution normale 68% des valeur se retrouvent dans la région dun E.T. autour de la moyenne, 95% se retrouvent dans la région de deux E.T. autours de la moyenne

64 Intervalles de confiance

65 Intervalle de confiance de la différence m = = 6.4

66 Statistique inférentielle Tests dhypothèses

67 Logique du Test - T Si les deux échantillons proviennent dune même population les moyennes devraient être à peu près identiques Nous comparons la différence entre les deux moyennes avec un estimé de la dispersion des moyennes dans la population (erreur-type). Quand la différence est plus grande que notre estimé de la dispersion laisse croire, les deux moyennes sont soit: –Atypiques pour une seule population –Typiques pour leur population et proviennent de populations différentes

68 Courbe t avec s =.06 Carl Friedrich Gauss Avril, (Braunschweig, Allemagne) - Février, (Göttingen, Allemagne)

69 SPSS - T-test W.S. Gosset (1905)

70

71


Télécharger ppt "Introduction Les concepts de base Thèmes La statistique - pourquoi? Les statistiques descriptives –Analyse des fréquences Les distributions."

Présentations similaires


Annonces Google