La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

POL1803: Analyse des techniques quantitatives

Présentations similaires


Présentation au sujet: "POL1803: Analyse des techniques quantitatives"— Transcription de la présentation:

1 POL1803: Analyse des techniques quantitatives
Cours 2 Analyse univariée

2 Question à résoudre Est-ce que le gouvernement de Jacques Parizeau a tenté de voler furtivement le référendum de 1995?

3 Programme Analyse univariée: Distribution de fréquences
Mesures de tendance centrale Mesures de variation Mesures d’asymétrie

4 Trois types d’analyse Analyse univariée: Analyse bivariée:
porte sur une seule variable à la fois Analyse bivariée: porte sur les relations entre deux variables (une variable dépendante et une variable indépendante) Analyse multivariée: porte sur les relations entre plus de deux variables

5 Utilité de l’analyse univariée
Pour répondre à plusieurs questions de recherche Pour combler une précaution méthodologique

6 Outils de l’analyse univariée
A) Distribution de fréquences (ex.: rangement, tableau et graphique) B) Mesures de tendances centrales (ex.: moyenne, mode et médiane) C) Mesures de variation (ex.: étendue, variance et écart-type) D) Mesures d’asymétrie (ex.: coefficient d’asymétrie)

7 A) Distribution de fréquences
Définition: le classement des données dans le but de les rendre intelligibles et parlantes

8 Données brutes

9 Rangement simple des données

10 Tableau de fréquences

11 Tableau de fréquences Nombres de bonnes réponses Fréquence Pourcentage
0-9 10 1 10-19 30 3 20-29 80 8 30-39 150 15 40-49 200 20 50-59 275 27,5 60-69 140 14 70-79 65 6,5 80-89 35 3,5 90-100 1,5 Total 1000 100

12 Diagramme en bâtons

13 Représentation graphique: erreurs et excellence
Origines et typologie

14 Cartographie avec données

15 Cartographie avec données

16 Cartographie avec données

17 Cartographie avec données

18 Série temporelle

19 Série temporelle

20 Combinaison espace et temps

21 Combinaison espace et temps

22 Diagramme en bâtons

23 Diagramme en bâtons

24 Diagramme de dispersion

25 Diagramme de dispersion

26 Diagramme de dispersion

27 Représentation graphique: erreurs et excellence
Comment maltraiter des données et mentir avec un graphique?

28 Aire visuelle et biais

29 Aire visuelle et biais

30 Aire visuelle et biais

31 Aire visuelle et biais

32 Aire visuelle et biais

33 Aire visuelle et biais

34 Contexte et intégrité

35 Contexte et intégrité

36 Contexte et intégrité

37 Contexte et intégrité

38 Échelles et intégrité

39 Échelles et intégrité

40 Ratio encre / données

41 Ratio encre / données

42 Ratio encre / données

43 Ratio encre / données

44 Ratio encre / données

45 Ratio encre / données

46 Ratio encre / données

47 L’usage de la couleur

48 L’usage de la couleur

49 L’usage de la couleur

50 L’usage de la couleur

51 L’usage de la couleur

52 Théorie loufoque, contenu loufoque, graphique loufoque

53 Principes de l’excellence graphique
L’excellence graphique c’est: la communication claire, précise et efficace d’idées complexes; véhiculer le plus grand nombre d’idées, dans le moins de temps possible, avec le moins d’encre possible, et avec le moins d’espace possible. (Edward Tufte, 1983)

54 L’excellence graphique

55 Raconter une histoire

56 Raconter une histoire

57 Outils de l’analyse univariée
A) Distribution de fréquences (ex.: rangement, tableau et graphique) B) Mesures de tendances centrales (ex.: moyenne, mode et médiane) C) Mesures de variation (ex.: étendue, variance et écart-type) D) Mesures d’asymétrie (ex.: coefficient d’asymétrie)

58 Un exemple 0, 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4 N = 13

59 B) Mesures de tendance centrale
Définition: Mesures servant à décrire, à résumer, à l’aide d’une valeur unique, la grandeur typique, le milieu ou le centre d’un ensemble de données.

60 Le mode (Mo) Définition:
La valeur la plus fréquente dans une série de données.

61 Un exemple 0, 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4 Mode = 3

62 Le mode (Mo) Caractéristiques:
- parfois il n’y en a pas, parfois il y en a plus d’un - fonctionne avec tous les types de variables - insensible aux valeurs extrêmes - peu utile pour l’inférence statistique

63 La médiane (Md) Définition:
La valeur qui sépare une série d’observations ordonnées en ordre croissant ou décroissant, en deux parties comportant le même nombre d’observations.

64 La médiane (Md) Formules: N impair: N + l è observation 2
où N = nombre de cas

65 Un exemple 0, 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4 Médiane = N + l è obs. = 2 13 + l è obs. = è obs = 2

66 La médiane (Md) Formules: N pair: (N/2)è obs. + (N/2 + l)è obs. 2
où N = nombre de cas

67 Un exemple 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4 Médiane = (N/2)è obs. + (N/2 + l)è obs. = 2 (12/2)è obs. + (12/2 + l)è obs. = 6è obs. + 7èobs. = = 2,5

68 La médiane (Md) Caractéristiques:
- affectée par le nombre d’observations, mais non par la valeur de toutes les observations - insensible aux valeurs extrêmes - moins utile que la moyenne pour l’inférence statistique parce qu’elle ne se prête pas à des manipulations mathématiques

69 La moyenne arithmétique (μ)
Définition: La somme des observations divisée par le nombre d’observations. Formule:  x N où  = somme de … x = observation N = nombre de cas

70 Un exemple 0, 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4 Moyenne =  x = N
28 = 2,15 13

71 La moyenne arithmétique (μ)
Caractéristiques: - très familière, couramment utilisée - influencée par toutes les observations - peut être biaisée par des valeurs extrêmes - propriétés mathématiques intéressantes et utiles pour l’inférence statistique

72 Comparaison des mesures de tendance centrale
Distribution parfaitement symétrique Mo = Md = μ

73 Comparaison des mesures de tendance centrale
Distribution asymétrique positive Mo < Md < μ

74 Comparaison des mesures de tendance centrale
Distribution asymétrique négative Mo > Md > μ

75 Comparaison des mesures de tendance centrale
Distribution bimodale Mode = mesure la plus représentative

76 C) Mesures de variation
Définition: Mesures de la représentativité de la valeur moyenne d’une série d’observations.

77 Deux cas de figure 0, 0, 0, 0, 0, 0, 2, 4, 4, 4, 4, 4, 4 μ = 2 0, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 4

78 Visualiser la variation

79 L’écart-type (s) Définition:
La racine carrée de la moyenne des carrés des écarts entre chaque observation et la moyenne.

80 L’écart-type (s) Formule: racine carrée de S (x - m)2 N
où S = somme de ... x = observation m = moyenne N = nombre de cas

81 Un exemple x 1 2 3 4 x - m 0-2,15 1-2,15 2-2,15 3-2,15 4-2,15 x - m
1 2 3 4 x - m 0-2,15 1-2,15 2-2,15 3-2,15 4-2,15 x - m -2,15 -1,15 -0,15 0,85 1,85 (x – m)2 4,62 1,32 0,02 0,72 3,42 S (x - m)2 = 21,66 S (x - m)2 N = 21,66 = 1,67 13 Racine carrée de S (x - m)2 N = ¯ 1,67 = 1,29

82 Deux cas de figure 0, 0, 0, 0, 0, 0, 2, 4, 4, 4, 4, 4, 4 Écart-type ( s) = 2 0, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 4 Écart-type (s) = 0,82

83 L’écart-type (s) Caractéristiques: - fréquemment utilisé
- tient compte de tous les écarts - assez sensible aux valeurs extrêmes - propriétés mathématiques utiles pour l’inférence statistique

84 D) Mesures d’asymétrie

85 Le coefficient d’asymétrie
Définition: Un indicateur de l’existence, de la direction et du degré d’asymétrie d’une distribution. Formule: 3 (m - Md) s Un exemple: 3 (2,15-2) / 1,29 = 0,35

86 Le coefficient d’asymétrie
si m = Md : symétrie, coeff. d’asym. = 0 si m  Md : asymétrie, coeff. d’asym.  0 si m > Md : asymétrie positive, coefficient d’asymétrie > 0 si m < Md : asymétrie négative, coefficient d’asymétrie < 0 plus l’écart entre la moyenne et la médiane est grand, plus le coefficient d’asymétrie est grand

87 Les trois dimensions On a seulement une image d’ensemble d’une distribution en considérant à la fois la tendance centrale, la variation et l’asymétrie. Comme l’histoire des trois aveugles et l’éléphant.

88 Une application concrète
Le cas des bulletins de vote rejetés au référendum de 1995

89 Un premier coup d’oeil Moyennes des bulletins rejetés dans les 125 circonscriptions du Québec selon le niveau d’appui du NON: NON  50 NON  50 1,68 % 1,99 % Interprétation: conspiration nationale pour voler le référendum

90 Analyse univariée Toutes les circonscriptions Moyenne 1,79
Médiane 1,69 Écart-type 1,04

91 Analyse univariée

92 Analyse univariée Toutes les circonscriptions Moyenne 1,79
Médiane 1,69 Écart-type 1,04 Sans deux cas déviants 1,67 1,69 0,41

93 Un deuxième coup d’oeil
Moyennes des bulletins rejetés dans les 123 circonscriptions du Québec selon le niveau d’appui du NON: NON  50 NON  50 1,68 % 1,68 % Interprétation: 2 cas déviants, pas de conspiration nationale


Télécharger ppt "POL1803: Analyse des techniques quantitatives"

Présentations similaires


Annonces Google