Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parLotte Soulier Modifié depuis plus de 10 années
1
POL1803: Analyse des techniques quantitatives
Cours 2 Analyse univariée
2
Question à résoudre Est-ce que le gouvernement de Jacques Parizeau a tenté de voler furtivement le référendum de 1995?
3
Programme Analyse univariée: Distribution de fréquences
Mesures de tendance centrale Mesures de variation Mesures d’asymétrie
4
Trois types d’analyse Analyse univariée: Analyse bivariée:
porte sur une seule variable à la fois Analyse bivariée: porte sur les relations entre deux variables (une variable dépendante et une variable indépendante) Analyse multivariée: porte sur les relations entre plus de deux variables
5
Utilité de l’analyse univariée
Pour répondre à plusieurs questions de recherche Pour combler une précaution méthodologique
6
Outils de l’analyse univariée
A) Distribution de fréquences (ex.: rangement, tableau et graphique) B) Mesures de tendances centrales (ex.: moyenne, mode et médiane) C) Mesures de variation (ex.: étendue, variance et écart-type) D) Mesures d’asymétrie (ex.: coefficient d’asymétrie)
7
A) Distribution de fréquences
Définition: le classement des données dans le but de les rendre intelligibles et parlantes
8
Données brutes
9
Rangement simple des données
10
Tableau de fréquences
11
Tableau de fréquences Nombres de bonnes réponses Fréquence Pourcentage
0-9 10 1 10-19 30 3 20-29 80 8 30-39 150 15 40-49 200 20 50-59 275 27,5 60-69 140 14 70-79 65 6,5 80-89 35 3,5 90-100 1,5 Total 1000 100
12
Diagramme en bâtons
13
Représentation graphique: erreurs et excellence
Origines et typologie
14
Cartographie avec données
15
Cartographie avec données
16
Cartographie avec données
17
Cartographie avec données
18
Série temporelle
19
Série temporelle
20
Combinaison espace et temps
21
Combinaison espace et temps
22
Diagramme en bâtons
23
Diagramme en bâtons
24
Diagramme de dispersion
25
Diagramme de dispersion
26
Diagramme de dispersion
27
Représentation graphique: erreurs et excellence
Comment maltraiter des données et mentir avec un graphique?
28
Aire visuelle et biais
29
Aire visuelle et biais
30
Aire visuelle et biais
31
Aire visuelle et biais
32
Aire visuelle et biais
33
Aire visuelle et biais
34
Contexte et intégrité
35
Contexte et intégrité
36
Contexte et intégrité
37
Contexte et intégrité
38
Échelles et intégrité
39
Échelles et intégrité
40
Ratio encre / données
41
Ratio encre / données
42
Ratio encre / données
43
Ratio encre / données
44
Ratio encre / données
45
Ratio encre / données
46
Ratio encre / données
47
L’usage de la couleur
48
L’usage de la couleur
49
L’usage de la couleur
50
L’usage de la couleur
51
L’usage de la couleur
52
Théorie loufoque, contenu loufoque, graphique loufoque
53
Principes de l’excellence graphique
L’excellence graphique c’est: la communication claire, précise et efficace d’idées complexes; véhiculer le plus grand nombre d’idées, dans le moins de temps possible, avec le moins d’encre possible, et avec le moins d’espace possible. (Edward Tufte, 1983)
54
L’excellence graphique
55
Raconter une histoire
56
Raconter une histoire
57
Outils de l’analyse univariée
A) Distribution de fréquences (ex.: rangement, tableau et graphique) B) Mesures de tendances centrales (ex.: moyenne, mode et médiane) C) Mesures de variation (ex.: étendue, variance et écart-type) D) Mesures d’asymétrie (ex.: coefficient d’asymétrie)
58
Un exemple 0, 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4 N = 13
59
B) Mesures de tendance centrale
Définition: Mesures servant à décrire, à résumer, à l’aide d’une valeur unique, la grandeur typique, le milieu ou le centre d’un ensemble de données.
60
Le mode (Mo) Définition:
La valeur la plus fréquente dans une série de données.
61
Un exemple 0, 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4 Mode = 3
62
Le mode (Mo) Caractéristiques:
- parfois il n’y en a pas, parfois il y en a plus d’un - fonctionne avec tous les types de variables - insensible aux valeurs extrêmes - peu utile pour l’inférence statistique
63
La médiane (Md) Définition:
La valeur qui sépare une série d’observations ordonnées en ordre croissant ou décroissant, en deux parties comportant le même nombre d’observations.
64
La médiane (Md) Formules: N impair: N + l è observation 2
où N = nombre de cas
65
Un exemple 0, 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4 Médiane = N + l è obs. = 2 13 + l è obs. = è obs = 2
66
La médiane (Md) Formules: N pair: (N/2)è obs. + (N/2 + l)è obs. 2
où N = nombre de cas
67
Un exemple 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4 Médiane = (N/2)è obs. + (N/2 + l)è obs. = 2 (12/2)è obs. + (12/2 + l)è obs. = 6è obs. + 7èobs. = = 2,5
68
La médiane (Md) Caractéristiques:
- affectée par le nombre d’observations, mais non par la valeur de toutes les observations - insensible aux valeurs extrêmes - moins utile que la moyenne pour l’inférence statistique parce qu’elle ne se prête pas à des manipulations mathématiques
69
La moyenne arithmétique (μ)
Définition: La somme des observations divisée par le nombre d’observations. Formule: x N où = somme de … x = observation N = nombre de cas
70
Un exemple 0, 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4 Moyenne = x = N
28 = 2,15 13
71
La moyenne arithmétique (μ)
Caractéristiques: - très familière, couramment utilisée - influencée par toutes les observations - peut être biaisée par des valeurs extrêmes - propriétés mathématiques intéressantes et utiles pour l’inférence statistique
72
Comparaison des mesures de tendance centrale
Distribution parfaitement symétrique Mo = Md = μ
73
Comparaison des mesures de tendance centrale
Distribution asymétrique positive Mo < Md < μ
74
Comparaison des mesures de tendance centrale
Distribution asymétrique négative Mo > Md > μ
75
Comparaison des mesures de tendance centrale
Distribution bimodale Mode = mesure la plus représentative
76
C) Mesures de variation
Définition: Mesures de la représentativité de la valeur moyenne d’une série d’observations.
77
Deux cas de figure 0, 0, 0, 0, 0, 0, 2, 4, 4, 4, 4, 4, 4 μ = 2 0, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 4
78
Visualiser la variation
79
L’écart-type (s) Définition:
La racine carrée de la moyenne des carrés des écarts entre chaque observation et la moyenne.
80
L’écart-type (s) Formule: racine carrée de S (x - m)2 N
où S = somme de ... x = observation m = moyenne N = nombre de cas
81
Un exemple x 1 2 3 4 x - m 0-2,15 1-2,15 2-2,15 3-2,15 4-2,15 x - m
1 2 3 4 x - m 0-2,15 1-2,15 2-2,15 3-2,15 4-2,15 x - m -2,15 -1,15 -0,15 0,85 1,85 (x – m)2 4,62 1,32 0,02 0,72 3,42 S (x - m)2 = 21,66 S (x - m)2 N = 21,66 = 1,67 13 Racine carrée de S (x - m)2 N = ¯ 1,67 = 1,29
82
Deux cas de figure 0, 0, 0, 0, 0, 0, 2, 4, 4, 4, 4, 4, 4 Écart-type ( s) = 2 0, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 4 Écart-type (s) = 0,82
83
L’écart-type (s) Caractéristiques: - fréquemment utilisé
- tient compte de tous les écarts - assez sensible aux valeurs extrêmes - propriétés mathématiques utiles pour l’inférence statistique
84
D) Mesures d’asymétrie
85
Le coefficient d’asymétrie
Définition: Un indicateur de l’existence, de la direction et du degré d’asymétrie d’une distribution. Formule: 3 (m - Md) s Un exemple: 3 (2,15-2) / 1,29 = 0,35
86
Le coefficient d’asymétrie
si m = Md : symétrie, coeff. d’asym. = 0 si m Md : asymétrie, coeff. d’asym. 0 si m > Md : asymétrie positive, coefficient d’asymétrie > 0 si m < Md : asymétrie négative, coefficient d’asymétrie < 0 plus l’écart entre la moyenne et la médiane est grand, plus le coefficient d’asymétrie est grand
87
Les trois dimensions On a seulement une image d’ensemble d’une distribution en considérant à la fois la tendance centrale, la variation et l’asymétrie. Comme l’histoire des trois aveugles et l’éléphant.
88
Une application concrète
Le cas des bulletins de vote rejetés au référendum de 1995
89
Un premier coup d’oeil Moyennes des bulletins rejetés dans les 125 circonscriptions du Québec selon le niveau d’appui du NON: NON 50 NON 50 1,68 % 1,99 % Interprétation: conspiration nationale pour voler le référendum
90
Analyse univariée Toutes les circonscriptions Moyenne 1,79
Médiane 1,69 Écart-type 1,04
91
Analyse univariée
92
Analyse univariée Toutes les circonscriptions Moyenne 1,79
Médiane 1,69 Écart-type 1,04 Sans deux cas déviants 1,67 1,69 0,41
93
Un deuxième coup d’oeil
Moyennes des bulletins rejetés dans les 123 circonscriptions du Québec selon le niveau d’appui du NON: NON 50 NON 50 1,68 % 1,68 % Interprétation: 2 cas déviants, pas de conspiration nationale
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.