POL1803: Analyse des techniques quantitatives

Slides:



Advertisements
Présentations similaires
Introduction à la notion de fonction 1. Organisation et gestion de données, fonctions 1.1. Notion de fonction ● Déterminer l'image d'un nombre par une.
Advertisements

Généralisation de la comparaison de moyennes par Analyse de la variance (ANOVA)
Chapitre 5. Modèles probabilistes continus Variable aléatoire continue et loi de probabilité continue Loi uniforme Loi exponentielle Loi normale Loi normale.
Dr. Tarek Barhoumi statistiques descriptives Statistiques descriptives Dr. Tarek Barhoumi.
De la fonction à la dérivée : la covariation à la rescousse!
Le Mouvement Directionnel
Naissances à l’hôpital au Canada : un regard sur les femmes vivant dans les régions rurales et éloignées Diffusion le 4 juillet 2013.
Colloque francophone sur les sondages 2016
Application des lois de probabilité -Variable aléatoire discrète-
Chapitre 4: Variation dans le temps
Le 2ème tour de la primaire de la droite et du centre
Corrélation et causalité
Valeurs de toutes les différences observables sous H0
LA THEORIE DU PRODUCTEUR
Inégalités culturelles Réalités et perceptions
Besoin d’une volontaire pour lancer un volant de Badminton !
1.3 COORDONNÉES DES POINTS
Reprise du cours ( ) Aujourd’hui :
Chapitre 4: Variation dans le temps
CHAPITRE III Hypothèses de la Résistance des Matériaux
Section 1.1 : Unités du système international (SI)
Mesures de Variation, Coefficient Multiplicateur, Taux de Variation
Chapitre 13 : Echantillonnage
Fonctions.
Dimitri Zuchowski et Marc-Élie Lapointe
PowerPoint 1 (secondaire) : Gouvernement et démocratie
Élection québécoise du 1er mai 1878.
Reprise du cours ( ) Au menu du jour :
Semaine #4 INF130 par Frédérick Henri.
Plan la séance 10 L’analyse des données qualitatives
Statistiques Sociales LC3
La clarification du lien entre l’intolérance à l’incertitude et l’orientation négative aux problèmes: étude 2. Philippe Roy1, Alexandre Bouvette1, Frédéric.
Méthode Taguchy Analyse de la variance Anavar
Introduction aux statistiques Intervalles de confiance
Plan la séance 12 L’analyse multivariée et la présentation des données
Élection canadienne du 21 septembre 1911.
Pourquoi étudier la statistique ?
Chapitre 3 : Caractéristiques de tendance centrale
Notion de risque et mesures d’association
Chapitre 4: Préparer pour l’avenir
Résolutions et réponses
Les changements d’état de l’eau
Thème Sujet à développer
CRITERES DE QUALITE 1) PRECISION 2) RAPIDITE 3) AMORTISSEMENT
Généralités sur les fonctions
Statistique descriptive Bivariée
4°) Intervalle de fluctuation :
LA DESCRIPTION DU DIAGRAMME ÉNERGÉTIQUE
Information sur survies des patients en dialyse péritonéale, en France métropolitaine dans le RDPLF Année 2016.
Lois de Probabilité Discrètes
Lois de Probabilité Discrètes
Second degré Dérivation Suites Statistiques Probabilités
Chapitre 4: Caractéristiques de dispersion
Diapositives secondaire 12B: Recherche sur la participation électorale
STAT D103 Esteban Callejas Perez H.4.145
Présentation 4 : Sondage stratifié
Chapitre 10 : De l’atome à l’Univers Les objectifs de connaissance :
chapitre 3 Les Statistiques
4. l’élasticité de la demande: pour connaitre la réaction du consommateur en cas de variation des prix des biens ainsi que de son revenu , on fait appel.
Projection, cosinus et trigonométrie.
Les calculs usuels sur les prix
La logique d’une table de mobilité sociale intergénérationnelle
Calcul de précision dans le cas d’échantillons rotatifs: le cas des statistiques EU-SILC au Luxembourg 10e COLLOQUE FRANCOPHONE SUR LES SONDAGES, Lyon,
Tableaux croisés dynamiques sous Excel: des outils simples pour une analyse rapide de jeux de données en cytométrie Camille SANTA MARIA Ingénieur d’étude.
Chap3/. L’approche macro-économique
LE TORSEUR STATIQUE 1) Définition 2) Notation 3) Deux cas particuliers
Élection canadienne du 7 novembre 1900.
Les 6 aspects de la pensée historique
Le paysage politique fédéral
Le paysage politique fédéral
Transcription de la présentation:

POL1803: Analyse des techniques quantitatives Cours 4 Analyse bivariée et tableaux croisés

Introduction à l’analyse causale L’analyse bivariée Introduction à l’analyse causale

Question Est-ce que les opinions sur le niqab sont liées au vote des Canadiens lors de l’élection de 2015?

D’abord, la théorie Hypothèse: X      Y Cause      Effet Énoncé au sujet d’une relation causale entre deux variables. X      Y Cause      Effet Var. indép.      Var. dép.

Variables Variable indépendante: Variable dépendante: Variable qui, dans une relation entre deux variables ou dans un système de relations entre variables, est la variable explicative d’une autre. Variable dépendante: Variable qui, dans une relation entre deux variables ou dans un système de relations entre variables, est la variable expliquée par une autre.

Hypothèses Conditions      Valeurs économiques culturelles Mode de      Taux de scrutin participation Appui à la      Vote pour souveraineté le PCC

Ensuite, l’empirie Association statistique: Direction, force et forme du lien de dépendance statistique entre deux variables.

Association statistique Direction Positive: lorsque des variables varient dans le même sens. Ex.: scolarité et participation électorale Négative: lorsque des variables varient en sens inverse. Ex.: scolarité et intolérance

Association statistique Force Forte: lorsque la variation d’une variable est accompagnée par une importante variation de l’autre variable. Faible: lorsque la variation d’une variable n’est pas accompagnée par une importante variation de l’autre variable.

Association statistique Forme Linéaire: lorsque la variation d’une variable est accompagnée d’une variation régulière (monotonique) de l’autre variable. Non-linéaire: lorsque la variation d’une variable est accompagnée d’une variation irrégulière de l’autre variable.

Association statistique Techniques différentes pour différents types de variables.

Le tableau croisé Définition: Technique pour représenter l’association statistique entre deux variables possédant un faible nombre de catégories.

Le tableau de fréquences Nombres de bonnes réponses Fréquence Pourcentage 0-9 10 1 10-19 30 3 20-29 80 8 30-39 150 15 40-49 200 20 50-59 275 27,5 60-69 140 14 70-79 65 6,5 80-89 35 3,5 90-100 1,5 Total 1000 100

Le tableau croisé Âge Appui à la souv. 64 (80%) 36 (30%) 100 (50%) 16 Faible Élevé Appui à la souv. 64 (80%) 36 (30%) 100 (50%) 16 (20%) 84 (70%) 80 (100%) 120 200

Direction positive

Direction positive Scolarité Tolé-rance 36 (30%) 64 (80%) 100 (50%) 84 Faible Élevée Tolé-rance 36 (30%) 64 (80%) 100 (50%) 84 (70%) 16 (20%) 120 (100%) 80 200

Direction négative

Direction négative Âge Réseaux sociaux 64 (80%) 36 (30%) 100 (50%) 16 Faible Élevé Réseaux sociaux 64 (80%) 36 (30%) 100 (50%) 16 (20%) 84 (70%) 80 (100%) 120 200

Forme linéaire

Forme curvilinéaire

Force: trois cas de figure Association nulle Association positive parfaite Association négative parfaite

L’association nulle Définition: Il n’y a pas d’association statistique. La variation d’une variable n’est pas du tout accompagnée par une variation de l’autre variable. Connaître la valeur d’une observation sur une variable ne nous permet absolument pas de prédire la valeur de cette observation sur l’autre variable.

L’association nulle Façons de la reconnaître: 1) La distribution de la variable dépendante est la même pour toutes les catégories de la variable indépendante. 2) Il y a égalité des pourcentages en colonne pour chacune des rangées.

L’association nulle: un exemple Scolarité Faible Élevée Inform. polit. 90 (75%) 60 150 30 (25%) 20 50 120 (100%) 80 200

L’association positive parfaite Définition: Association positive la plus forte possible. La variation d’une variable est accompagnée par une variation identique de l’autre variable. Connaître la valeur d’une observation sur une variable nous permet de prédire parfaitement la valeur de cette observation sur l’autre variable.

L’association positive parfaite Façons de la reconnaître: 1) Toutes les observations se trouvent sur une diagonale (axe SO-NE), alors que l’autre diagonale (axe NO-SE) est complètement vide. 2) Il y a divergence maximale (100%) des pourcentages en colonne pour chacune des rangées.

L’association positive parfaite: un exemple Scolarité Faible Élevée Inform. politique (0%) 80 (100%) (40%) 120 (60%) 200

L’association négative parfaite Définition: Association négative la plus forte possible. La variation d’une variable est accompagnée par une variation identique de l’autre variable. Connaître la valeur d’une observation sur une variable nous permet de prédire parfaitement la valeur de cette observation sur l’autre variable.

L’association négative parfaite Façons de la reconnaître: 1) Toutes les observations se trouvent sur une diagonale (axe NO-SE), alors que l’autre diagonale (axe SO-NE) est complètement vide. 2) Il y a divergence maximale (100%) des pourcentages en colonne pour chacune des rangées.

L’association négative parfaite: un exemple Scolarité Faible Élevée Inform. politique 120 (100%) (0%) (60%) 80 (40%) 200

Entre les cas de figure: la réalité Façons d’évaluer la force d’une association non-nulle et non-parfaite: 1) L’ampleur des écarts entre les pourcentages en colonnes pour chacune des rangées. 2) Une mesure synthétique plus précise, le Gamma.

Le gamma (G ou ) Définition: Mesure qui résume la direction et la force d’une association statistique dans un tableau croisé. Calcul ... la semaine prochaine

Interprétation du gamma L’échelle s’étend de -1 à +1. 0 signifie une association nulle. Signe négatif signifie une ass. négative. -1 signifie une ass. négative parfaite. Signe positif signifie une ass. positive. +1 signifie une ass. positive parfaite.

Interprétation du gamma ± ] 0 - 0,25 [ : Faible ± [ 0,25 - 0,50 [ : Moyenne ± [ 0,50 - 0,75 [ : Forte ± [ 0,75 - 1 [ : Très forte

Variables nominales Homme      Information Sexe Inform. politique Femme Homme Inform. politique Élevée 36 (30%) 64 (80%) 100 Faible 84 (70%) 16 (20%) 120 80 200 Homme      Information

Variables nominales Catholique      PLC Religion Vote fédéral 36 Autre Catholique Vote fédéral PLC 36 (30%) 64 (80%) 100 84 (70%) 16 (20%) 120 80 200 Catholique      PLC

Variables nominales Il faut tenir un discours en fonction de la catégorie de référence (celle qui se trouve dans la case élevée). Exemple: il y a une association statistique positive entre le fait d’être catholique et le fait de voter pour le PLC.

Statistiques inférentielles Est-ce que la relation entre les deux variables dans l’échantillon existe aussi dans la population? Moyen: calculer la signification statistique de l’association dans l’échantillon

Signification statistique Quelle est la probabilité de trouver une association dans l’échantillon quand il n’y en a pas dans la population? Quand la probabilité est assez faible, on jugera que l’association est statistiquement significative. Quand la probabilité n’est pas assez faible, on jugera que l’association n’est pas statistiquement significative. Seuil: 1 sur 20, 5%, 0,05

La distribution normale

Le chi-carré (2) Définition: Mesure du niveau de signification statistique d’une association statistique dans un tableau croisé. Calcul ... la semaine prochaine

Interprétation du chi-carré Est-ce que la valeur du chi-carré est supérieure à 3,84? Si oui, l’association est statistiquement significative, on rejette l’hypothèse nulle, et on conclut que l’association existe probablement dans la population.

Interprétation du chi-carré Est-ce que la valeur du chi-carré est supérieure à 3,84? Si non, l’association n’est pas statistiquement significative, on ne rejette pas l’hypothèse nulle, et on ne peut pas conclure que l’association existe probablement dans la population.

Question Est-ce que les opinions sur le niqab sont liées au vote des Canadiens lors de l’élection de 2015?

Qui a voté Libéral? Gamma = -0,25 Chi-carré = 35,0

Qui a voté NPD? Gamma = -0,23 Chi-carré = 20,2

Qui a voté Conservateur? Gamma = 0,37 Chi-carré = 65,3

Qui a voté Bloc? Gamma = 0,54 Chi-carré = 28,6

Remarque finale Il ne faut jamais confondre association statistique et relation causale. Le fait de trouver que deux variables varient ensemble n’implique pas automatiquement que l’une est la cause de l’autre. Patientez quelques semaines. Pour le moment, limitez votre discours à l’usage du terme association statistique.