Régression linéaire multiple : hypothèses & interprétation

Slides:



Advertisements
Présentations similaires
Corrélation Position du problème Définition covariance (X,Y) r =
Advertisements

Probabilités et statistiques au lycée
Les modèles à choix discrets
La régression logistique: fondements et conditions d’application
Inférence statistique
C1 Bio-statistiques F. KOHLER
Inférence statistique
Les TESTS STATISTIQUES
Scoring Séance II.
Statistique descriptive
Régression -corrélation
1 Statistiques Séance 5 – 9 Nov Résumé séance précédente Lécart-type σ ou s. Comment le calculer? Les propriétés numériques de la courbe normale.
Christelle Scharff IFI 2004
Traitement de données socio-économiques et techniques d’analyse :
Tests de comparaison de moyennes

La Régression Multiple
Etude longitudinale d’essais multilocaux: apports du modèle mixte
Régression linéaire simple
STATISTIQUES – PROBABILITÉS
L’Analyse de Covariance
Corrélation et régression linéaire simple
Modeles Lineaires.
La corrélation et la régression
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Le comportement des coûts Chapitre 3
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
Analyse factorielle de variance: Principes d’expérimentation
La régression multiple
Régression linéaire (STT-2400)
Les intervalles de confiance pour la moyenne d’une population
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement
Mesures dans le temps Claude Marois 2012.
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Régression linéaire multiple : hypothèses & tests. Partie 3.
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires.
Corrélation et régression linéaire
Quelques principes de référence pour l’évaluation des systèmes éducatifs Alain Mingat Décembre 2013.
Méthodes de Biostatistique
Méthodes de Biostatistique
Méthodes de Biostatistique
Statistique Descriptive Analyse des données
Méthodologie expérimentale : l’analyse des données
LA REGRESSION MULTIPLE
Introduction à l’analyse statistique
2. Modèles linéaires.
STATISTIQUES ANALYTIQUES (suite)
une introduction pragmatique
PRINCIPE DES TESTS D’HYPOTHÈSE
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Lien entre deux variables
Présentation du marché obligataire
Probabilités et Statistiques Année 2010/2011
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 1 Comparaisons multiples Ce qu’elles sont.
Notions de coûts et prise de décision
1 BIO 4518: Biostatistiques appliquées Le 1er novembre 2005 Laboratoire 7 ANCOVAs (Analyse de covariance)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :52 1 Comparaisons multiples Ce qu’elles sont.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Méthode des moindres carrés (1)
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
Le modèle de régression linéaire Claude Marois © 2010.
Statistique Descriptive Les Paramètres de Tendance Centrale
ETUDES PRONOSTIQUES Pr Ganry.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Transcription de la présentation:

Régression linéaire multiple : hypothèses & interprétation

Régression linéaire multiple Comparaison SLR / MLR Le terme d’erreur u représente tous les autres facteurs inobservés qui déterminent y Le terme d’erreur d’une SLR contient les variables explicatives d’une MLR. Le modèle MLR est donc plus riche et conduit à une meilleur estimation du modèle. Interprétation en termes d’effet marginal Variantes du modèles logarithme de la variable expliquée Non linéarité de l’effet des variables explicatives (problème de spécification du modèle)

Régression linéaire multiple: Modèles et interprétation Forme du modèle Interprétation Modèle 2 Modèle 3

Régression linéaire multiple Forme fonctionnelle Terme d’erreur : définition et propriétés

Goodness of fit Objectif : Mesurer la précision de la régression: à quel point les variables dépendantes expliquent la variable indépendante. On utilise le R2 (en %) : ratio de la variation expliquée sur la variation totale, ie proportion de la variation de y expliquée par les x’s, ou encore la part de la variation de yi qui est capturée par la variation de y^i. Rappel Interprétation graphique : ajustement de la droite OLS. Un R2 faible (proche de zéro) implique que le pouvoir prédictif est faible. Il n’indique pas que le pourvoir descriptif est faible, mais qu’il faut utiliser d’autres variables explicatives. Un R2 élevé (proche de 1) implique que le modèle est bon pour la description et la prédiction.

Tests de significativité Test d’hypothèse simple Hypothèse nulle contre hypothèse alternative Seuils de significativité : 1% 5 % 10% Statistique de Student (t-statistic) : on rejette le test si elle supérieure en valeur absolue au seuil de rejet égal au quantile d’ordre 97.5% Test d’hypothèse multiple Seuils de significativité: 1% 5 % 10% Statistique de Fisher (F-statistic) : on rejette le test si elle supérieure au seuil de rejet égal au quantile d’ordre 95% NB: faire attention au nombre de degrés de liberté relatif à chaque statistique ! Intervalles de confiance : un autre moyen de tester des hypothèses

Distributions et tests

Exemple

Méthodologie de l’étude économétrique On s’intéresse aux déterminants du niveau de salaire. Étape 1 : le salaire est la variable expliquée y, en l’occurrence le salaire. Etude préalable à l’aide des statistiques descriptives classiques : boîte à moustache (moyenne, médiane, quartiles, mode, min, max) taux de non renseignés, histogramme et distribution des salaires. Étape 2 : choix des variables explicatives, les x_i, en l’occurrence le plus haut niveau d’étude, expérience professionnelle et formation continue. Utiliser la littérature économique en s’appuyant sur un ou plusieurs articles de référence (revue de littérature). Etude préalable des variables explicatives à l’aide des statistiques descriptives à nouveau. Tracer les courbes de la variable expliquée y en fonction de chacune des variables explicatives x_i pour connaître la forme du modèle (modèle 1, 2 ou 3). Étape 3 : On pose le modèle. Exemple : log(salaire) = β0 + β1 educ + β2 exp + β3 form +υ Étape 4 : On estime les coefficients B_j et on interprète les coefficients conformément au modèle choisi. Étape 5 : étude du pouvoir descriptif du modèle. On analyse la qualité de la modélisation en utilisant le R^2, les tests et les intervalles de confiance. Etape 6 : étude du pouvoir prédictif du modèle . On applique les coefficients estimés sur des individus qui n’ont pas servis de base à l’étude (qui ne font pas partie de l’échantillon qui a permis d’estimer le modèle). On compare ainsi la valeur observée du salaire avec la valeur estimé du salaire.