Régression linéaire (STT-2400)

Slides:



Advertisements
Présentations similaires
GESTION DE PORTEFEUILLE chapitre n° 7
Advertisements

Fonctions & procédures
C1 Bio-statistiques F. KOHLER
Statistiques à deux variables
Analyse de la variance à un facteur
1 Analyse de la variance multivariée Michel Tenenhaus.
2.5 Champ électrique produit par une distribution continue de charges.
Régression linéaire (STT-2400) Section 3 Tests dhypothèses et lhypothèse linéaire générale Version: 26 janvier 2007.
Propriétés des exposants
Méthodes de prévision (STT-3220)
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Chapitre 2 Les indices.
Le modèle de croissance de Solow
Analyse de la variance : ANOVA à un facteur
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Échantillonnage (STT-2000)
Test bilan de calcul mental N°1 :
L’Analyse de Variance 2 L’ANOVA 2 fixe à r répétitions
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
Méthodes de prévision (STT-3220)
Méthodes de prévision (STT-3220) Section 4 Concepts fondamentaux de séries chronologiques Version: 8 novembre 2004.
Méthodes de prévision (STT-3220)
L’analyse de variance.
L’analyse de variance à mesures répétées
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Le comportement des coûts Chapitre 3
LE CHOIX EN CONTEXTE D’INCERTITUDE
Les analyses multivariées
Chapitre 4 L’inertie et le mouvement à deux dimensions
Régression linéaire (STT-2400)
STT-3220 Méthodes de prévision Section 2 Modèle avec deux variances inconnues: Méthode reposant sur un test préliminaire Version: 21 janvier 2008.
MATHÉMATIQUES FINANCIÈRES I
STT-3220 Méthodes de prévision
Régression linéaire (STT-2400)
La régression multiple
STT-3220 Méthodes de prévision Section 5 Estimation de la fonction dautocovariance (k) et de la fonction dautocorrélation (k) Version: 11 décembre 2008.
Régression linéaire (STT-2400)
Méthodes de prévision (STT-3220)
Échantillonnage (STT-2000) Section 3 Utilisation de variables auxiliaires. Version: 8 septembre 2003.
Régression linéaire (STT-2400)
Méthodes de prévision (STT-3220)
Méthodes de prévision (STT-3220)
Régression linéaire (STT-2400)
Régression linéaire.
STT-2400 Régression linéaire
STT-3220 Méthodes de prévision
Méthodes de prévision (STT-3220) Section 6 Exemple: Prévisions dans un modèle AR(1) Version: 18 décembre 2008.
MATHÉMATIQUES FINANCIÈRES I
Présentation de la méthode des Eléments Finis
Régression linéaire multiple : hypothèses & tests. Partie 3.
1 Notations Asymptotiques Et Complexité Notations asymptotiques : 0 et  Complexité des algorithmes Exemples de calcul de complexité.
INTRODUCTION.
STT-3220 Méthodes de prévision
M2 Sciences des Procédés - Sciences des Aliments
Séance 8 30 novembre 2005 N. Yamaguchi
On souhaite analyser les concentrations de mercure (ppm) dans les chaires de poissons carnivores des lacs de l'est de Etats- Unis. On espère trouver une.
Outils d’analyse: la méthode des moindres carrées
BIO 4518: Biostatistiques appliquées Les 11 et 18 octobre 2005 Laboratoire 4 et 5 ANOVA à critères multiples.
La racine carrée.
Modèle linéaire Relation entre une variable expliquée Y (par exemple le salaire), et p variables explicatives X j, j = 1, …, p (par exemple, p = 5, X 1.
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
MATHÉMATIQUES FINANCIÈRES I
Régression linéaire (STT-2400)
Séries chronologiques univariées (STT-6615)
Méthodes de prévision (STT-3220)
Régression linéaire (STT-2400) Section 5 Transformations Version: 9 février 2007.
Initialisation au logiciel (Statistical Analysis System)
Corrélation et causalité
STT-3220; Méthodes de prévision 1 Exemple: Test d’une dépendance d’ordre un Supposons que l’on a observé une série chronologique de taille n = 100. La.
Transcription de la présentation:

Régression linéaire (STT-2400) Section 3 Analyse séquentielle et tables d’analyse de variance (ANOVA) Version: 19 janvier 2007

Analyse de variance séquentielle Dans l’exemple des données sur l’essence, on a considéré la fonction moyenne suivante: La table d’ANOVA globale est: STT-2400; Régression linéaire

Comment expliquer l’effet de la variable « Tax » Si on s’attarde à la variable « Tax », on peut penser que la somme des carrés de l’ANOVA globale SSreg peut se diviser en deux: Un effet relié à un ajustement incluant les variables Dlic, Revenu et logMiles. Un effet relié à l’ajout de la variable « Tax »; autrement formulé, un effet relié à l’ajustement incluant la variable « Tax » après avoir déjà inclus dans le modèle les variables Dlic, Revenu et logMiles. STT-2400; Régression linéaire

Décomposition de SSreg dans l’ANOVA globale On écrira la somme des carrés SSreg dans l’ANOVA globale: SSreg(Dlic, Revenu, logMiles, Tax | b0) = SSreg(Dlic, Revenu, logMiles | b0) + SSreg(Tax |Dlic, Revenu, logMiles, b0) Cette logique peut être répétée pour le terme SSreg(Dlic, Revenu, logMiles | b0). STT-2400; Régression linéaire

Table d’ANOVA dans une régression linéaire simple Avec ce système de notation, nous aurons que la table d’ANOVA dans une régression linéaire simple prend la forme: En effet, SSreg correspond à l’augmentation dans la somme des carrés due à la régression lors de l’ajout du préviseur X. STT-2400; Régression linéaire

Autre forme de l’ANOVA dans la régression linéaire simple Une forme moins populaire (car moins fréquente dans les sorties informatiques) est: On a que: et STT-2400; Régression linéaire

ANOVA et régression linéaire simple Inclure que le terme constant donne l’ANOVA: Dans cette logique inclure les deux termes donne la table d’ANOVA STT-2400; Régression linéaire

ANOVA et régression linéaire simple Conséquemment on trouve que: SSreg(b1 | b0) = SSreg(b1,b0) – SSreg(b0) Ceci suggère la table d’ANOVA: STT-2400; Régression linéaire

ANOVA et régression linéaire multiple En général, on trouve les tables d’ANOVA suivantes: Ainsi que: STT-2400; Régression linéaire

En résumé, ce qu’il faut retenir… En fait il faut retenir les deux formes suivantes, qui sont équivalentes: Et la forme plus répandue (à cause des logiciels): STT-2400; Régression linéaire

STT-2400; Régression linéaire ANOVA séquentielle Considérons la fonction moyenne suivante: Posons: SSreg1 = SSreg(b1 | b0); SSreg2 = SSreg(b2 |b1, b0); SSreg3 = SSreg(b3 |b2, b1, b0); SSreg4 = SSreg(b4 |b3, b2, b1, b0). STT-2400; Régression linéaire

ANOVA séquentielle (suite) On aura l’ANOVA suivante dite séquentielle: STT-2400; Régression linéaire

ANOVA séquentielle (suite) Afin de calculer SSreg1, on doit ajuster une régression avec b0 et b1: ceci nous donne: SSreg(b1 | b0). Afin de calculer SSreg2, on ajuste une régression avec b0, b1 et b2, et une seconde avec seulement b0 et b1. On calcule alors: SSreg(b2 | b1, b0 ) = SSreg(b1, b2 | b0 ) – SSreg(b1 | b0) STT-2400; Régression linéaire

ANOVA séquentielle (suite) On remarque que l’on a la relation: SSreg1 + SSreg2 + SSreg3 + SSreg4 = SSreg En effet: SSreg(b1 | b0) + { SSreg(b1,b2 | b0) - SSreg(b1 | b0) } + {SSreg(b1,b2,b3 | b0) - SSreg(b1,b2 | b0) } + {SSreg(b1,b2,b3,b4 | b0) - SSreg(b1,b2,b3 | b0) } = SSreg(b1,b2,b3,b4 | b0) = SSreg STT-2400; Régression linéaire

STT-2400; Régression linéaire L’ordre compte… Il est important de noter que l’ordre dans lequel entre les variables importe. Exemple: Inclure successivement Dlic, Tax, Revenu et logMiles donnera une ANOVA séquentielle différente de celle consistant à entrer successivement logMiles, Income, Dlic et Tax. Si les préviseurs sont approximativement non corrélés, les différences devraient être petites. STT-2400; Régression linéaire

ANOVA séquentielle et SAS Pour SAS, cette décomposition s’intitule le calcul des sommes de carrés de type I. Il suffit d’ajouter l’option SS1 dans l’énoncé « model ». Par exemple: data essence; set alr3.fuel2001; Dlic=Drivers*1000/Pop; Fuel=FuelC*1000/Pop; logMiles=log2(Miles); Revenu=Income/1000; proc reg data=essence; model Fuel = Dlic Tax Revenu logMiles / SS1; run; STT-2400; Régression linéaire