La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Régression linéaire (STT-2400) Section 3 Analyse séquentielle et tables danalyse de variance (ANOVA) Version: 19 janvier 2007.

Présentations similaires


Présentation au sujet: "Régression linéaire (STT-2400) Section 3 Analyse séquentielle et tables danalyse de variance (ANOVA) Version: 19 janvier 2007."— Transcription de la présentation:

1 Régression linéaire (STT-2400) Section 3 Analyse séquentielle et tables danalyse de variance (ANOVA) Version: 19 janvier 2007

2 STT-2400; Régression linéaire 2 Analyse de variance séquentielle Dans lexemple des données sur lessence, on a considéré la fonction moyenne suivante: La table dANOVA globale est:

3 STT-2400; Régression linéaire 3 Comment expliquer leffet de la variable « Tax » Si on sattarde à la variable « Tax », on peut penser que la somme des carrés de lANOVA globale SSreg peut se diviser en deux: – Un effet relié à un ajustement incluant les variables Dlic, Revenu et logMiles. – Un effet relié à lajout de la variable « Tax »; autrement formulé, un effet relié à lajustement incluant la variable « Tax » après avoir déjà inclus dans le modèle les variables Dlic, Revenu et logMiles.

4 STT-2400; Régression linéaire 4 Décomposition de SSreg dans lANOVA globale On écrira la somme des carrés SSreg dans lANOVA globale: SSreg(Dlic, Revenu, logMiles, Tax | 0 ) = SSreg(Dlic, Revenu, logMiles | 0 ) + SSreg(Tax |Dlic, Revenu, logMiles, 0 ) Cette logique peut être répétée pour le terme SSreg(Dlic, Revenu, logMiles | 0 ).

5 STT-2400; Régression linéaire 5 Table dANOVA dans une régression linéaire simple Avec ce système de notation, nous aurons que la table dANOVA dans une régression linéaire simple prend la forme: En effet, SSreg correspond à laugmentation dans la somme des carrés due à la régression lors de lajout du préviseur X.

6 STT-2400; Régression linéaire 6 Autre forme de lANOVA dans la régression linéaire simple Une forme moins populaire (car moins fréquente dans les sorties informatiques) est: On a que:et

7 STT-2400; Régression linéaire 7 ANOVA et régression linéaire simple Inclure que le terme constant donne lANOVA: Dans cette logique inclure les deux termes donne la table dANOVA

8 STT-2400; Régression linéaire 8 ANOVA et régression linéaire simple Conséquemment on trouve que: SSreg( 1 | 0 ) = SSreg( 1, 0 ) – SSreg( 0 ) Ceci suggère la table dANOVA:

9 STT-2400; Régression linéaire 9 ANOVA et régression linéaire multiple En général, on trouve les tables dANOVA suivantes: Ainsi que:

10 STT-2400; Régression linéaire 10 En résumé, ce quil faut retenir… En fait il faut retenir les deux formes suivantes, qui sont équivalentes: Et la forme plus répandue (à cause des logiciels):

11 STT-2400; Régression linéaire 11 ANOVA séquentielle Considérons la fonction moyenne suivante: Posons: SSreg1 = SSreg( 1 | 0 ); SSreg2 = SSreg( 2 | 1, 0 ); SSreg3 = SSreg( 3 | 2, 1, 0 ); SSreg4 = SSreg( 4 | 3, 2, 1, 0 ).

12 STT-2400; Régression linéaire 12 ANOVA séquentielle (suite) On aura lANOVA suivante dite séquentielle:

13 STT-2400; Régression linéaire 13 ANOVA séquentielle (suite) Afin de calculer SSreg1, on doit ajuster une régression avec 0 et 1 : ceci nous donne: SSreg( 1 | 0 ). Afin de calculer SSreg2, on ajuste une régression avec 0, 1 et 2, et une seconde avec seulement 0 et 1. On calcule alors: SSreg( 2 | 1, 0 ) = SSreg( 1, 2 | 0 ) – SSreg( 1 | 0 )

14 STT-2400; Régression linéaire 14 ANOVA séquentielle (suite) On remarque que lon a la relation: SSreg1 + SSreg2 + SSreg3 + SSreg4 = SSreg En effet: SSreg( 1 | 0 ) + { SSreg( 1, 2 | 0 ) - SSreg( 1 | 0 ) } + {SSreg( 1, 2, 3 | 0 ) - SSreg( 1, 2 | 0 ) } + {SSreg( 1, 2, 3, 4 | 0 ) - SSreg( 1, 2, 3 | 0 ) } = SSreg( 1, 2, 3, 4 | 0 ) = SSreg

15 STT-2400; Régression linéaire 15 Lordre compte… Il est important de noter que lordre dans lequel entre les variables importe. Exemple: Inclure successivement Dlic, Tax, Revenu et logMiles donnera une ANOVA séquentielle différente de celle consistant à entrer successivement logMiles, Income, Dlic et Tax. Si les préviseurs sont approximativement non corrélés, les différences devraient être petites.

16 STT-2400; Régression linéaire 16 ANOVA séquentielle et SAS Pour SAS, cette décomposition sintitule le calcul des sommes de carrés de type I. Il suffit dajouter loption SS1 dans lénoncé « model ». Par exemple: data essence; set alr3.fuel2001; Dlic=Drivers*1000/Pop; Fuel=FuelC*1000/Pop; logMiles=log2(Miles); Revenu=Income/1000; proc reg data=essence; model Fuel = Dlic Tax Revenu logMiles / SS1; run;


Télécharger ppt "Régression linéaire (STT-2400) Section 3 Analyse séquentielle et tables danalyse de variance (ANOVA) Version: 19 janvier 2007."

Présentations similaires


Annonces Google