Télécharger la présentation
1
Régression linéaire (STT-2400)
Section 3 Tests d’hypothèses et intervalles de confiance Version: 28 février 2008
2
Hypothèses concernant un préviseur particulier
L’obtention d’information sur un des préviseurs peut être une considération pertinente. Formellement, on pourrait vouloir vérifier si le préviseur xi devrait être inclus dans la fonction moyenne: Ceci revient à tester: STT-2400; Régression linéaire
3
Exemple: Données sur l’essence
La fonction moyenne est: On pourrait vouloir tester: Afin de voir si la variable « Tax » est importante, on va faire la régression: (i) Incluant la variable « Tax » (modèle plein), (ii) Excluant la variable « Tax » (modèle réduit). STT-2400; Régression linéaire
4
Critère: réduction significative dans la somme des carrés résiduelle
Notre critère repose sur la somme des carrés RSS: On regarde si le fait d’inclure un préviseur de plus, « Tax », occasionne une réduction significative dans RSS. Sortie informatique SAS: RSSMP: avec n - p - 1 = = 46 degrés de liberté; RSSMR: avec n - p = = 47 degrés de liberté. On trouve alors: RSSMR – RSSMP = = Est-ce que cette différence est statistiquement significative? STT-2400; Régression linéaire
5
Statistique d’intérêt
La statistique d’intérêt est: Sous l’hypothèse nulle: L’estimateur est l’estimateur de dans le modèle plein. Dans l’exemple: L’hypothèse nulle H0 est rejetée de justesse. STT-2400; Régression linéaire
6
STT-2400; Régression linéaire
Test-F partiel Le test-F précédent est aussi appelé test-F partiel. Le test est étroitement lié aux tests-t qui sont fournis dans les sorties informatiques de SAS. Exemple: Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept logMiles Revenu Dlic Tax On note que la valeur-p est exactement la même. En fait, on note que la statistique-t est: / = et ( )2=4.337. STT-2400; Régression linéaire
7
Équivalence du test-F partiel et du test-t
En fait, le test-t et le test-F partiel sont équivalents dans ce cas-ci. Dans le cas d’une statistique-t, on compare à une tn-p-1 et on peut montrer que si t ~ tn-p-1, alors t2 = F ~ F1,n-p-1. Puisque on pourrait vouloir confronter: Dans un tel cas tobs = et la valeur-p est: STT-2400; Régression linéaire
8
Intervalles de confiance
Dans le modèle , avec: De plus, on présume la normalité: On désire construire un intervalle de confiance pour , avec: STT-2400; Régression linéaire
9
Intervalle de confiance pour un coefficient
Posons , un vecteur de dimension p + 1, où le un est en position j. Ainsi: Or impliquant Donc On pose STT-2400; Régression linéaire
10
Intervalle de confiance pour un coefficient (suite)
Donc Or on ne connaît pas On a vu que: De plus: STT-2400; Régression linéaire
11
Intervalle de confiance pour un coefficient (suite)
Sous l’hypothèse ne normalité, il est possible de montrer que et sont indépendants. Ceci implique: STT-2400; Régression linéaire
12
Intervalle de confiance pour un coefficient (suite et fin)
Ainsi: Ainsi un intervalle de confiance pour est: STT-2400; Régression linéaire
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.