Régression linéaire (STT-2400)

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
3. Variantes de l’algorithme
La régression logistique: fondements et conditions d’application
Inférence statistique
C1 Bio-statistiques F. KOHLER
Comparaison de deux moyennes observées
Inférence statistique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Analyse de la variance à un facteur
Régression linéaire (STT-2400) Section 3 Tests dhypothèses et lhypothèse linéaire générale Version: 26 janvier 2007.
Corrélation linéaire et la droite de régression
Méthodes de prévision (STT-3220)
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Les liens entre les variables et les tests d’hypothèse
Méthodes de Biostatistique
La Régression Multiple
Paul-Marie Bernard Université Laval
Régression linéaire simple
Échantillonnage (STT-2000)
L’Analyse de Covariance
Corrélation et régression linéaire simple
Régression linéaire (STT-2400)
Méthodes de prévision (STT-3220)
Méthodes de prévision (STT-3220)
Modeles Lineaires.
Une observation par cellule facteurs fixes versus facteurs aléatoires.
Toutes les variables étaient mesurées au niveau intervalle et sans erreur Toutes les variables étaient mesurées au niveau intervalle et sans erreur ->
La corrélation et la régression multiple
La corrélation et la régression
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
La régression logistique
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Le comportement des coûts Chapitre 3
Régression linéaire (STT-2400)
STT-3220 Méthodes de prévision Section 2 Modèle avec deux variances inconnues: Méthode reposant sur un test préliminaire Version: 21 janvier 2008.
STT-3220 Méthodes de prévision
La régression multiple
Régression linéaire (STT-2400)
Échantillonnage (STT-2000) Section 3 Utilisation de variables auxiliaires. Version: 8 septembre 2003.
Régression linéaire (STT-2400)
Méthodes de prévision (STT-3220)
Méthodes de prévision (STT-3220)
Régression linéaire (STT-2400)
Méthodes de prévision (STT-3220) Section 6 Exemple: Prévisions dans un modèle AR(1) Version: 18 décembre 2008.
Régression linéaire multiple : hypothèses & interprétation
Régression linéaire multiple : hypothèses & tests. Partie 3.
Méthodes de Biostatistique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
LA REGRESSION LINEAIRE
Statistique Cours #4 Régression linéaire simple et multiple
Échantillonnage (STT-2000)
Probabilités et Statistiques Année 2010/2011
Méthodes de Biostatistique Chapitre 9 Tests Nonparamétriques.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :34 1 Les modèles linéaires (Generalized Linear.
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Régression linéaire (STT-2400)
Méthodes de prévision (STT-3220)
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
Comparaison de plusieurs moyennes observées
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Régression linéaire (STT-2400) Section 3 Préliminaires, Partie II, La loi multinormale Version: 8 février 2007.
Transcription de la présentation:

Régression linéaire (STT-2400) Section 3 Tests d’hypothèses et intervalles de confiance Version: 28 février 2008

Hypothèses concernant un préviseur particulier L’obtention d’information sur un des préviseurs peut être une considération pertinente. Formellement, on pourrait vouloir vérifier si le préviseur xi devrait être inclus dans la fonction moyenne: Ceci revient à tester: STT-2400; Régression linéaire

Exemple: Données sur l’essence La fonction moyenne est: On pourrait vouloir tester: Afin de voir si la variable « Tax » est importante, on va faire la régression: (i) Incluant la variable « Tax » (modèle plein), (ii) Excluant la variable « Tax » (modèle réduit). STT-2400; Régression linéaire

Critère: réduction significative dans la somme des carrés résiduelle Notre critère repose sur la somme des carrés RSS: On regarde si le fait d’inclure un préviseur de plus, « Tax », occasionne une réduction significative dans RSS. Sortie informatique SAS: RSSMP: 193700 avec n - p - 1 = 51- 4 - 1 = 46 degrés de liberté; RSSMR: 211964 avec n - p = 51 - 4 = 47 degrés de liberté. On trouve alors: RSSMR – RSSMP = 211964 - 193700 = 18264. Est-ce que cette différence est statistiquement significative? STT-2400; Régression linéaire

Statistique d’intérêt La statistique d’intérêt est: Sous l’hypothèse nulle: L’estimateur est l’estimateur de dans le modèle plein. Dans l’exemple: L’hypothèse nulle H0 est rejetée de justesse. STT-2400; Régression linéaire

STT-2400; Régression linéaire Test-F partiel Le test-F précédent est aussi appelé test-F partiel. Le test est étroitement lié aux tests-t qui sont fournis dans les sorties informatiques de SAS. Exemple: Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept 1 154.19284 194.90616 0.79 0.4329 logMiles 1 18.54527 6.47217 2.87 0.0063 Revenu 1 -6.13533 2.19363 -2.80 0.0075 Dlic 1 0.47187 0.12851 3.67 0.0006 Tax 1 -4.22798 2.03012 -2.08 0.0429 On note que la valeur-p est exactement la même. En fait, on note que la statistique-t est: -4.22798/2.03012 = -2.0826 et (-2.0826)2=4.337. STT-2400; Régression linéaire

Équivalence du test-F partiel et du test-t En fait, le test-t et le test-F partiel sont équivalents dans ce cas-ci. Dans le cas d’une statistique-t, on compare à une tn-p-1 et on peut montrer que si t ~ tn-p-1, alors t2 = F ~ F1,n-p-1. Puisque on pourrait vouloir confronter: Dans un tel cas tobs = -2.0826 et la valeur-p est: STT-2400; Régression linéaire

Intervalles de confiance Dans le modèle , avec: De plus, on présume la normalité: On désire construire un intervalle de confiance pour , avec: STT-2400; Régression linéaire

Intervalle de confiance pour un coefficient Posons , un vecteur de dimension p + 1, où le un est en position j. Ainsi: Or impliquant Donc On pose STT-2400; Régression linéaire

Intervalle de confiance pour un coefficient (suite) Donc Or on ne connaît pas . On a vu que: De plus: STT-2400; Régression linéaire

Intervalle de confiance pour un coefficient (suite) Sous l’hypothèse ne normalité, il est possible de montrer que et sont indépendants. Ceci implique: STT-2400; Régression linéaire

Intervalle de confiance pour un coefficient (suite et fin) Ainsi: Ainsi un intervalle de confiance pour est: STT-2400; Régression linéaire