E CONOMÉTRIE A PPLIQUÉE AVEC R (P ART 03) R. Aloui 2015/2016 Disponible sur https://riadhaloui.wordpress.com/

Slides:



Advertisements
Présentations similaires
Etude de marché.
Advertisements

7 Mettre Les normes: –Communication 1.2 –Comparisons 4.2 Les quesitons essentielles: What does « mettre » mean? What type of verb is it? What are some.
C1 Bio-statistiques F. KOHLER
Analyse de la variance à un facteur
Vérification des données
Chapitre 2 Les indices.
How to solve biological problems with math Mars 2012.

La Régression Multiple
Régression linéaire simple
L’Analyse de Covariance
Corrélation et régression linéaire simple
Modeles Lineaires.
Toutes les variables étaient mesurées au niveau intervalle et sans erreur Toutes les variables étaient mesurées au niveau intervalle et sans erreur ->
La corrélation et la régression multiple
La corrélation et la régression
Le comportement des coûts Chapitre 3
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
Caractérisation des évènements magnétiques à l’aide des seuls indices géomagnétiques Groupe de travail 21 décembre 2006.
Météorologie de l’Espace: Le système Ionosphère-Thermosphère
Régression linéaire (STT-2400)
La régression multiple
Les séries chronologiques
Régression linéaire (STT-2400)
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Régression linéaire multiple : hypothèses & interprétation
Méthodes de Biostatistique
STATISTIQUES ANALYTIQUES (suite)
une introduction pragmatique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
La régression simple Michel Tenenhaus
STT-3220 Méthodes de prévision
LA REGRESSION LINEAIRE
Présentation du marché obligataire
Intervalles de confiance pour des proportions L’inférence statistique
Chapitre 12 Régression linéaire simple et corrélation linéaire
Probabilités et Statistiques Année 2010/2011
Un exemple d’ANOVA Pour étudier l'influence du milieu sur la DL50 de daphnies (heure), on a mesuré cette durée de vie pour deux clones de daphnies en fonction.
Régression linéaire Jonathan Lenoir (MCU),
Gestion du portefeuille 07A – Modèle à facteurs
On souhaite analyser les concentrations de mercure (ppm) dans les chaires de poissons carnivores des lacs de l'est de Etats- Unis. On espère trouver une.
PROVISIONS POUR SINISTRES (NON VIE) [Le 10 mars 2008]
Gestion budgétaire des ventes
Concepts fondamentaux: statistiques et distributions
La statistique de la semaine: Fusions-Acquisitions contre Investissements Productifs 8 février 2007 Marc-André Gagnon 8 février 2007 Marc-André Gagnon.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :52 1 Comparaisons multiples Ce qu’elles sont.
Mais quel est donc le taux d’inflation actuel ? J.C. Lambelet et D. Nilles Catherine Roux Alvaro Aparicio Gregor Banzer Daniel Cavallaro.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :57 1.
ETUDE DE 2 VARIABLES QUANTITATIVES
4 Avoir Les normes: –Communication 1.2 : –Comparisons 4.1 :
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :34 1 Les modèles linéaires (Generalized Linear.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 1 GLM Exemples.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :26 1 Régression multiple Quand et pourquoi on.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 24/07/2015 2:29 PM Bootstrap et permutations.
Les articles indéfinis et définis au singulier Talking about one person or thing.
Régression linéaire (STT-2400)
STATISTIQUES.
Le modèle de régression linéaire Claude Marois © 2010.
Statistiques à 2 variables
E CONOMÉTRIE A PPLIQUÉE AVEC R (P ART 01) R. Aloui 2015/2016 Disponible sur
COURS DE TECHNIQUES QUANTITATIVES
MENU 1 Hypothèses du modèle linéaire YO = YT + e 2 blocs d’hypothèses -Sur les relations entre les variables -Sur le comportement de la variable aléatoire.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
Week 7 Abakar Adam Sakina Ismael. By Elhanan Helpman, Marc J. Melitz, and Stephen R. Yeaple.
Des statistiques descriptives et multi- variées aux statistiques de deuxième génération Séance 2.
Basic Business Statistics, 10e © 2006 Prentice-Hall, Inc. Chap 1-1 Chapter 1 Introduction and Data Collection Basic Business Statistics 10 th Edition.
1 Sensitivity Analysis Introduction to Sensitivity Analysis Introduction to Sensitivity Analysis Graphical Sensitivity Analysis Graphical Sensitivity Analysis.
Transcription de la présentation:

E CONOMÉTRIE A PPLIQUÉE AVEC R (P ART 03) R. Aloui 2015/2016 Disponible sur

Régression Linéaire Multiple Introduction La modélisation de la concentration d’ozone en fonction de la température (chapitre 2) est relativement simpliste. D’autres variables météorologiques: rayonnement, la précipitation ou encore le vent… Le modèle de régression multiple est une généralisation du modèle de régression simple.

Régression Linéaire Multiple En utilisant l’écriture matricielle, nous obtenons la définition suivante :

Modélisation Statistique

Résidus et variance résiduelle Les résidus sont définis par la relation suivante : Un estimateur de la variance des erreurs Un estimateur de la variance des erreurs de Modélisation Statistique

Le : plus nous augmentons le nombre de variables explicatives, même non pertinentes, plus grande sera sa valeur. Le ajusté: Modélisation Statistique

Nous expliquons les variations de l’ozone (O3) par deux variables explicatives, la température à 12 h (T12) et le vent (Vx). 1- Importer les données dans ozone_full.csv 2- représenter O3 en fonction de T12 et Vx Télécharger le package Scatterplot3d (Cran) 2.2- library(scatterplot3d) g Exemple: La pollution de l'air

> library("scatterplot3d") > scatterplot3d (ozone[,"T12"], ozone[,"Vx"], ozone[,"O3"], type="h", pch=16, box=FALSE, xlab="T12", ylab="Vx", zlab="O3") Exemple: La pollution de l'air

Soit le modèle de régression suivant: Pour estimer les paramètres du modèle Nous avons ajouté la variable Vx au modèle présenté dans le chapitre 2, cet ajout est-il pertinent ? Exemple: La pollution de l'air

Dummy Variable -Une variable indicatrice D (dummy) prend les valeurs 0 ou 1. -Utilisation: 1.Corriger les écarts aberrants (ou déviants) ; 2.Capter la présence de la discrimination ; 3.Capter les variations saisonnières. -les facteurs qualitatifs : la race, le sexe, la religion ou un événement tel qu’une guerre, une grève, un tsunami, etc.

Dummy Variable Exemple: Il y’a un écart criant au 13 février!!! -Tracer le nuage du point -Estimer les coefficients de la droite y=ax+b. Ajouter la droite au même graphique précédant. -Les paramètres de la regression sont-ils significatifs? Interpréter la valeur du coefficient de détermination.

Dummy Variable

-la valeur aberrante (outliers) a complètement perturbé l’estimation. -Solution: variable Dummy! -Créer la variable D. - Estimer le modèle - Les paramètres sont-ils significatifs?

Saisonnalité -Une entreprise cherche à appréhender une relation entre ses ventes et ses dépenses publicitaires. Le directeur du marketing dispose des données de ventes et de dépenses publicitaires sur 5 ans par trimestre.

Saisonnalité -Le directeur du marketing commence par estimer la relation : -Tracer le graphique de la série des ventes et de la publicité dans le même graphique, que pouvez-vous en conclure ? -Spécifier et estimer le modèle adéquat.

Saisonnalité  Mouvement saisonnier T3 (Ventes).

The 1988 Population Survey (CPS) - The US Census Bureau CPS1988.csv (Bierens and Ginther, 2001) contains 28,155 observations: wage is the wage in dollars per week, education and experience are measured in years, and ethnicity is a factor with levels Caucasian ("cauc") and African-American ("afam"). The factors, smsa, region, and parttime, indicating residence in a standard metropolitan statistical area (SMSA), the region within the United States of America, and whether the individual works part-time. Compute the mean, minimum, maximum and the median of the data.

The 1988 Population Survey (CPS) - The US Census Bureau The model of interest is Estimate the model using ordinary least squares (OLS), Are the coefficients estimates significant at 1% level?

> cps_lm <- lm(log(wage) ~ experience + I(experience^2) + education + ethnicity, data = CPS1988) To avoid confusion, the function I() is used so that the operator ^ has its original arithmetic meaning. > summary(cps_lm) What about the variable ethnicity?

Comparison of models l’inconvénient du : ne pas arbitrer entre la perte de degrés de liberté du modèle et l’ajustement qui en résulte.

Comparison of models Comparer les deux modèles suivants:

A NNEXE