Distribution à deux variables

Slides:



Advertisements
Présentations similaires
Statistique à 2 variables
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
FONCTION LINEAIRE Bernard Izard 3° Avon FL
Terminale STG Activité : Ajustement affine
Chapitre 5. Description numérique d’une variable statistique.
Régression ou corrélation
Corrélations et ajustements linéaires.
Régression -corrélation
Exploitation avec Excel.
Corrélation linéaire et la droite de régression
Les traitements croisés
Les liens entre les variables et les tests d’hypothèse
Systèmes d’équations du premier degré à deux variables
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
Chapitre 2: Les régularités et les relations
Régression linéaire simple
Tendance centrale Ex: Examen de philo. La moyenne était de 34%. Permet de caractériser une série statistique au moyen dune valeur ou modalité typique.
Les graphiques pour la vélocité. Les variables: Indépendante - Dépendante - Une révision des graphiques:
Corrélation et régression linéaire simple
La corrélation et la régression multiple
La corrélation et la régression
La corrélation et la régression
Modélisation Nuage de points.
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
Inéquations du second degré à deux variables
Les fonctions leurs propriétés et.
Modélisation Nuage de points.
LA FONCTION LINÉAIRE Objectifs :
La régression multiple
Coefficient de corrélation linéaire
Géométrie analytique Distance d’un point à une droite.
Méthodes de Biostatistique
3.6 Le volume d’un prisme rectangulaire
Présentation du marché obligataire
SYNTHESE SUR LES FONCTIONS
Les fonctions linéaires et affines
Modéliser avec une calculatrice TI 83 +
Chapitre 12 Régression linéaire simple et corrélation linéaire
Probabilités et Statistiques Année 2010/2011
1 1 Licence Stat-info CM7 a 2004 V1Christophe Genolini Récapitulatif : Variables qualitatives Variables qualitatives : –on se demande si elles sont liées.
Chapitre 1 Nombres relatifs.
Gestion budgétaire des ventes
Outils d’analyse: la méthode des moindres carrées
L’ETUDE D’UNE FONCTION Etape par étape
Rappels Variables nominales :
Les Diagrammes de dispersion
REVISIONS POINTS COMMUNS
Méthodes de Biostatistique Chapitre 9 Tests Nonparamétriques.
Les graphiques en sciences physiques
ETUDE DE 2 VARIABLES QUANTITATIVES
Martin Roy Révisé Juillet  Étape 1 : Ordonner les données selon la variable X.  Étape 2 : Partager les données en deux groupes égaux. *Si le nb.
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
Jacques Paradis Professeur
STATISTIQUES.
Le modèle de régression linéaire Claude Marois © 2010.
Statistiques à 2 variables
Les fonctions Les propriétés. Chaque fonction possède ses propres caractéristiques: Ainsi l’analyse de ces propriétés permet de mieux cerner chaque type.
Statistique Descriptive Les Paramètres de Tendance Centrale
REPRESENTATION GRAPHIQUE
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
CHAPITRE 2 LES SITUATIONS FONCTIONNELLES
Corrélation et causalité
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
Les mesures de tendance centrale
Droite de régression avec la méthode médiane-médiane.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Estimation du coefficient de corrélation par la méthode des rectangles.
Transcription de la présentation:

Distribution à deux variables La description des forces de relation Le calcul du coefficient de corrélation Les droites de régression Par: Allan Birkett

C’EST QUOI UNe DISTRIBUTION À Deux variables? est une liste de couple ordonnée selon les abscisses Ex: {(0,10), (0, 9), (1, 11), (2, 10), ...} peut être donné en liste ou en tableau à deux entrées graphiquement, on obtient un nuage de points:

C’EST QUOI la corrélation? est la mesure du degré de dépendance entre deux phénomènes de nature statistique ou probabiliste Exemple: - le poids et la hauteur d’une personne - la longueur des pieds et celle des pouces - la valeur d’une voiture et le salaire net de son propriétaire Il y a plusieurs modèles de corrélation. En CST-IV, on s’intéresse au modèle de corrélation linéaire. Alors, on se questionne à savoir si on peut appliquer un modèle linéaire à une situation quelconque afin de prévoir plausiblement des valeurs inconnues.

Des corrélations non-linéaires !

C’EST QUOI la corrélation Linéaire? est le degré de dépendance linéaire entre deux variables ou « à quel point le nuage de points s’aligne » est positive, négative ou nulle selon la tendance graphique peut être décrite qualitativement: nulle, faible, moyenne, forte ou parfait Exemples: Corrélation nulle Corrélation faible et négative Corrélation moyenne et positive Corrélation parfaite et négative

À votre tour... Tourner à la page 73 Corrélation forte et négative Corrélation nulle Corrélation moyenne et positive Corrélation forte et positive

C’EST QUOI le Coefficient de corrélation linéaire? est une valeur entre -1 et 1 qui exprime la validité du modèle linéaire par rapport au nuage de points (On pourrait imaginer un pourcentage qui représente la force de la relation linéaire entre les deux variables) symbole est “r” Exemple de valeurs du coefficient de corrélation: Tournez à la page 84

Approximez les coefficients de corrélation Suivants:

Comment calculer le coefficient de corrélation: Il faut premièrement construire un rectangle autour du nuage de points. Ensuite, il faut appliquer la formule suivante: largeur longueur Le symbole est déterminé par le signe de la corrélation: positive ou négative.

Une droite de Régression est un outil d’approximation utilisé lorsqu’un modèle linéaire peut être appliqué à une situation traverse visuellement le centre du rectangle utilisé pour calculer le coefficient de corrélation peut être déterminé graphiquement en choisissant deux points sur la droite de régression Droite de régression ⇨Rappel⇦ On trouve “b” avec “a” et 1 autre point sur la droite.

Une droite de Régression Exemple: Le nuage de points ci-dessous représente les données issues d’un verger. Le propriétaire se questionne à savoir combien de kilogrammes de pommes un arbre de 21 ans devrait produire. 2 Kg de pommes y = 2.5x + b avec (9, 28) 28 = 2.5(9) + b 28 = 22.5 + b b = 5.5 Alors, y = 2.5x + 5.5 3 (3, 13) (9, 28) 1 Age du pommier (en années) 4 y = 2.5(21) + 5.5 y = 58

Une droite de Régression Il y a deux méthodes non-graphiques qui permettent d’approximer l’équation de la droite de régression: La méthode de Mayer La méthode de la droite médiane-médiane On doit premièrement ordonner les couples de points selon les abscisses peu importe la méthode choisie.

La méthode de mayer 1ière étape: Il faut séparer les couples de données en deux groupes. Si il y a un nombre impair de données, il faut mettre la paire dans le groupe dans lequel la différence entre les abscisses est le moindre. 2ième étape: Il faut faire la moyenne des abscisses et des ordonnées de chaque groupe afin d’avoir deux points. 3ième étape: Avec ces deux points, déterminer l’équation de la droite de régression.

La méthode de Mayer Exemple: la hauteur à laquelle on échappe un ballon et son rebond Il y a neuf données. Alors, on va séparer au 5ième... qui a un 13 comme abscisse. Donc, les 5 premiers font un groupe et les quatre derniers, l’autre. Hauteur (dm) 10 12 13 15 16 17 18 Rebond (dm) 7.3 8.2 8.8 9.4 9.6 11 11.8 12.5 13.8 Il faut maintenant faire des moyennes avec les abscisses et les ordonnées. (10+12+12+13+13) ÷ 5 = 12 (7.3+8.2+8.8+9.4+9.6) ÷ 5 = 8.66 (15+16+17+18) ÷ 4 = 16.5 (11+11.8+12.5+13.8) ÷ 4 = 12.275

La méthode de Mayer Exemple: la hauteur à laquelle on échappe un ballon et son rebond Hauteur (dm) 10 12 13 15 16 17 18 Rebond (dm) 7.3 8.2 8.8 9.4 9.6 11 11.8 12.5 13.8 Maintenant, on a deux points (12, 8.66) et (16.5, 12.275). Il faut trouver l’équation de la droite qui passe par ces points: y = 1.24x + b avec (12, 8.66) 8.66 = 1.24(12) + b 8.66 = 14.88 + b -6.22 = b Donc, l’équation de la droite de régression est: y = 1.24x – 6.22

La méthode de la droite médiane-Médiane 1ière étape: Il faut séparer les couples de données en trois groupes. S’il y a une donnée de trop, elle ira dans le groupe central. S’il y a deux données de trop, une ira avec le premier groupe et l’autre dans le dernier. 2ième étape: Il faut faire la médiane des abscisses et des ordonnées de chaque groupe afin d’avoir trois points appelés M1, M2 et M3. 3ième étape: Avec M1 et M2, on trouve la pente de la droite de régression. 4ième étape: Il faut faire la moyenne des trois points M1, M2 et M3 qui sera appeler le point P. 5ième étape: Avec la pente, on détermine l’ordonnée à l’origine de la droite de régression en utilisant les coordonnées de P.

La méthode de la droite médiane-Médiane Exemple Meilleurs Quart-arrières de la NFL Passes faites Touchés 4059 216 3741 239 3650 220 4475 197 2285 126 2950 155 2842 169 3149 152 2958 153 6467 342 1940 75 1536 61 2467 96 5604 254 1742 81 1831 77 3153 136 2551 124 4262 255 5186 290 {(1536, 61), (1742, 82), (1831, 77), (1940, 75), (2285, 126), (2467, 96), (2551, 124), (2842, 169), (2950, 155), (2958, 153), (3149, 152), (3153, 136), (3650, 220), (3741, 239), (4059, 216), (4262, 255), (4475, 197), (5186, 290), (5604, 254), (6467,342)}

La méthode de la droite médiane-Médiane Exemple {(1536, 61), (1742, 82), (1831, 77), (1940, 75), (2285, 126), (2467, 96), (2551, 124), (2842, 169), (2950, 155), (2958, 153), (3149, 152), (3153, 136), (3650, 220), (3741, 239), (4059, 216), (4262, 255), (4475, 197), (5186, 290), (5604, 254), (6467,342)} Il y a 20 couples de données. Alors, les groupes seront de tailles: 7, 6 et 7. 1) {(1536, 61), (1742, 82), (1831, 77), (1940, 75), (2285, 126), (2467, 96), (2551, 124)} 2) {(2842, 169), (2950, 155), (2958, 153), (3149, 152), (3153, 136), (3650, 220)} 3) {(3741, 239), (4059, 216), (4262, 255), (4475, 197), (5186, 290), (5604, 254), (6467,342)}

La méthode de la droite médiane-Médiane Exemple 1) {(1536, 61), (1742, 82), (1831, 77), (1940, 75), (2285, 126), (2467, 96), (2551, 124)} Médiane des abscisses: 1536, 1742, 1831, 1940, 2285, 2467, 2551 Donc, 1940 Médiane des ordonnées: 61, 75, 77, 82, 96, 124, 126 Donc, 82 Alors, M1 est (1940, 82) 2) {(2842, 169), (2950, 155), (2958, 153), (3149, 152), (3153, 136), (3650, 220)} Médiane des abscisses: 2842, 2950, 2958, 3149, 3153, 3650 Donc, (2958 + 3149) ÷ 2 = 3053.5 Médiane des ordonnées: 136, 152, 153, 155, 169, 220 Donc, (153 + 155) ÷ 2 = 154 Alors, M2 est (3053.5, 154)

La méthode de la droite médiane-Médiane Exemple 3) {(3741, 239), (4059, 216), (4262, 255), (4475, 197), (5186, 290), (5604, 254), (6467,342)} Médiane des abscisses: 3741, 4059, 4262, 4475, 5186, 5604, 6467 Donc, 4475 Médiane des ordonnées: 197, 216, 239, 254, 255, 290, 342 Donc, 254 Alors, M3 est (4475, 254) M1 = (1940, 82) M2 = (3053.5, 154) P est (3156.17, 163.33) Maintenant, on peut trouver la pente de la droite de régression en utilisant M1 et M3:

La méthode de la droite médiane-Médiane Exemple Une fois que la pente est déterminée, il reste à trouver l’ordonnée à l’orgine en utilisant le point P. y = 0.068x + b avec (3156.17, 163.33) 163.33 = 0.068(3156.17) + b 163.33 = 214.62 + b b = -51.29 Alors, l’équation de la droite de régression pour cette situation est: y = 0.068x – 51.29