Corrélation, TI-80 et interprétation Remarque :

Slides:



Advertisements
Présentations similaires
La place accordée à l’expression des salariés sur leur travail et leurs conditions de travail dans l’entreprise Résultats sondage exclusif CSA/ANACT.
Advertisements

Mais vous comprenez qu’il s’agit d’une « tromperie ».
Additions soustractions
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
Calcul mental Calcul mental Année scolaire Classe de …
Organisation et gestion de données, fonctions
Les nombres.
Les numéros 70 –
1. Les caractéristiques de dispersion. 11. Utilité.
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Données statistiques sur le droit doption au 31/01 8 février 2012.
ETALONNAGE D’UN CAPTEUR
Sondage sur les préjugés Ensemble et l’association d'études canadiennes 20 mars, 2013 Une recherche novatrice sur le lieu, la fréquence et les différents.
Révision (p. 130, texte) Nombres (1-100).
Les résultats Le tri croisé
Les traitements croisés
LES ÉLASTICITÉS DE LA DEMANDE ET DE L’OFFRE
Systèmes d’équations du premier degré à deux variables
Jack Jedwab Association détudes canadiennes Le 27 septembre 2008 Sondage post-Olympique.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Zéros de polynômes (La loi du produit nul) Remarque :
Présentation générale
Le drapeau canadien comme symbole de fierté nationale : une question de valeurs partagées Jack Jedwab Association détudes canadiennes 28 novembre 2012.
Décomposer un nombre en facteurs premiers.
Les quartiers Villeray – La Petite-Patrie et les voisinages
Régression linéaire simple
La consommation de boissons alcooliques chez les jeunes LICEO SCIENTIFICO N. COPERNICO PRATO ELEVES (age ans): 342 F: 192 M: 150.
Tableaux de distributions
Tableaux de distributions
Les Pourcentages.
Systèmes d’équations du premier degré à deux variables
Fonction partie entière
Les chiffres & les nombres
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
La corrélation et la régression
Corrélation Principe fondamental d’une analyse de corrélation
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Fonction polynomiale de degré 1
Modélisation Nuage de points.
Factorisation de trinômes
Jean-Marc Léger Président Léger Marketing Léger Marketing Les élections présidentielles américaines.
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Veuillez trouver ci-joint
Fonction partie entière
Fonction polynomiale de degré 1
Fonction partie entière
Introduction à l’algèbre
Inéquations du second degré à deux variables
Inéquations du premier degré à une inconnue
Résoudre une équation du 1er degré à une inconnue
Les relations - Règles - Variables - Table de valeurs - Graphiques.
Modélisation Nuage de points.
Aire d’une figure par encadrement
Écart moyen et écart type
Coefficient de corrélation linéaire
La droite dans R3 Montage préparé par : André Ross
Écart type et TI-80.
Statistique Tableau à double entrée Nuage de points.
Chapitre 5 Prévisions.
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Mise en forme en Mathématiques
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
CALENDRIER-PLAYBOY 2020.
Annexe Résultats provinciaux comparés à la moyenne canadienne
Inéquations du premier degré à une inconnue
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
Bienvenue.
Transcription de la présentation:

Corrélation, TI-80 et interprétation Remarque : Tu devrais visionner les présentations « Tableau à double entrée et nuage de points.ppt » ainsi que « Coefficient de corrélation et droite de régression.ppt » avant de visionner celui-ci.

La calculatrice TI-80 est un outil très intéressant dans le domaine de la statistique. Elle permet d’analyser rapidement des distributions de données et encore plus intéressant, elle permet d’effectuer des calculs avec une grande précision puisqu’elle tient compte des formules officielles utilisées en statistique. pour le coefficient de corrélation.

Pour déterminer la droite de régression.

Dans cette présentation, nous verrons comment : déterminer le coefficient de corrélation et la droite de régression entre plusieurs variables (deux à la fois); - comprendre les limites de la calculatrice; - interpréter les résultats affichés. La première étape est d’entrer les données dans la calculatrice. Pour effectuer ce travail de préparation, tu devrais visionner la présentation « Tableau à double entrée et nuage de points.ppt ». On y explique le procédé.

Pour effectuer le travail, nous aurons besoin de connaître et de comprendre plusieurs menus et plusieurs fonctions. EDIT CALC 1: EDIT… 2: SORTA( 3: SORTD( 4: CLRLIST L1 L2 EDIT CALC 1: EDIT… 2: SORTA( 3: SORTD( 4: CLRLIST EDIT CALC 1: 1-Var stats 2: 2-Var stats 3: Linreg(ax+b) 4: Quadreg EDIT CALC 1: Edit… 2: SortA( 3: SortD( 4: Clrlist LINREG(ax+b) , L2 L1 LINREG(ax+b) y= ax+b a= .6465921605 b= 30.22423217 r= .703007118

Pour la première partie de la présentation, nous travaillerons avec ce tableau. 67 72 85 76 70 54 50 51 63 81 52 47 93 55 88 87 71 60 58 64 102 74 62 94 78 12 10 6 4 3 5 8 9 2 7 Masse (kg) Rythme cardiaque au repos (pulsations/min) Nombre d’activités physiques par mois Individus 1 11 13 14 15 L1 L2 L3

Remarque : Pour faciliter le travail de construction du tableau à double entrée et du nuage de points, il faut mettre les listes de données en ordre croissant. Pour obtenir le coefficient de corrélation et la droite de régression, il n’est pas nécessaire de le faire. Il est même préférable de ne pas le faire. Nous allons comparer plusieurs colonnes entre elles : L1 avec L2, L1 avec L3, L2 avec L3. Si les listes étaient en ordre croissant, le lien d’association existant entre les variables serait brisé.

Obtenir le coefficient de corrélation et la droite de régression Pèse sur STAT. EDIT CALC 1: 1-Var stats 2: 2-Var stats 3: Linreg(ax+b) 4: Quadreg LINREG(ax+b) EDIT CALC 1: EDIT… 2: SORTA( 3: SORTD( 4: CLRLIST L1 , Le menu suivant s’affichera. L2 Sélectionne CALC, un nouveau menu s’affichera. Sélectionne 3 : Linreg(ax+b) Dans la nouvelle fenêtre, appelle tes deux colonnes comme suit : 2nd puis la touche 1 La calculatrice affiche alors L1. ATTENTION : tu dois inscrire une virgule. Inscris une virgule. Appelle la deuxième colonne, 2nd puis la touche 2 La calculatrice affiche L2. Pèse sur ENTER.

Voici le résultat des calculs : LINREG(ax+b) y= ax+b a = .6465921605 b = 30.22423217 r = .703007118 Le taux de variation. L’ordonnée à l’origine. Le coefficient de corrélation. Remarques : 1) La calculatrice ne tient pas compte du chiffre 0; il faut lire : a = 0,6465921605 r = 0,703007118 2) La calculatrice est très précise; c’est pour cette raison qu’il y a autant de chiffres après la virgule. Pour effectuer des calculs précis, il faut garder : 4 chiffres après la virgule pour le paramètre a; 2 chiffres après la virgule pour le paramètre b; 2 chiffres après la virgule pour le coefficient r; y = 0,6466x + 30,22 et r ≈ 0,70 L’équation y = 0,65x + 30,2 serait représentative, mais moins précise pour les calculs.

Comme il est positif, les deux variables varient dans le même sens; y = 0,6466x + 30,22 r ≈ 0,70 LINREG(ax+b) y= ax+b a= .6465921605 b= 30.22423217 r = .703007118 Le coefficient de corrélation indique un lien linéaire moyen entre les variables. Comme il est positif, les deux variables varient dans le même sens; quand x augmente, y augmente également. Ce qui signifie que lorsque la masse augmente, le rythme cardiaque au repos augmente aussi. L2: Rythme cardiaque au repos (pulsations/min) EDIT CALC 1: Edit… 2: SortA( 3: SortD( 4: Clrlist L1 : Masse (kg). (Sur l’axe des abscisses). L2 : Rythme cardiaque au repos (pulsations/min). L1: Masse (kg) (Sur l’axe des ordonnées). Il semble donc qu’il y ait un lien moyen entre la masse et le rythme cardiaque au repos.

La relation linéaire étant moyenne, l’imprécision est plus grande. L’équation de la droite de régression nous permet de faire des prédictions théoriquement. L2: Rythme cardiaque au repos (pulsations/min) EDIT CALC 1: Edit… 2: SortA( 3: SortD( 4: Clrlist y = 0,6466x + 30,22 Exemple : Quelle pourrait être la masse d’une personne dont le rythme cardiaque au repos est de 120 pulsations/minute ? L1: Masse (kg) y = 0,6466x + 30,22 120 ≈ 0,6466x + 30,22 x ≈ 138,1 kg Cela paraît exagéré, mais il faut se souvenir que le coefficient de corrélation (0,70) montre un lien moyen entre les variables. La relation linéaire étant moyenne, l’imprécision est plus grande. De plus, il existe peut-être d’autres facteurs que la masse qui peuvent affecter le rythme cardiaque au repos : cigarette, anxiété, forme physique, etc.

Tu peux comparer les listes de données très facilement. Remarque LINREG(ax+b) , L3 L2 LINREG(ax+b) , L3 L1 LINREG(ax+b) , L2 L1 Tu peux comparer les listes de données très facilement. Selon le tableau utilisé, LINREG(ax+b) L1 , L2 masse et rythme cardiaque; LINREG(ax+b) L1 , L3 masse et nombre d’activités par mois; LINREG(ax+b) L2 , L3 rythme cardiaque et nombre d’activités par mois. La première colonne appelée est toujours sur l’axe des abscisses. LINREG(ax+b) L1 , L3 y ≈ -0,1154x + 14,87 r ≈ -0,62 Le lien n’est pas très fort et négatif, mais il montre que la masse augmente quand le nombre d’activités par mois diminue. LINREG(ax+b) L2 , L3 y ≈ -0,1755x + 20,04 r ≈ -0,86 Le lien est plus fort et négatif; il montre que le rythme cardiaque augmente quand le nombre d’activités par mois diminue.

La calculatrice ne réfléchit pas, elle calcule ! ATTENTION LINREG(ax+b) y= ax+b a= .5684454756 b= 18.39211137 r = .0673669204 La calculatrice donnera toujours une équation pour la droite de régression même si le coefficient de corrélation est très près de 0. La calculatrice ne réfléchit pas, elle calcule ! Tu dois donc faire attention ! Vérifie toujours le coefficient de corrélation; près de 1,0 ou -1,0 : l’équation est représentative; près de 0 : l’équation ne l’est pas.

rythme cardiaque et nombre d’activités par mois. Revenons sur les données concernant le rythme cardiaque au repos et le nombre d’activités par mois. LINREG(ax+b) L2 , L3 rythme cardiaque et nombre d’activités par mois. LINREG(ax+b) L2 , L3 y ≈ -0,1755x + 20,04 r ≈ -0,86 Le coefficient de corrélation est négatif, donc le taux de variation aussi; les variables varient donc en sens contraire. Nombre d’activités physiques (par mois) Rythme cardiaque au repos (pulsations/min) Quand x augmente y diminue. Il semblerait que le rythme cardiaque augmente quand une personne diminue ses activités physiques. Le coefficient de corrélation indique un lien assez net entre les deux. Ici encore, il faut faire attention. Le lien est assez net, mais l’échantillon ne contient que 15 données.

Quelques situations à interpréter

Des sociologues québécois ont étudié la relation entre le revenu familial et le taux de fécondité dans 5 communautés culturelles différentes. Voici les coefficients de corrélation linéaire obtenus. Communauté A B C D E r 0,6 -0,3 0 -0,8 0,1 A) Classe ces communautés selon l’intensité de la corrélation observée de la plus faible à la plus forte. Réponse : C, E, B, A, D B) Indique la communauté décrite par chacun des énoncés suivants : 1) Les familles les plus riches de cette communauté ont nettement moins d’enfants que les familles les plus pauvres. 2) En général, plus on est riche dans cette communauté, plus on a d’enfants, mais il y a des exceptions. 3) Dans cette communauté, toutes les familles ont beaucoup d’enfants, que celles-ci soient riches ou pauvres n’a pas d’importance.

Pour répondre à ces questions, il faut être capable de se représenter mentalement le diagramme de dispersion. Communauté A B C D E r 0,6 -0,3 0 -0,8 0,1 Revenu familial ($) Taux de fécondité (%) 1) Les familles les plus riches de cette communauté ont nettement moins d’enfants que les familles les plus pauvres. Le terme « nettement » signifie que la corrélation est forte, donc soit 0,6 ou -0,8. Selon la phrase, les variables ne vont pas dans le même sens. Plus le revenu augmente et moins il y a d’enfants. Imaginons le nuage de points. Réponse : D

Pour répondre à ces questions, il faut être capable de se représenter mentalement le diagramme de dispersion. Communauté A B C D E r 0,6 -0,3 0 -0,8 0,1 Revenu familial ($) Taux de fécondité (%) 2) En général, plus on est riche dans cette communauté, plus on a d’enfants, mais il y a des exceptions. Les termes «  il y a des exceptions » signifie que la corrélation est un peu plus faible, donc soit 0,6 ou -0,3. Selon la phrase, les variables vont dans le même sens. Plus le revenu augmente et plus il y a d’enfants. Imaginons le nuage de points. Réponse : A

Pour répondre à ces questions, il faut être capable de se représenter mentalement le diagramme de dispersion. Communauté A B C D E r 0,6 -0,3 0 -0,8 0,1 Revenu familial ($) Taux de fécondité (%) 3) Dans cette communauté, toutes les familles ont beaucoup d’enfants, que celles-ci soient riches ou pauvres n’a pas d’importance. Les termes «  n’a pas d’importance » signifie que la corrélation est très faible, donc soit 0 ou 0,1. Selon la phrase, les variables n’ont pas vraiment de lien entre elles. Riches ou pauvres, les familles ont beaucoup d’enfants. Imaginons le nuage de points. Réponse : C ou E

Selon le nuage, il n’y a pas de corrélation très forte entre les deux, On a interrogé 30 élèves âgés de 15 à 16 ans sur le temps qu’ils consacrent par semaine à un travail rémunéré à l’extérieur de l’école, puis on a évalué sur 10 leur rendement scolaire. Voici le nuage de points représentant ces données. Selon ces données, peut-on dire que le travail des jeunes nuit à leur rendement scolaire ? 10 5 2 4 6 8 12 14 16 18 20 9 7 3 1 Temps de travail (h) Rendement scolaire Travail des jeunes Selon le nuage, il n’y a pas de corrélation très forte entre les deux, dérange pas les études. donc le travail ne Parfois, il faut étudier le nuage par section. Si on considère la première section du nuage, on pourrait dire qu’entre 0 et 7 heures de travail, le rendement n’est pas vraiment affecté. Cependant, de 7 à 20 heures, le rendement est beaucoup plus affecté; en particulier, passé 12 heures. Peut-on établir une relation de cause à effet ? Avant de se prononcer, il faudrait obtenir plus d’informations !

Une nouvelle entreprise de télécommunications à fait son apparition sur le marché de la bourse le 31 décembre dernier. 7 janvier 14,75 14 janvier 17,50 21 janvier 13,25 28 janvier 15,00 4 février 13,75 11 février 14,50 18 février 21,25 25 février 18,00 4 mars 17,75 11 mars 22,50 18 mars 24,25 25 mars 19,00 1 avril 22,50 8 avril 20,25 15 avril 23,00 22 avril 22,75 Valeur de l’action à la fermeture, chaque vendredi Elle vendait alors ses actions, 14,00 $ chacune. Le tableau suivant présente le prix de cette action à la fermeture, à chaque vendredi. Dans combien de mois, l’action aura-t-elle doublé de valeur ? Pour répondre à cette question, il faut être capable d’interpréter la situation. Le tableau de compilation sera comme suit :

0 14,00 1 14,75 2 17,50 3 13,25 4 15,00 5 13,75 6 14,50 7 21,25 8 18,00 9 17,75 10 22,50 11 24,25 12 19,00 13 22,50 14 20,25 15 23,00 16 22,75 Valeur de l’action à la fermeture, chaque vendredi Valeur de l’action à la fermeture, chaque vendredi Achat : 7 janvier 14,75 14 janvier 17,50 21 janvier 13,25 28 janvier 15,00 4 février 13,75 11 février 14,50 18 février 21,25 25 février 18,00 4 mars 17,75 11 mars 22,50 18 mars 24,25 25 mars 19,00 1 avril 22,50 8 avril 20,25 15 avril 23,00 22 avril 22,75 1er vendredi 2e vendredi et ainsi de suite.

0 14,00 1 14,75 2 17,50 3 13,25 4 15,00 5 13,75 6 14,50 7 21,25 8 18,00 9 17,75 10 22,50 11 24,25 12 19,00 13 22,50 14 20,25 15 23,00 16 22,75 Valeur de l’action à la fermeture, chaque vendredi Avec la calculatrice, détermine la droite de régression. y ≈ 0,6140x + 13,56 r ≈ 0,82 x : variable de référence : le nombre de vendredis y : la valeur de l’action Dans combien de mois la valeur de l’action aura-t-elle doublé, c’est-à-dire une valeur de 28,00$. Cherchons, en premier, le nombre de vendredis. y ≈ 0,614x + 13,56 28 ≈ 0,614x + 13,56 14,44 ≈ 0,614x 23,52 ≈ x

0 14,00 1 14,75 2 17,50 3 13,25 4 15,00 5 13,75 6 14,50 7 21,25 8 18,00 9 17,75 10 22,50 11 24,25 12 19,00 13 22,50 14 20,25 15 23,00 16 22,75 Valeur de l’action à la fermeture, chaque vendredi x ≈ 23,52 vendredis L’action aura doublé environ le 24e vendredi après son lancement, soit dans 8 vendredis après le 16e, donc dans 2 mois. Attention La droite de régression obtenue indique une tendance théorique; ça ne veut pas dire que cela arrivera nécessairement. Le marché boursier est très fluctuant; il y a tellement de facteurs à considérer.

Voici des données concernant le nombre de tests s’étant révélés positifs au VIH chez les adultes au Canada de 1996 à 2005. 535 2054 1997 483 1861 1998 470 1697 1999 515 1596 2000 486 1538 2001 526 1580 2002 620 1809 2003 627 1822 2004 655 1825 2005 628 1830 Année Nombre de femmes d’hommes Test positifs Selon ces données, si la tendance se maintient, quel sera le pourcentage de femmes parmi l’ensemble des cas décelés en 2025 ?

Calculer le pourcentage par année. Étape 1 : 535 2054 1997 483 1861 1998 470 1697 1999 515 1596 2000 486 1538 2001 526 1580 2002 620 1809 2003 627 1822 2004 655 1825 2005 628 1830 Année Nombre de femmes d’hommes Test positifs Calculer le pourcentage par année. Il faut d’abord faire le total de chaque année; 535 + 2054 = 2589 reporter sur ce total le nombre de femmes et multiplier par 100. 535 2589 X 100 ≈ 20,6643… %. Arrondi au dixième près : ≈ 20,7 %. Avec ta calculatrice, tu peux procéder plus rapidement : 535 ÷ ( 535 + 2054 ) ≈ 0,206643… Déplace mentalement la virgule de deux positions vers la droite : ≈ 20,7 %.

Voici le nouveau tableau en pourcentage. Le taux de variation n’est pas constant. 1996 20,7 1997 20,6 1998 21,7 1999 24,4 2000 24 2001 25 2002 25,5 2003 25,6 2004 26,4 2005 25,5 Année Nombre de femmes (%) diminution de 0,1 % augmentation de 2,7 % Existe-t-il un certain lien linéaire ? Pour le savoir, calculons le coefficient de corrélation.

1996 20,7 1997 20,6 1998 21,7 1999 24,4 2000 24 2001 25 2002 25,5 2003 25,6 2004 26,4 2005 25,5 Année Nombre de femmes (%) r ≈ 0,92 Le coefficient est positif et très fort, il existe un lien linéaire. Déterminons donc la droite de régression.

Si tu utilises les années : Si tu utilises une référence d’étude : 1996 20,7 1997 20,6 1998 21,7 1999 24,4 2000 24 2001 25 2002 25,5 2003 25,6 2004 26,4 2005 25,5 Année Nombre de femmes (%) r ≈ 0,92 0 20,7 1 20,6 2 21,7 3 24,4 4 24 5 25 6 25,5 7 25,6 8 26,4 9 25,5 Année Nombre de femmes (%) r ≈ 0,92 y = 0,6521x – 1280,63 y = 0,6521x + 21

Si tu utilises les années : Si tu utilises la référence d’étude : y = 0,6521x – 1280,63 y = 0,6521x + 21 En 2025 : Soit 29 ans après l’année 0 2025-1996 = 29 y = 0,6521 X 2025 – 1280,63 y = 39,91… y = 0,6521 X 29 + 21 y = 39,9% y = 39,91… y = 39,9% Le coefficient de corrélation est très fort et positif. Les variables vont dans le même sens; plus les années augmentent, plus il y a de femmes atteintes. Mais, ici encore, l’échantillon est très petit.