Télécharger la présentation
Publié parYvette Sellier Modifié depuis plus de 10 années
1
Corrélation, TI-80 et interprétation Remarque :
Tu devrais visionner les présentations « Tableau à double entrée et nuage de points.ppt » ainsi que « Coefficient de corrélation et droite de régression.ppt » avant de visionner celui-ci.
2
La calculatrice TI-80 est un outil très intéressant dans le domaine de la statistique.
Elle permet d’analyser rapidement des distributions de données et encore plus intéressant, elle permet d’effectuer des calculs avec une grande précision puisqu’elle tient compte des formules officielles utilisées en statistique. pour le coefficient de corrélation.
3
Pour déterminer la droite de régression.
4
Dans cette présentation, nous verrons comment :
déterminer le coefficient de corrélation et la droite de régression entre plusieurs variables (deux à la fois); - comprendre les limites de la calculatrice; - interpréter les résultats affichés. La première étape est d’entrer les données dans la calculatrice. Pour effectuer ce travail de préparation, tu devrais visionner la présentation « Tableau à double entrée et nuage de points.ppt ». On y explique le procédé.
5
Pour effectuer le travail, nous aurons besoin de connaître et de comprendre plusieurs menus et plusieurs fonctions. EDIT CALC 1: EDIT… 2: SORTA( 3: SORTD( 4: CLRLIST L1 L2 EDIT CALC 1: EDIT… 2: SORTA( 3: SORTD( 4: CLRLIST EDIT CALC 1: 1-Var stats 2: 2-Var stats 3: Linreg(ax+b) 4: Quadreg EDIT CALC 1: Edit… 2: SortA( 3: SortD( 4: Clrlist LINREG(ax+b) , L2 L1 LINREG(ax+b) y= ax+b a= b= r=
6
Pour la première partie de la présentation, nous travaillerons avec ce tableau.
67 72 85 76 70 54 50 51 63 81 52 47 93 55 88 87 71 60 58 64 102 74 62 94 78 12 10 6 4 3 5 8 9 2 7 Masse (kg) Rythme cardiaque au repos (pulsations/min) Nombre d’activités physiques par mois Individus 1 11 13 14 15 L1 L2 L3
7
Remarque : Pour faciliter le travail de construction du tableau à double entrée et du nuage de points, il faut mettre les listes de données en ordre croissant. Pour obtenir le coefficient de corrélation et la droite de régression, il n’est pas nécessaire de le faire. Il est même préférable de ne pas le faire. Nous allons comparer plusieurs colonnes entre elles : L1 avec L2, L1 avec L3, L2 avec L3. Si les listes étaient en ordre croissant, le lien d’association existant entre les variables serait brisé.
8
Obtenir le coefficient de corrélation et la droite de régression
Pèse sur STAT. EDIT CALC 1: 1-Var stats 2: 2-Var stats 3: Linreg(ax+b) 4: Quadreg LINREG(ax+b) EDIT CALC 1: EDIT… 2: SORTA( 3: SORTD( 4: CLRLIST L1 , Le menu suivant s’affichera. L2 Sélectionne CALC, un nouveau menu s’affichera. Sélectionne 3 : Linreg(ax+b) Dans la nouvelle fenêtre, appelle tes deux colonnes comme suit : 2nd puis la touche 1 La calculatrice affiche alors L1. ATTENTION : tu dois inscrire une virgule. Inscris une virgule. Appelle la deuxième colonne, 2nd puis la touche 2 La calculatrice affiche L2. Pèse sur ENTER.
9
Voici le résultat des calculs :
LINREG(ax+b) y= ax+b a = b = r = Le taux de variation. L’ordonnée à l’origine. Le coefficient de corrélation. Remarques : 1) La calculatrice ne tient pas compte du chiffre 0; il faut lire : a = 0, r = 0, 2) La calculatrice est très précise; c’est pour cette raison qu’il y a autant de chiffres après la virgule. Pour effectuer des calculs précis, il faut garder : 4 chiffres après la virgule pour le paramètre a; 2 chiffres après la virgule pour le paramètre b; 2 chiffres après la virgule pour le coefficient r; y = 0,6466x + 30,22 et r ≈ 0,70 L’équation y = 0,65x + 30,2 serait représentative, mais moins précise pour les calculs.
10
Comme il est positif, les deux variables varient dans le même sens;
y = 0,6466x + 30,22 r ≈ 0,70 LINREG(ax+b) y= ax+b a= b= r = Le coefficient de corrélation indique un lien linéaire moyen entre les variables. Comme il est positif, les deux variables varient dans le même sens; quand x augmente, y augmente également. Ce qui signifie que lorsque la masse augmente, le rythme cardiaque au repos augmente aussi. L2: Rythme cardiaque au repos (pulsations/min) EDIT CALC 1: Edit… 2: SortA( 3: SortD( 4: Clrlist L1 : Masse (kg). (Sur l’axe des abscisses). L2 : Rythme cardiaque au repos (pulsations/min). L1: Masse (kg) (Sur l’axe des ordonnées). Il semble donc qu’il y ait un lien moyen entre la masse et le rythme cardiaque au repos.
11
La relation linéaire étant moyenne, l’imprécision est plus grande.
L’équation de la droite de régression nous permet de faire des prédictions théoriquement. L2: Rythme cardiaque au repos (pulsations/min) EDIT CALC 1: Edit… 2: SortA( 3: SortD( 4: Clrlist y = 0,6466x + 30,22 Exemple : Quelle pourrait être la masse d’une personne dont le rythme cardiaque au repos est de 120 pulsations/minute ? L1: Masse (kg) y = 0,6466x + 30,22 120 ≈ 0,6466x + 30,22 x ≈ 138,1 kg Cela paraît exagéré, mais il faut se souvenir que le coefficient de corrélation (0,70) montre un lien moyen entre les variables. La relation linéaire étant moyenne, l’imprécision est plus grande. De plus, il existe peut-être d’autres facteurs que la masse qui peuvent affecter le rythme cardiaque au repos : cigarette, anxiété, forme physique, etc.
12
Tu peux comparer les listes de données très facilement.
Remarque LINREG(ax+b) , L3 L2 LINREG(ax+b) , L3 L1 LINREG(ax+b) , L2 L1 Tu peux comparer les listes de données très facilement. Selon le tableau utilisé, LINREG(ax+b) L1 , L2 masse et rythme cardiaque; LINREG(ax+b) L1 , L3 masse et nombre d’activités par mois; LINREG(ax+b) L2 , L3 rythme cardiaque et nombre d’activités par mois. La première colonne appelée est toujours sur l’axe des abscisses. LINREG(ax+b) L1 , L3 y ≈ -0,1154x + 14,87 r ≈ -0,62 Le lien n’est pas très fort et négatif, mais il montre que la masse augmente quand le nombre d’activités par mois diminue. LINREG(ax+b) L2 , L3 y ≈ -0,1755x + 20,04 r ≈ -0,86 Le lien est plus fort et négatif; il montre que le rythme cardiaque augmente quand le nombre d’activités par mois diminue.
13
La calculatrice ne réfléchit pas, elle calcule !
ATTENTION LINREG(ax+b) y= ax+b a= b= r = La calculatrice donnera toujours une équation pour la droite de régression même si le coefficient de corrélation est très près de 0. La calculatrice ne réfléchit pas, elle calcule ! Tu dois donc faire attention ! Vérifie toujours le coefficient de corrélation; près de 1,0 ou -1,0 : l’équation est représentative; près de 0 : l’équation ne l’est pas.
14
rythme cardiaque et nombre d’activités par mois.
Revenons sur les données concernant le rythme cardiaque au repos et le nombre d’activités par mois. LINREG(ax+b) L2 , L3 rythme cardiaque et nombre d’activités par mois. LINREG(ax+b) L2 , L3 y ≈ -0,1755x + 20,04 r ≈ -0,86 Le coefficient de corrélation est négatif, donc le taux de variation aussi; les variables varient donc en sens contraire. Nombre d’activités physiques (par mois) Rythme cardiaque au repos (pulsations/min) Quand x augmente y diminue. Il semblerait que le rythme cardiaque augmente quand une personne diminue ses activités physiques. Le coefficient de corrélation indique un lien assez net entre les deux. Ici encore, il faut faire attention. Le lien est assez net, mais l’échantillon ne contient que 15 données.
15
Quelques situations à interpréter
16
Des sociologues québécois ont étudié la relation entre le revenu familial et le taux de fécondité dans 5 communautés culturelles différentes. Voici les coefficients de corrélation linéaire obtenus. Communauté A B C D E r , , , ,1 A) Classe ces communautés selon l’intensité de la corrélation observée de la plus faible à la plus forte. Réponse : C, E, B, A, D B) Indique la communauté décrite par chacun des énoncés suivants : 1) Les familles les plus riches de cette communauté ont nettement moins d’enfants que les familles les plus pauvres. 2) En général, plus on est riche dans cette communauté, plus on a d’enfants, mais il y a des exceptions. 3) Dans cette communauté, toutes les familles ont beaucoup d’enfants, que celles-ci soient riches ou pauvres n’a pas d’importance.
17
Pour répondre à ces questions, il faut être capable de se représenter mentalement le diagramme de dispersion. Communauté A B C D E r , , , ,1 Revenu familial ($) Taux de fécondité (%) 1) Les familles les plus riches de cette communauté ont nettement moins d’enfants que les familles les plus pauvres. Le terme « nettement » signifie que la corrélation est forte, donc soit 0,6 ou -0,8. Selon la phrase, les variables ne vont pas dans le même sens. Plus le revenu augmente et moins il y a d’enfants. Imaginons le nuage de points. Réponse : D
18
Pour répondre à ces questions, il faut être capable de se représenter mentalement le diagramme de dispersion. Communauté A B C D E r , , , ,1 Revenu familial ($) Taux de fécondité (%) 2) En général, plus on est riche dans cette communauté, plus on a d’enfants, mais il y a des exceptions. Les termes « il y a des exceptions » signifie que la corrélation est un peu plus faible, donc soit 0,6 ou -0,3. Selon la phrase, les variables vont dans le même sens. Plus le revenu augmente et plus il y a d’enfants. Imaginons le nuage de points. Réponse : A
19
Pour répondre à ces questions, il faut être capable de se représenter mentalement le diagramme de dispersion. Communauté A B C D E r , , , ,1 Revenu familial ($) Taux de fécondité (%) 3) Dans cette communauté, toutes les familles ont beaucoup d’enfants, que celles-ci soient riches ou pauvres n’a pas d’importance. Les termes « n’a pas d’importance » signifie que la corrélation est très faible, donc soit 0 ou 0,1. Selon la phrase, les variables n’ont pas vraiment de lien entre elles. Riches ou pauvres, les familles ont beaucoup d’enfants. Imaginons le nuage de points. Réponse : C ou E
20
Selon le nuage, il n’y a pas de corrélation très forte entre les deux,
On a interrogé 30 élèves âgés de 15 à 16 ans sur le temps qu’ils consacrent par semaine à un travail rémunéré à l’extérieur de l’école, puis on a évalué sur 10 leur rendement scolaire. Voici le nuage de points représentant ces données. Selon ces données, peut-on dire que le travail des jeunes nuit à leur rendement scolaire ? 10 5 2 4 6 8 12 14 16 18 20 9 7 3 1 Temps de travail (h) Rendement scolaire Travail des jeunes Selon le nuage, il n’y a pas de corrélation très forte entre les deux, dérange pas les études. donc le travail ne Parfois, il faut étudier le nuage par section. Si on considère la première section du nuage, on pourrait dire qu’entre 0 et 7 heures de travail, le rendement n’est pas vraiment affecté. Cependant, de 7 à 20 heures, le rendement est beaucoup plus affecté; en particulier, passé 12 heures. Peut-on établir une relation de cause à effet ? Avant de se prononcer, il faudrait obtenir plus d’informations !
21
Une nouvelle entreprise de télécommunications à fait son apparition sur le marché de la bourse le 31 décembre dernier. 7 janvier ,75 14 janvier ,50 21 janvier ,25 28 janvier ,00 4 février ,75 11 février ,50 18 février ,25 25 février ,00 4 mars ,75 11 mars ,50 18 mars ,25 25 mars ,00 1 avril ,50 8 avril ,25 15 avril ,00 22 avril ,75 Valeur de l’action à la fermeture, chaque vendredi Elle vendait alors ses actions, 14,00 $ chacune. Le tableau suivant présente le prix de cette action à la fermeture, à chaque vendredi. Dans combien de mois, l’action aura-t-elle doublé de valeur ? Pour répondre à cette question, il faut être capable d’interpréter la situation. Le tableau de compilation sera comme suit :
22
,00 ,75 ,50 ,25 ,00 ,75 ,50 ,25 ,00 ,75 ,50 ,25 ,00 ,50 ,25 ,00 ,75 Valeur de l’action à la fermeture, chaque vendredi Valeur de l’action à la fermeture, chaque vendredi Achat : 7 janvier ,75 14 janvier ,50 21 janvier ,25 28 janvier ,00 4 février ,75 11 février ,50 18 février ,25 25 février ,00 4 mars ,75 11 mars ,50 18 mars ,25 25 mars ,00 1 avril ,50 8 avril ,25 15 avril ,00 22 avril ,75 1er vendredi 2e vendredi et ainsi de suite.
23
,00 ,75 ,50 ,25 ,00 ,75 ,50 ,25 ,00 ,75 ,50 ,25 ,00 ,50 ,25 ,00 ,75 Valeur de l’action à la fermeture, chaque vendredi Avec la calculatrice, détermine la droite de régression. y ≈ 0,6140x + 13,56 r ≈ 0,82 x : variable de référence : le nombre de vendredis y : la valeur de l’action Dans combien de mois la valeur de l’action aura-t-elle doublé, c’est-à-dire une valeur de 28,00$. Cherchons, en premier, le nombre de vendredis. y ≈ 0,614x + 13,56 28 ≈ 0,614x + 13,56 14,44 ≈ 0,614x 23,52 ≈ x
24
,00 ,75 ,50 ,25 ,00 ,75 ,50 ,25 ,00 ,75 ,50 ,25 ,00 ,50 ,25 ,00 ,75 Valeur de l’action à la fermeture, chaque vendredi x ≈ 23,52 vendredis L’action aura doublé environ le 24e vendredi après son lancement, soit dans 8 vendredis après le 16e, donc dans 2 mois. Attention La droite de régression obtenue indique une tendance théorique; ça ne veut pas dire que cela arrivera nécessairement. Le marché boursier est très fluctuant; il y a tellement de facteurs à considérer.
25
Voici des données concernant le nombre de tests s’étant révélés positifs au VIH chez les adultes au Canada de 1996 à 2005. Année Nombre de femmes d’hommes Test positifs Selon ces données, si la tendance se maintient, quel sera le pourcentage de femmes parmi l’ensemble des cas décelés en 2025 ?
26
Calculer le pourcentage par année.
Étape 1 : Année Nombre de femmes d’hommes Test positifs Calculer le pourcentage par année. Il faut d’abord faire le total de chaque année; = 2589 reporter sur ce total le nombre de femmes et multiplier par 100. 535 2589 X 100 ≈ 20,6643… %. Arrondi au dixième près : ≈ 20,7 %. Avec ta calculatrice, tu peux procéder plus rapidement : 535 ÷ ( ) ≈ 0,206643… Déplace mentalement la virgule de deux positions vers la droite : ≈ 20,7 %.
27
Voici le nouveau tableau en pourcentage.
Le taux de variation n’est pas constant. ,7 ,6 ,7 ,4 ,5 ,6 ,4 ,5 Année Nombre de femmes (%) diminution de 0,1 % augmentation de 2,7 % Existe-t-il un certain lien linéaire ? Pour le savoir, calculons le coefficient de corrélation.
28
,7 ,6 ,7 ,4 ,5 ,6 ,4 ,5 Année Nombre de femmes (%) r ≈ 0,92 Le coefficient est positif et très fort, il existe un lien linéaire. Déterminons donc la droite de régression.
29
Si tu utilises les années :
Si tu utilises une référence d’étude : ,7 ,6 ,7 ,4 ,5 ,6 ,4 ,5 Année Nombre de femmes (%) r ≈ 0,92 ,7 ,6 ,7 ,4 ,5 ,6 ,4 ,5 Année Nombre de femmes (%) r ≈ 0,92 y = 0,6521x – 1280,63 y = 0,6521x + 21
30
Si tu utilises les années :
Si tu utilises la référence d’étude : y = 0,6521x – 1280,63 y = 0,6521x + 21 En 2025 : Soit 29 ans après l’année 0 = 29 y = 0,6521 X 2025 – 1280,63 y = 39,91… y = 0,6521 X y = 39,9% y = 39,91… y = 39,9% Le coefficient de corrélation est très fort et positif. Les variables vont dans le même sens; plus les années augmentent, plus il y a de femmes atteintes. Mais, ici encore, l’échantillon est très petit.
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.