Modélisation Nuage de points
Les travaux statistiques nous permettent de faire des observations sur des phénomènes, des objets, des populations, etc. En sciences, l’analyse de données issues d’expériences ou d’études statistiques est un élément essentiel de la recherche. Tous les résultats ne correspondent pas toujours à des situations parfaites. Cependant, lorsqu’un lien est mis en évidence et que son intensité a été mesurée, il devient possible de le modéliser à l’aide d’une fonction.
Exemple : Les données suivantes proviennent d’un rapport paru en 2000 portant sur le développement dans le monde. Pays Taux de mortalité infantile (%) Angola Argentine Bangladesh Canada Côte d’Ivoire Égypte États-Unis Haïti Inde Mexique Nicaragua Pérou Sierra Lone Vietman Espérance de vie (années) 46,5 72,9 58,1 79,0 46,7 66,3 76,7 53,7 62,6 72,2 67,9 68,3 37,2 67,4 12,5 2,2 7,5 0,6 8,7 5,1 0,7 7,1 3,1 4,3 4,0 17,0 2,9
En reportant ces données dans un plan cartésien, nous obtenons : - l’espérance de vie, en abscisse; - la mortalité infantile, en ordonnée. En plaçant chaque couple, Développement dans le monde Mortalité infantile (%) 4 2 6 10 8 14 12 16 20 18 nous obtenons une représentation graphique de la situation. Les points ne sont pas parfaitement alignés, mais une certaine tendance se dessine. Cette situation s’apparente à une fonction linéaire de variation partielle. Cette situation peut donc être modélisée par une fonction linéaire. 20 40 60 80 100 Espérance de vie (années)
Certains nuages de points ne révèlent rien de particulier. D’autres, au contraire, sont très significatifs.
Plus il y a de données, plus le nuage est représentatif.
Les nuages de points peuvent prendre diverses formes Les nuages de points peuvent prendre diverses formes. Lorsque le lien est fort (les points sont très rapprochés les uns des autres, on peut les modéliser). y x y x y x Modélisable par une fonction linéaire. Modélisable par une fonction inversement proportionnelle. Modélisable par une fonction constante.
Comment construire un nuage de points Exemple : Ce tableau représente l’âge et la taille (en cm) d’un échantillon d’adolescents. 11 12 13 14 15 16 142 123 140 160 148 155 172 157 165 167 180 161 Âge Taille (cm)
Chaque couple de données s’écrit comme un couple de coordonnées dans le plan cartésien. 11 12 13 14 15 16 142 123 140 160 148 155 172 157 165 167 180 161 Âge Taille (cm) ( 11, 142 ) La première coordonnée (ici, l’âge) sera représentée sur l’axe des abscisses. La deuxième coordonnée (ici, la taille) sera représentée sur l’axe des ordonnées. Chaque couple sera inscrit dans un plan cartésien.
La graduation des axes est importante. 11 12 13 14 15 16 142 123 140 160 148 155 172 157 165 167 180 161 L1 L2 Sur un même axe, la distance entre les échelons doit être égale. Pour une meilleure interprétation, le graphique devrait avoir une forme approximativement carrée.
Pour déterminer la graduation, calcule l’étendue de chaque distribution (chaque colonne). 11 12 13 14 15 16 142 123 140 160 148 155 172 157 165 167 180 161 L1 L2 L1: 16 – 11 = 5 Comme l’étendue est très petite, chaque trait vaudra 1. On commence avec un nombre inférieur à la première donnée et on termine avec un nombre supérieur à la dernière donnée. Donc, de 10 à 17 Âge 10 11 12 13 14 15 16 17 Remarque : Comme chaque trait représente une unité et que, par rapport à l’origine, il y a plusieurs unités qu’on n’utilise pas, il faut penser à mettre ce petit symbole :
Pour déterminer la graduation, calcule l’étendue de chaque distribution (chaque colonne). 11 12 13 14 15 16 142 123 140 160 148 155 172 157 165 167 180 161 L1 L2 L2: 180 - 123 = 57 L’étendue de la distribution est de 180 – 123, donc de 57. Six intervalles peuvent être utilisés d’une largeur de 10 unités chacun. Taille (cm) 180 170 160 150 140 130 120 Pense à
Nous pouvons maintenant tracer le nuage de points. Il faut être le plus précis possible. Répartition d’un échantillon d’adolescents en fonction de l’âge et de la taille 11 12 13 14 15 16 142 123 140 160 148 155 172 157 165 167 180 161 L1 L2 10 11 12 13 14 15 16 17 Âge 120 130 140 150 160 170 Taille (cm) 180 2 ici, on a 2 fois le couple (12 , 148); 2 Remarque : on inscrit alors un 2 à côté du point pour indiquer qu’il y en a 2.
Voilà, le nuage de points est tracé. 10 11 12 13 14 15 16 17 Âge 120 130 140 150 160 170 Taille (cm) 180 Répartition d’un échantillon d’adolescents en fonction de l’âge et la taille 2 Ici, le nuage de points est assez dispersé; le lien entre les variables est donc faible et non significatif.