Lien entre deux variables La corrélation (inspiré du cours BIO2041)
Étude de la liaison entre deux variables Deux variables environnementales sont mesurées pH et contenu en carbonates pH et contenu en matière organique Contenu en matière organique et concentrations en éléments traces Concentration en cations basiques dans le sol et minéralogie
Corrélation Définition : Analyse statistique entre deux variables aléatoires (ou une variable aléatoire et une variable contrôlée) pour mettre en lumière une possible relation linéaire. Objectif : Mesurer la liaison entre deux variables (x et y) à l’aide d’un coefficient qui se situe de 0 (relation nulle) à 1 (relation parfaite). Types : Paramétrique (Pearson) Non paramétrique (Spearman)
Conditions d’application Les deux variables sont quantitatives La distribution des deux variables est normale Si oui (paramétrique) : corrélation de Pearson Si non (non paramétrique) : corrélation de Spearman
Les hypothèses Deux hypothèses : Exemple (test bilatéral) : H0 - Hypothèse nulle H1 - hypothèse alternative Exemple (test bilatéral) : H0 - Il n’y a pas de relation entre les concentrations de CO2 mesurées dans l’atmosphère et l’effet de serre. H1 - Il existe une relation entre les concentrations de CO2 mesurée dans l’atmosphère et l’effet de serre.
Test de signification Une fois que le coefficient de la corrélation est calculé, nous voulons savoir s’il est significatif à l’aide de la valeur P. Une corrélation significative n’est pas toujours une relation de causalité. Exemple : Si un coefficient de 0,90 est obtenu entre le nombre d’érable à sucre et la quantité de nuages dans le ciel, il sera difficile d’en discuter et de développer des explications
Test en 7 étapes Étape 1 Étape 2 Étape 3 La question : On formule une question face à une situation. Étape 2 Les hypothèses : On émet deux hypothèses (H0 et H1) Étape 3 Le choix du test statistique
Test en 7 étapes (suite) Étape 4 Étape 5 Les conditions d’application : Voir les conditions d’application associées aux différents tests. Exemple : Le test requiert une normalité des distributions. Vous devez donc tester la normalité de la (ou les) distribution à l’aide d’un test de normalité (Shapiro-Wilk). Si le test de normalité conclue que la distribution est normale, on peut exécuter un test paramétrique. Sinon, on utilise un test non-paramétrique. Étape 5 Les règles de décision : On détermine un seuil en deçà duquel l’hypothèse nulle sera rejetée.
Test en 7 étapes (suite) Étape 6 Étape 7 Décision statistique : Quelle hypothèse est retenue ? H0 ou H1 ? Étape 7 Interprétation : On explique les résultats statistiques.