Stats III: corrélation & Processus de publication scientifique Cours 6 Stats III: corrélation & Processus de publication scientifique 13 février BIO 3500 – Hiver 2017
Plan Corrélation Processus de publication des articles scientifiques
La corrélation
Corrélation Mesurer la force de l’association linéaire entre 2 variables quantitatives positive négative nulle Corrélation
La corrélation Deux variables ont-elles les mêmes tendances? Peut-on prédire la valeur de l’une si on connait la valeur de l’autre? Régression – la semaine prochaine
Corrélation La corrélation n'est pas une relation de cause à effet!!!! Consommation de margarine Divorce au Maine
Corrélation et régression La longueur du bras ne CAUSE pas la longueur de la jambe
Corrélation et régression [hormone de croissance X] La concentration de l’hormone de croissance X CAUSE la longueur de la jambe et du bras
r de Pearson On utilise la méthode de Pearson dérivée de la covariance et adaptée à des échantillons d’une population Valeur estimée : r de Pearson La valeur de r varie entre -1 et 1 r = 0; corrélation nulle r = -1 ou 1; corrélation parfaite
Pearson Karl Pearson 1857-1936 Angleterre Développe également le test du Khi2 (dans 2 semaines) Ardent promoteur de la sélection artificielle chez l’humain! Karl Pearson (27 mars 1857–27 avril 1936), mathématicien britannique, est un des fondateurs des statistiques modernes. L'analyse statistique connaît un grand développement à la fin du XIXe siècle au Royaume-Uni et Karl Pearson domine ses contemporains par l'étendue et la variété de ses contributions. Il développe des méthodes d'analyse pour l'étude de la sélection naturelle et de l'eugénisme dont il est un ardent promoteur. Sa principale contribution est la création du test du χ² destiné à estimer si les écarts observés dans un ensemble de variables par rapport aux valeurs théoriques peuvent être attribués ou non à un échantillonnage au hasard Pearson pense qu'il est possible et même éminemment souhaitable d'améliorer la race humaine (ou tout au moins britannique) en sélectionnant et favorisant les plus doués de ses représentants comme le fait la sélection naturelle pour les animaux.
r de Pearson Quelles corrélations r=1? r=-1? r=0? 1 2 3 4 5 6 7 1 2 3
r de Pearson Relations linéaires Relations non linéaires
Formule de corrélation (de Pearson) r de Pearson = covariance(x,y)/[écart-type(x)*écart-type(y)*(n-1)]
Exemple - corrélation Température moyenne annuelle 13 14 12 15 Nombre de pirates dans les Caraïbes 2400 2300 2000 2100 1900 Nombre de pirates Température
Exemple - corrélation Ici n égal? Température moyenne annuelle 13 14 12 15 Nombre de pirates dans les Caraïbes 2400 2300 2000 2100 1900 Ici n égal?
Exemple - corrélation Ici n = 6 Température moyenne annuelle 13 14 12 15 Nombre de pirates dans les Caraïbes 2400 2300 2000 2100 1900 Ici n = 6
Exemple - corrélation Température moyenne annuelle 13 14 12 15 83 Nombre de pirates dans les Caraïbes 2400 2300 2000 2100 1900 13 100 Température * Pirates 31200 32200 28800 30000 29400 28500 180 100 somme é.-t.
Exemple - corrélation Température moyenne annuelle 13 14 12 15 83 1.17 Nombre de pirates dans les Caraïbes 2400 2300 2000 2100 1900 13 100 213.7 Température * Pirates 31200 32200 28800 30000 29400 28500 180 100 somme é.-t.
Exemple - corrélation =−0.89 = (180 100− 83∗13100 6 ) Température moyenne annuelle 13 14 12 15 83 1.17 Nombre de pirates dans les Caraïbes 2400 2300 2000 2100 1900 13 100 213.7 Température * Pirates 31200 32200 28800 30000 29400 28500 180 100 somme é.-t. (180 100− 83∗13100 6 ) (6-1) * 1.17 * 213.7 =−0.89 =
Tests d’hypothèses H0: ρ=0 (l’hypothèse la plus souvent testée) L’hypothèse testée par les logiciels statistiques ρ = corrélation dans la population r = corrélation de l’échantillon Lorsque p=0 r se distribue normalement… ah pis non…
Tests d’hypothèses H0: ρ=0 H1: ρ≠0 la variable x et la variable y ne sont pas corrélées H1: ρ≠0 la variable x et la variable y sont corrélées Lorsque p=0 r se distribue normalement… ah pis non…
Test sur le coefficient On utilise la statistique t pour tester l’hypothèse nulle H0: ρ=0 et alternative H1: ρ≠0
Note Importante L’existence d’une corrélation significative entre deux variables ne permet pas d’inférer un lien cause – effet Une corrélation ayant un faible r de Pearson (très faible association entre les variables) peut quand même être significative, surtout à n élevé
Suppositions de la corrélation L’échantillon est représentatif de la relation entre les deux variables (échantillonnage aléatoire) La relation est linéaire Normalité bivariée
Quelle corrélation est la plus représentative?
Quelle corrélation est la plus représentative?
En équipe Développez la corrélation. 1 question Les hypothèses Les données à récoltées Les variables, leur types
Plan Corrélation Processus de publication des articles scientifiques
Processus de publication d'articles scientifiques Écrire un manuscrit et le faire circuler entre les co-auteurs. Demander à un/des collègue(s) qui ne sont pas co-auteurs de donner leurs commentaires. Formater l'article pour le périodique où on veut le soumettre. Soumettre l'article à un périodique Un éditeur (associé) décide si l'article semble convenir à la revue. Si oui, il envoie l'article à 2, 3 ou 4 experts (pairs) dans le domaine (le ''comité de lecture''). Ces évaluateurs externes scrutent l'article, et au jugement de sa qualité et de sa pertinence dans le domaine, ils recommandent de l'accepter sous réserve de modifications mineures, majeures, ou de le rejeter avec ou sans possibilité de re- soumission. Les auteurs font les modifications et renvoient l'article à ce périodique (en cas d'acceptation conditionnelle) ou à une autre (en cas de rejet). L'éditeur prend une décision finale si nécessaire, et en cas d'acceptation finale, l'article part vers les presses.
1. Écrire le manuscrit! Peut prendre de 2 jours à 8 ans! Circuler entre les auteurs En général, le premier auteur révise en fonction des commentaires
2. Faire réviser par des collègues Dans le meilleur des cas! Ce n’est pas toujours possible
3. Formater l’article pour la revue ENDNOTE! Les revues ont de loooooooongues listes de prérequis pour limiter au maximum la manutention de leur côté. Ex: Global ecology and biogeography: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN) 1466-8238/homepage/ForAuthors.html Si l’article est refusé... il faut parfois tout changer
4. Soumettre l’article Avant par la poste, maintenant en ligne! Peut prendre 1-2 hres (si tout est dans le bon format!)
5. L’éditeur Un éditeur (associé) décide si l'article semble convenir à la revue. Critères, correspond ou non aux objectifs de la revue (aims and scope) Est-ce que l’article est assez « sexy » pour la revue. Certaines revues rejettent 90% des articles à ce stade! Si oui, il envoie l'article à 2, 3 ou 4 experts (pairs) dans le domaine (le ''comité de lecture''). Cela peut prendre de quelques jours à quelques mois
6. Évaluateurs externes (pairs review) Les experts lisent l’articles et jugent sa qualité Ceux-ci ne doivent pas être liés aux auteurs (avoir publiés avec eux récemment) Ils sont souvent recommandés par les auteurs Des cas où certains se sont recommandés sous de fausses adresses… Ils recommandent de l'accepter sous réserve de modifications mineures, majeures, ou de le rejeter avec ou sans possibilité de re-soumission. Cela peut prendre 2 autres mois (et plus)
7. Révision Les auteurs font les modifications et renvoient l'article à ce périodique (en cas d'acceptation conditionnelle) ou à une autre (en cas de rejet). Si accepté, souvent une limite de 30 – 90 jours pour faire les modifications
8. Décision finale L'éditeur prend une décision finale si nécessaire, et en cas d'acceptation finale, l'article part vers les presses.
Quelques infos Les auteurs ne reçoivent aucune rétribution en échange de la publication de leur manuscrit (hormis la notoriété). En fait, il y a souvent des frais, même assez importants, que les auteurs doivent débourser pour la publication! Les réviseurs/éditeurs non plus ne sont pas payés pour leur travail. Bref, les compagnies d’édition s’en mettent plein les poches en ne faisant pas grand choses….
Dates et propriété intellectuelle La propriété intellectuelle d'une idée scientifique est déterminée par la date de soumission à un périodique (étape #4) (étape #7) (étape #8) Received 6 September 2006; received in revised form 11 January 2007; accepted 12 January 2007
Quelques indices de qualité des articles 1. Qualité de la recherche (contenu scientifique) et de l'article lui-même (fonction des différentes parties, clarté du texte, etc.) 2. Renommée du périodique où il est publié; peut être évaluée entre autre par le facteur d'impact (Web of Science) Ex.: Science ~ 30, Ecology ~ 4, Forest Ecology & Management ~ 2 Logique de général à spécifique. En gros, la cote correspond au nombre de fois qu'un article de cette revue est cité en général. 3. Taux de citations de l'article: un article qui est cité souvent dans les bibliographies des autres articles dans le domaine possède une bonne valeur heuristique (i.e. il a stimulé la poursuite d'autres recherches sur cette question). Ex.: Scopus
Mesures de « qualité » des chercheurs Nombre total de citations/article Journaux où les articles sont publiés (1 article dans science = 20 articles dans le journal of northern forest research) H factor: Le nombre d’articles n cité un nombre minimal de n fois.