11/01/2019 École de bibliothéconomie et des sciences de l'information SCI6304 – Bibliométrie et communication savante Cours 8 Limites, lois et collaboration 9 novembre 2018 SCI6304 (A2012) - Vincent Larivière
Limites de la bibliométrie Plan de la séance Lois bibliométriques Lotka, Zipf, Bradford Limites de la bibliométrie Pratiques de publications des différentes disciplines Couverture par pays Analyse des pratiques de collaboration
11/01/2019 Préambule sur les lois Relations mathématiques qui sont généralement respectées dans les jeux de données bibliométriques. Tendances générales… mais je vous mets au défi de trouver un jeu de données qui ne respecte pas ces tendances!!! Paternité des lois : Stephen M. Stigler et la Loi de l’éponymie (1980) “Aucune loi scientifique n’est nommée selon le nom de son découvreur original” Auto-exemplifiée: déjà énoncée en 1816!!! Merci à J. Furner (UCLA) pour l’inspiration! SCI6304 (A2012) - Vincent Larivière
La Loi de Lotka: la Productivité Scientifique Alfred J. Lotka (1880-1949), démographe et statisticien, Metropolitan Life Insurance Company Question de recherche: “Il serait intéressant de déterminer, si possible, la contribution des hommes de différent calibre à l’avancement des connaissances” (notre traduction) Lotka, A.J. (1926), The frequency distribution of scientific productivity, Journal of the Washington Academy of Sciences, 16, 317–324.
La Loi de Lotka (2) Deux jeux de données: Articles publiés entre 1907 et 1916 dans les revues scientifiques indexées par le Chemical Abstracts dont les noms de famille de auteurs commencent par les lettres A et B. Articles publiés avant 1901 et indexés par le Geschichtstafeln der Physik.
La Loi de Lotka (3) Résultat: Dans les deux jeux de données, une minorité de chercheurs étaient responsables d’une majorité des articles. C’est donc dire qu’une majorité des chercheurs publient très peu, et qu’une minorité de chercheurs publient beaucoup.
La Loi de Lotka (4) Publications et citations des professeurs québécois
La Loi de Lotka (5) Financement des professeurs québécois
La Loi de Zipf Fréquence des mots Énoncée en français pour la première fois par J.B. Estoup en 1916 Énoncée en anglais pour la première fois par E. U. Condon, Bell Telephone Labs “While studying some data on the relative frequency of use of different words in the English language, I noticed a rather interesting functional relationship ...” (Statistics of vocabulary, Science, 67, 1928, p. 300.)
Condon utilise deux jeux de données: La Loi de Zipf (2) Condon utilise deux jeux de données: 100,000 occurences de mots colligées par L. P. Ayres (1915) 100,000 occurences de mots colligées by G. Dewey (1923) Résultats: une minorité de mots est utilisée dans une majorité des cas.
La Loi de Zipf (3) N.B. S’applique également à de nombreux autres domaines tels que la linguistique.
La Loi de Bradford La dispersion des publications scientifiques Samuel Clement Bradford (1878-1948), libraire scientifique Deux jeux de données: Articles publiés entre 1928 et 1931 et listés dans les bibliographies sur la géophysique appliquée préparées par la London Science Library Articles publiés entre 1931 et 1933 et listés dans les bibliographies sur la lubrification préparées par la London Science Library Objet analysé: les titres des revues scientifiques dans lesquels ces articles sont publiés.
La Loi de Bradford (2) Résultats: Trois catégories de revues scientifiques Une première catégorie de 8 revues contient 110 articles; Une seconde catégorie de 29 revues contient 133 articles; Une troisième catégorie de 127 revues contient 152 articles. Ainsi, pour chacun des deux domaines, les publications scientifiques sont concentrées dans un nombre restreint de revues.
La Loi de Bradford (3) Revues dans lesquelles les professeurs québécois publient
Limites de la bibliométrie Limite principale: aucune base de données n’est exhaustive. Particulièrement vrai en sciences sociales et humaines Biais en faveur des revues internationales, donc les objets locaux (histoire du Québec, etc.) ne sont pas bien couverts. Importance des objets locaux en SSH (histoire, éducation, sociologie, etc.) Aucun livre n’est indexé.
Pourcentage des citations à des articles de revues dans les sciences (Larivière et al. 2006)
Pourcentage des citations à des articles de revues dans les Sciences Naturelles, Médicales et le Génie (Larivière et al. 2006)
Pourcentage des références faites à des articles de revues dans les Sciences Sociales et les Humanités (Larivière et al. 2006)
Pourcentage des références faites à des Actes de conférences dans les Sciences (Lisée et al. 2008)
Pourcentage des références faites à des Actes de conférences dans les Sciences Sociales et les Humanités (Lisée et al. 2008)
Couverture des revues selon le pays de l’éditeur (Archambault et al
Couverture des revues selon la langue parlée par l’éditeur (Archambault et al. 2006)
Couverture des revues selon la langue des articles (Archambault et al
Âge médian de la littérature citée (Archambault et Larivière, 2010)
Citations reçues par les articles dans les années suivant leur publication (Archambault et Larivière, 2010)
Comment pallier à ces limites? Creation d’un Book Citation Index complet Scopus vs. Thomson vs. Google Scholar Sources de données locales Érudit au Québec Autres initiatives dans les pays de langue autre que l’anglais Demande souvent d’enrôler les chercheurs… difficile. Tables d’autorité
La collaboration en sciences
La collaboration en sciences sociales et humaines
La collaboration en sciences, 1900-2012
La collaboration en sciences sociales et humaines, 1900-2012
Limites du nombre d’auteurs comme indicateur de la collaboration (Paul-Hus et al., 2017)
Les déterminants de la collaboration Individus Genre Statut et rang académique Disciplines Quantitatif vs. qualitatif Théorique vs. empirique Coût des instruments ….! Pays et institutions Taille Objets communs, langue commune Proximité
Bibliographie Archambault, É., Vignola-Gagné, É., Côté., Larivière, V. and Y. Gingras (2006). Benchmarking scientific output in the social sciences and humanities: The limits of existing databases, Scientometrics, 68(3): 329-342. Larivière, V., Archambault, É, Gingras, Y. and É. Vignola-Gagné (2006). The place of serials in referencing practices: Comparing natural sciences and engineering with social sciences and humanities, Journal of the American Society for Information Science and Technology, 57(8): 997-1004. Larivière, V., Archambault, É., Gingras, Y. (2008) Long-term variations in the aging of scientific literature: from exponential growth to steady-state science (1900-2004). Journal of the American Society for Information Science and Technology, 59(2): 288–296. Larivière, V., Gingras, Y. and É. Archambault (2006). Canadian Collaboration Networks: A Comparative Analysis of the Natural Sciences, Social Sciences and the Humanities, Scientometrics, 68(3): 519-533. Larivière, V., Zuccala, A., Archambault, É. (2008) The declining scientific impact of theses: Implications for electronic thesis and dissertation repositories and graduate studies. Scientometrics, 74(1): 109-121 Lisée, C., Larivière, V., Archambault, É. (2008) Conference proceedings as a source of scientific information: A bibliometric analysis. Journal of the American Society for Information Science and Technology, 59(11): 1776–1784 Paul-Hus, A., Mongeon, P., Sainte-Marie, M., & Larivière, V. (2017). The sum of it all: revealing collaboration patterns by combining authorship and acknowledgements. Journal of Informetrics, 11(1), 80-87.