Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
Séminaire Lirdhist 11janvier
Thierry Lafouge Université Claude Bernard Lyon1 Laboratoire URSIDOC Séminaire Lirdhist 11janvier
2
Applications des lois infométriques en science de l’information
Dualité,champ infométrique d’usage et de production. Du bon usage des mathématiques en science de l’information Séminaire Lirdhist 11janvier
3
Séminaire Lirdhist 11janvier
Contexte ISI (1955) Scientométrie (1970) Bibliométrie (1969) Infométrie (1980) X métrie Séminaire Lirdhist 11janvier
4
Séminaire Lirdhist 11janvier
Domaines de recherche Infométrie mathématique Modèles de circulation des documents Distribution<->Théorie de l’information(TMC :Shannon) Scientométrie: usage des périodiques scientifiques Webométrie : structuration de corpus sur le web Séminaire Lirdhist 11janvier
5
Infométrie mathématique
Régularités statistiques observées Lois puissances (Inverse power law) Usages: circulation des documents Séminaire Lirdhist 11janvier
6
Régularités statistiques observées
Sources items Chercheurs produisent des articles(Lotka) Revues éditent des articles (Bradford) Mots produisent des occurrences (Zipf) Ouvrages produisent des emprunts Articles produisent des commandes Séminaire Lirdhist 11janvier
7
Régularités statistiques observées
Séminaire Lirdhist 11janvier
8
Régularités statistiques observées
Bibliométrie distributionnelle (fréquence - effectif) Séminaire Lirdhist 11janvier
9
Régularités statistiques observées
Loi de Lotka (fréquence - effectif) En 1926 Lotka observe une régularité entre le nombre de publications dans un domaine scientifique et le nombre de ses membres. Séminaire Lirdhist 11janvier
10
Séminaire Lirdhist 11janvier
11
Régularités statistiques observées
Loi de Bradford (rang-fréquences cumulées) En 1934 bradford pour résoudre le problème du « chaos documentaire »de la littérature scientifique observe une régularité de la répartition des articles dans les journaux selon leur aptitude à représenter un domaine scientifique. Séminaire Lirdhist 11janvier
12
Séminaire Lirdhist 11janvier
13
Régularités statistiques observées
Loi de Zipf (rang fréquence) En 1935 Zipf analyse des corpus de données textuelles et observe des régularités sur la fréquence des mots. Séminaire Lirdhist 11janvier
14
Séminaire Lirdhist 11janvier
15
Séminaire Lirdhist 11janvier
Lois Puissances Séminaire Lirdhist 11janvier
16
Séminaire Lirdhist 11janvier
Lois puissances Caractéristiques Décroissance avec une longue queue Distributions asymétriques Concentration forte d’un coté, large dispersion de l’autre Caractéristique du champ social Il existe un petit nombre de chercheurs qui publient un grand nombre d’articles. Présentes dans beaucoup d’autres domaines épidémiologie Séminaire Lirdhist 11janvier
17
Séminaire Lirdhist 11janvier
Lois puissances Propriétés mathématiques Pas de moments d’ordre n < a Invariance d’échelle Lien avec la théorie de l’information (Loi du moindre effort :fonction d’effort) Séminaire Lirdhist 11janvier
18
Séminaire Lirdhist 11janvier
Lois puissances Robustesse de la loi de lotka Probabilité de publier n articles sachant que les chercheurs publient x articles en moyenne Poisson Séminaire Lirdhist 11janvier
19
Séminaire Lirdhist 11janvier
Lois puissances Modèle Probabiliste Loi de Pareto Séminaire Lirdhist 11janvier
20
Séminaire Lirdhist 11janvier
Lois puissances Modèle probabiliste Modèle de l’Urne de Polya Le succès engendre le succès Le résultat de Price de 1976 Loi des avantages cumulés Comportement asymptotique = loi puissance Séminaire Lirdhist 11janvier
21
Séminaire Lirdhist 11janvier
Une autre approche Quelques questions Lien entre comportement social et description statistique ? Échec = Non évènement Prendre en compte le paramètre « No Use » Processus discret / continu Séminaire Lirdhist 11janvier
22
Séminaire Lirdhist 11janvier
Usages Deux caractéristiques Croissance de la quantité d’information Mesure : augmentation de la littérature scientifique Obsolescence de l’information Mesure : taux de citation d’un article La demi vie de citation d’une revue(indicateur ISI) Mesure : % du fonds actif Séminaire Lirdhist 11janvier
23
Usages circulation des documents
Exemples Circulation des ouvrages dans une bibliothèque Commandes des articles chez un fournisseur de documents Téléchargements de documents Séminaire Lirdhist 11janvier
24
Usages paramètres de circulation des documents
Corpus Temps Durée d’observation Fréquence d’observation Prise en compte des « No use » Fi : i =0,1,2……..imax, nombre d’ items demandés i fois Séminaire Lirdhist 11janvier
25
Emprunts livres : Bibliothèque Bordeaux Collection Payot Science 1984
Fréquence Emprunts Effectif Ouvrages 328 1 51 2 15 3 8 >4 6 Emprunts 134 408 Séminaire Lirdhist 11janvier
26
Commandes articles-Inist Parfums cosmétique Corps gras 1985
Fréquence Commande Effectif Articles 1 734 2 49 3 13 4 5 Commandes 884 799 Séminaire Lirdhist 11janvier
27
Usage / Production dualité
Séminaire Lirdhist 11janvier
28
Séminaire Lirdhist 11janvier
Commandes Usagers Revues 1 220 344 2 142 859 3 100 375 4 70 248 5 50 141 6 48 105 7 42 92 8 34 56 9 25 46 10 27 37 11 16 35 12 24 13 14 17 20 15 18 19 Plus de 20 147 47 Total 1000 5595 Séminaire Lirdhist 11janvier Tableau - 2 – Commandes des revues à l’Inist durant la première semaine de janvier 1997
29
Séminaire Lirdhist 11janvier
30
Séminaire Lirdhist 11janvier
31
Usages : modèle mathématique
Modèle mathématique probabiliste xt nombre de circulations pendant la période [o t] Xt processus connu pour un paramètre L Séminaire Lirdhist 11janvier
32
Usages : modèle mathématique
Lois de probabilité discrète P : Processus Poissonien de taux L / f L fonction gamma -> Loi Binomiale négative Loi géométrique Séminaire Lirdhist 11janvier
33
Séminaire Lirdhist 11janvier
Emprûnts livres – Bibliothèque Bordeaux Collection Payot Science 1984 Ajustement par la moi binomiale négative Emprunts Ouv-Observés Ouv-Attendus 328 326,73 1 51 51,36 2 15 17,42 3 8 6,97 4 3,00 5 1,35 total 408 Séminaire Lirdhist 11janvier
34
Commandes Articles / Parfums cosmétique 1985 Fonction Puissance
Séminaire Lirdhist 11janvier
35
Usages commandes Volumes / Parfums cosmétique 1985 Fonction Puissance
Séminaire Lirdhist 11janvier
36
Séminaire Lirdhist 11janvier
Usage : IPP ordre 2 Sources : revues/articles Séminaire Lirdhist 11janvier
37
Usages : nombre d’articles revue- JCR /1999
Revues [1 50[ 239 [50 150[ 91 [ [ 41 [ [ 33 [ [ 15 [ [ 17 [ [ 8 >400 27 Somme 471 Séminaire Lirdhist 11janvier
38
Usages : nombre d’articles produits revue- JCR /1999
Séminaire Lirdhist 11janvier
39
Usage champ infométrique
Séminaire Lirdhist 11janvier
40
Usage champ infométrique
Analyse de la distribution de la demande Les articles demandés (sources primaires) Comptage au niveau des volumes (sources secondaires) Séminaire Lirdhist 11janvier
41
Commandes articles-Inist Parfums cosmétique Corps gras 1985
Fréquence Commande Nombre Articles Volumes Nombre-Volumes 1 734 382 394 2 49 70 73 3 13 37 38 4 21 18 5 15 11 6 >7 Commandes 884 799 items 537 Séminaire Lirdhist 11janvier
42
USAGE modèle mathématique
X (i) = probabilité pour qu’un volume soit demandé i fois A(i) = probabilité pour qu’un article soit demandé i fois Y( j) = probabilité pour qu’un volume ait j articles po = probabilité pour qu’un article ne soit pas demandé Gj(i) = probabilité pour qu’un volume ayant j articles soit demandé i fois Séminaire Lirdhist 11janvier
43
USAGE utilisation d’un modèle
Approche positiviste Ajuster une distribution observée par une distribution théorique Une autre approche Séminaire Lirdhist 11janvier
44
Approche positiviste Ajustement d’une distribution statistique
Ajuster : pourquoi ? Vérifier une loi Modèle explicatif raisonnable Ajuster : intérêt Analyse prévisionnelle Création d’indicateurs Ajuster : comment ? Séminaire Lirdhist 11janvier
45
Commandes des Revues en chimie en 1985 Inist
Génie chimique 43 titres Appliqués : 23 Théoriques: 22 Polymères titres Appliqués: 22 Théoriques 29 Matériaux construction 22 titres Peintures et Vernis 10 titres Bois et Papier titres Parfums,cosmétiques 13 titres Séminaire Lirdhist 11janvier
46
Séminaire Lirdhist 11janvier
Questions posées Revues appliquées Un article leader C’est moins vrai pour les revues fondamentales -> Créer des indicateurs Séminaire Lirdhist 11janvier
47
Séminaire Lirdhist 11janvier
Réponses Indicateur : Indicateur Séminaire Lirdhist 11janvier
48
Séminaire Lirdhist 11janvier
Réponses Ajuster la courbe de distribution des volumes / connaissant la distribution des articles . Proportion d’articles non demandés dans les volumes demandés Répartition des articles dans les volumes Modèles d’ajustement Séminaire Lirdhist 11janvier
49
Ajustement Parfums cosmétique Corps gras 1985
Commandes Volumes observés Volumes attendus 1 71,1% 72,9% 2 13% 19,2% 3 6,9% 6,1% 4 3,9% 1,3% 5 2,8% 0,6% >6 2,2% 0,2% Indicateur Po= 0.811 m= 1,4 Séminaire Lirdhist 11janvier
50
Ajustement Indicateurs
Domaine M1 M2 M3 x Bois Papier 1,95 2,6 1,2 0,69 Peinture Verni 2,35 3 1,4 0,45 Matériaux con. 1,4 0,78 Poly. Appl. 2,4 1,6 0,69 Parfuns Cos. 3,2 1,4 0,60 Genie App. 3,3 Genie Thé 1,6 0,80 Poly Thé 1,6 0,93 Séminaire Lirdhist 11janvier
51
Ajustement-Indicateurs
Domaine Commandes Nombre articles Nombre volumes Indice(3) Indice(2) Articles 50-79 3059 2947 ,36 2,8 1,4 80-85 4213 3763 ,63 3,3 1,8 Séminaire Lirdhist 11janvier
52
Séminaire Lirdhist 11janvier
Questions posées Forme de la distribution de contenu Sens de la distribution de contenu Sens des conditions limites Pourquoi les distributions d’usage s’ajustent suivant des lois particulières? Loi binomiale négative, loi géométrique Séminaire Lirdhist 11janvier
53
Séminaire Lirdhist 11janvier
Graphe –5 Distributions de contenu des volumes des revues Scientometrics et JIS Séminaire Lirdhist 11janvier
54
USAGE:une autre appoche Hypothèses
Distribution d’usage : Gj Gj loi binomiale de paramètre j et po Gj loi binomiale négative de paramètre j et po Distribution de contenu :Yj Poisson Géométrique Binomiale négative Séminaire Lirdhist 11janvier
55
USAGE:approhe mathématique Condition limites
Passage à la limite Croissance et obsolescence de l’information Séminaire Lirdhist 11janvier
56
USAGE:modèle mathématique Résultats
Distribution Gj Distribution contenu Y Distribution d’usage lim(X) Binomial Poisson Géométrique Négative binomiale Poisson M Géométrique M Neg. Bino M Poisson M Séminaire Lirdhist 11janvier
57
USAGE:une autre appoche interprétation des conditions limites
N périodiques [0 T] Y: nombre articles produits [o T] X(dt):nombre d’articles commandés au moins 1fois [T T+dt] Séminaire Lirdhist 11janvier
58
Séminaire Lirdhist 11janvier
Quelques références bibliographiques Lois de l'information (Articles fondateurs) Lotka A. J., 1926 The frequency distribution of scientific productivity Journal of the Washington Academy of Sciences, 16 p , 1960. Bradford S. C., 1934 Sources of information on specific subjects. S. C. Bradford Engineering p , 26 janvier 1934. Zipf, G. K., 1935 The form and behavior of words The psycho-biology of language Boston : Houghton, 1935 p Price D. S., 1976 A general theory of bibliometric and other cumulative advantage process . Journal of the American Society for Information Science., Vol 27, N°5, 1976, p Séminaire Lirdhist 11janvier
59
Séminaire Lirdhist 11janvier
Quelques références bibliographiques (Travaux personnels sur la circulation des documents) Lafouge, T., Lainé-Cruzel S, 1997 A new explanation of the geometric law in the case of library circulation data. Information Processing and Management, Vol 33, No 4, p , 1997. Lafouge, T., 1998 Mathématiques du document et de l’information, Bibliométrie distributionnelle. Mémoire d’habilitation. Lafouge, T., Guinet E., 1999 A new explanation of the negative binomial law and the Poisson law with regard to library circulation data. Journal of Information Science, 25(1), p.89-93, 1999 Lafouge T., Boukacem B. 2004 Application des lois infométriques en Science de l’Information. Dualité, champ infométrique d’usage et de production. ISDM N°17 Séminaire Lirdhist 11janvier
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.