La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Séminaire Lirdhist 11janvier

Présentations similaires


Présentation au sujet: "Séminaire Lirdhist 11janvier"— Transcription de la présentation:

1 Séminaire Lirdhist 11janvier
Thierry Lafouge Université Claude Bernard Lyon1 Laboratoire URSIDOC Séminaire Lirdhist 11janvier

2 Applications des lois infométriques en science de l’information
Dualité,champ infométrique d’usage et de production. Du bon usage des mathématiques en science de l’information Séminaire Lirdhist 11janvier

3 Séminaire Lirdhist 11janvier
Contexte ISI (1955) Scientométrie (1970) Bibliométrie (1969) Infométrie (1980) X métrie Séminaire Lirdhist 11janvier

4 Séminaire Lirdhist 11janvier
Domaines de recherche Infométrie mathématique Modèles de circulation des documents Distribution<->Théorie de l’information(TMC :Shannon) Scientométrie: usage des périodiques scientifiques Webométrie : structuration de corpus sur le web Séminaire Lirdhist 11janvier

5 Infométrie mathématique
Régularités statistiques observées Lois puissances (Inverse power law) Usages: circulation des documents Séminaire Lirdhist 11janvier

6 Régularités statistiques observées
Sources items Chercheurs produisent des articles(Lotka) Revues éditent des articles (Bradford) Mots produisent des occurrences (Zipf) Ouvrages produisent des emprunts Articles produisent des commandes Séminaire Lirdhist 11janvier

7 Régularités statistiques observées
Séminaire Lirdhist 11janvier

8 Régularités statistiques observées
Bibliométrie distributionnelle (fréquence - effectif) Séminaire Lirdhist 11janvier

9 Régularités statistiques observées
Loi de Lotka (fréquence - effectif) En 1926 Lotka observe une régularité entre le nombre de publications dans un domaine scientifique et le nombre de ses membres. Séminaire Lirdhist 11janvier

10 Séminaire Lirdhist 11janvier

11 Régularités statistiques observées
Loi de Bradford (rang-fréquences cumulées) En 1934 bradford pour résoudre le problème du « chaos documentaire »de la littérature scientifique observe une régularité de la répartition des articles dans les journaux selon leur aptitude à représenter un domaine scientifique. Séminaire Lirdhist 11janvier

12 Séminaire Lirdhist 11janvier

13 Régularités statistiques observées
Loi de Zipf (rang fréquence) En 1935 Zipf analyse des corpus de données textuelles et observe des régularités sur la fréquence des mots. Séminaire Lirdhist 11janvier

14 Séminaire Lirdhist 11janvier

15 Séminaire Lirdhist 11janvier
Lois Puissances Séminaire Lirdhist 11janvier

16 Séminaire Lirdhist 11janvier
Lois puissances Caractéristiques Décroissance avec une longue queue Distributions asymétriques Concentration forte d’un coté, large dispersion de l’autre Caractéristique du champ social Il existe un petit nombre de chercheurs qui publient un grand nombre d’articles. Présentes dans beaucoup d’autres domaines épidémiologie Séminaire Lirdhist 11janvier

17 Séminaire Lirdhist 11janvier
Lois puissances Propriétés mathématiques Pas de moments d’ordre n < a Invariance d’échelle Lien avec la théorie de l’information (Loi du moindre effort :fonction d’effort) Séminaire Lirdhist 11janvier

18 Séminaire Lirdhist 11janvier
Lois puissances Robustesse de la loi de lotka Probabilité de publier n articles sachant que les chercheurs publient x articles en moyenne Poisson Séminaire Lirdhist 11janvier

19 Séminaire Lirdhist 11janvier
Lois puissances Modèle Probabiliste Loi de Pareto Séminaire Lirdhist 11janvier

20 Séminaire Lirdhist 11janvier
Lois puissances Modèle probabiliste Modèle de l’Urne de Polya Le succès engendre le succès Le résultat de Price de 1976 Loi des avantages cumulés Comportement asymptotique = loi puissance Séminaire Lirdhist 11janvier

21 Séminaire Lirdhist 11janvier
Une autre approche Quelques questions Lien entre comportement social et description statistique ? Échec = Non évènement Prendre en compte le paramètre « No Use » Processus discret / continu Séminaire Lirdhist 11janvier

22 Séminaire Lirdhist 11janvier
Usages Deux caractéristiques Croissance de la quantité d’information Mesure : augmentation de la littérature scientifique Obsolescence de l’information Mesure : taux de citation d’un article La demi vie de citation d’une revue(indicateur ISI) Mesure : % du fonds actif Séminaire Lirdhist 11janvier

23 Usages circulation des documents
Exemples Circulation des ouvrages dans une bibliothèque Commandes des articles chez un fournisseur de documents Téléchargements de documents Séminaire Lirdhist 11janvier

24 Usages paramètres de circulation des documents
Corpus Temps Durée d’observation Fréquence d’observation Prise en compte des « No use » Fi : i =0,1,2……..imax, nombre d’ items demandés i fois Séminaire Lirdhist 11janvier

25 Emprunts livres : Bibliothèque Bordeaux Collection Payot Science 1984
Fréquence Emprunts Effectif Ouvrages 328 1 51 2 15 3 8 >4 6 Emprunts 134 408 Séminaire Lirdhist 11janvier

26 Commandes articles-Inist Parfums cosmétique Corps gras 1985
Fréquence Commande Effectif Articles 1 734 2 49 3 13 4 5 Commandes 884 799 Séminaire Lirdhist 11janvier

27 Usage / Production dualité
Séminaire Lirdhist 11janvier

28 Séminaire Lirdhist 11janvier
Commandes Usagers Revues 1 220 344 2 142 859 3 100 375 4 70 248 5 50 141 6 48 105 7 42 92 8 34 56 9 25 46 10 27 37 11 16 35 12 24 13 14 17 20 15 18 19 Plus de 20 147 47 Total 1000 5595 Séminaire Lirdhist 11janvier Tableau - 2 – Commandes des revues à l’Inist durant la première semaine de janvier 1997

29 Séminaire Lirdhist 11janvier

30 Séminaire Lirdhist 11janvier

31 Usages : modèle mathématique
Modèle mathématique probabiliste xt nombre de circulations pendant la période [o t] Xt processus connu pour un paramètre L Séminaire Lirdhist 11janvier

32 Usages : modèle mathématique
Lois de probabilité discrète P : Processus Poissonien de taux L / f L fonction gamma -> Loi Binomiale négative Loi géométrique Séminaire Lirdhist 11janvier

33 Séminaire Lirdhist 11janvier
Emprûnts livres – Bibliothèque Bordeaux Collection Payot Science 1984 Ajustement par la moi binomiale négative Emprunts Ouv-Observés Ouv-Attendus 328 326,73 1 51 51,36 2 15 17,42 3 8 6,97 4 3,00 5 1,35 total 408 Séminaire Lirdhist 11janvier

34 Commandes Articles / Parfums cosmétique 1985 Fonction Puissance
Séminaire Lirdhist 11janvier

35 Usages commandes Volumes / Parfums cosmétique 1985 Fonction Puissance
Séminaire Lirdhist 11janvier

36 Séminaire Lirdhist 11janvier
Usage : IPP ordre 2 Sources : revues/articles Séminaire Lirdhist 11janvier

37 Usages : nombre d’articles revue- JCR /1999
Revues [1 50[ 239 [50 150[ 91 [ [ 41 [ [ 33 [ [ 15 [ [ 17 [ [ 8 >400 27 Somme 471 Séminaire Lirdhist 11janvier

38 Usages : nombre d’articles produits revue- JCR /1999
Séminaire Lirdhist 11janvier

39 Usage champ infométrique
Séminaire Lirdhist 11janvier

40 Usage champ infométrique
Analyse de la distribution de la demande Les articles demandés (sources primaires) Comptage au niveau des volumes (sources secondaires) Séminaire Lirdhist 11janvier

41 Commandes articles-Inist Parfums cosmétique Corps gras 1985
Fréquence Commande Nombre Articles Volumes Nombre-Volumes 1 734 382 394 2 49 70 73 3 13 37 38 4 21 18 5 15 11 6 >7 Commandes 884 799 items 537 Séminaire Lirdhist 11janvier

42 USAGE modèle mathématique
X (i) = probabilité pour qu’un volume soit demandé i fois A(i) = probabilité pour qu’un article soit demandé i fois Y( j) = probabilité pour qu’un volume ait j articles po = probabilité pour qu’un article ne soit pas demandé Gj(i) = probabilité pour qu’un volume ayant j articles soit demandé i fois Séminaire Lirdhist 11janvier

43 USAGE utilisation d’un modèle
Approche positiviste Ajuster une distribution observée par une distribution théorique Une autre approche Séminaire Lirdhist 11janvier

44 Approche positiviste Ajustement d’une distribution statistique
Ajuster : pourquoi ? Vérifier une loi Modèle explicatif raisonnable Ajuster : intérêt Analyse prévisionnelle Création d’indicateurs Ajuster : comment ? Séminaire Lirdhist 11janvier

45 Commandes des Revues en chimie en 1985 Inist
Génie chimique 43 titres Appliqués : 23 Théoriques: 22 Polymères titres Appliqués: 22 Théoriques 29 Matériaux construction 22 titres Peintures et Vernis 10 titres Bois et Papier titres Parfums,cosmétiques 13 titres Séminaire Lirdhist 11janvier

46 Séminaire Lirdhist 11janvier
Questions posées Revues appliquées Un article leader C’est moins vrai pour les revues fondamentales -> Créer des indicateurs Séminaire Lirdhist 11janvier

47 Séminaire Lirdhist 11janvier
Réponses Indicateur : Indicateur Séminaire Lirdhist 11janvier

48 Séminaire Lirdhist 11janvier
Réponses Ajuster la courbe de distribution des volumes / connaissant la distribution des articles . Proportion d’articles non demandés dans les volumes demandés Répartition des articles dans les volumes Modèles d’ajustement Séminaire Lirdhist 11janvier

49 Ajustement Parfums cosmétique Corps gras 1985
Commandes Volumes observés Volumes attendus 1 71,1% 72,9% 2 13% 19,2% 3 6,9% 6,1% 4 3,9% 1,3% 5 2,8% 0,6% >6 2,2% 0,2% Indicateur Po= 0.811 m= 1,4 Séminaire Lirdhist 11janvier

50 Ajustement Indicateurs
Domaine M1 M2 M3 x Bois Papier 1,95 2,6 1,2 0,69 Peinture Verni 2,35 3 1,4 0,45 Matériaux con. 1,4 0,78 Poly. Appl. 2,4 1,6 0,69 Parfuns Cos. 3,2 1,4 0,60 Genie App. 3,3 Genie Thé 1,6 0,80 Poly Thé 1,6 0,93 Séminaire Lirdhist 11janvier

51 Ajustement-Indicateurs
Domaine Commandes Nombre articles Nombre volumes Indice(3) Indice(2) Articles 50-79 3059 2947 ,36 2,8 1,4 80-85 4213 3763 ,63 3,3 1,8 Séminaire Lirdhist 11janvier

52 Séminaire Lirdhist 11janvier
Questions posées Forme de la distribution de contenu Sens de la distribution de contenu Sens des conditions limites Pourquoi les distributions d’usage s’ajustent suivant des lois particulières? Loi binomiale négative, loi géométrique Séminaire Lirdhist 11janvier

53 Séminaire Lirdhist 11janvier
Graphe –5 Distributions de contenu des volumes des revues Scientometrics et JIS Séminaire Lirdhist 11janvier

54 USAGE:une autre appoche Hypothèses
Distribution d’usage : Gj Gj loi binomiale de paramètre j et po Gj loi binomiale négative de paramètre j et po Distribution de contenu :Yj Poisson Géométrique Binomiale négative Séminaire Lirdhist 11janvier

55 USAGE:approhe mathématique Condition limites
Passage à la limite Croissance et obsolescence de l’information Séminaire Lirdhist 11janvier

56 USAGE:modèle mathématique Résultats
Distribution Gj Distribution contenu Y Distribution d’usage lim(X) Binomial Poisson Géométrique Négative binomiale Poisson M Géométrique M Neg. Bino M Poisson M Séminaire Lirdhist 11janvier

57 USAGE:une autre appoche interprétation des conditions limites
N périodiques [0 T] Y: nombre articles produits [o T] X(dt):nombre d’articles commandés au moins 1fois [T T+dt] Séminaire Lirdhist 11janvier

58 Séminaire Lirdhist 11janvier
Quelques références bibliographiques Lois de l'information (Articles fondateurs) Lotka A. J., 1926 The frequency distribution of scientific productivity Journal of the Washington Academy of Sciences, 16 p , 1960. Bradford S. C., 1934 Sources of information on specific subjects. S. C. Bradford Engineering p , 26 janvier 1934. Zipf, G. K., 1935 The form and behavior of words The psycho-biology of language Boston : Houghton, 1935 p Price D. S., 1976 A general theory of bibliometric and other cumulative advantage process . Journal of the American Society for Information Science., Vol 27, N°5, 1976, p Séminaire Lirdhist 11janvier

59 Séminaire Lirdhist 11janvier
Quelques références bibliographiques (Travaux personnels sur la circulation des documents) Lafouge, T., Lainé-Cruzel S, 1997 A new explanation of the geometric law in the case of library circulation data. Information Processing and Management, Vol 33, No 4, p , 1997. Lafouge, T., 1998 Mathématiques du document et de l’information, Bibliométrie distributionnelle. Mémoire d’habilitation. Lafouge, T., Guinet E., 1999 A new explanation of the negative binomial law and the Poisson law with regard to library circulation data. Journal of Information Science, 25(1), p.89-93, 1999 Lafouge T., Boukacem B. 2004 Application des lois infométriques en Science de l’Information. Dualité, champ infométrique d’usage et de production. ISDM N°17 Séminaire Lirdhist 11janvier


Télécharger ppt "Séminaire Lirdhist 11janvier"

Présentations similaires


Annonces Google