La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Séminaire Lirdhist 11janvier 1/59 Thierry Lafouge Université Claude Bernard Lyon1 Laboratoire URSIDOC

Présentations similaires


Présentation au sujet: "Séminaire Lirdhist 11janvier 1/59 Thierry Lafouge Université Claude Bernard Lyon1 Laboratoire URSIDOC"— Transcription de la présentation:

1 Séminaire Lirdhist 11janvier 1/59 Thierry Lafouge Université Claude Bernard Lyon1 Laboratoire URSIDOC

2 Séminaire Lirdhist 11janvier 2/59 Applications des lois infométriques en science de linformation Dualité,champ infométrique dusage et de production. Du bon usage des mathématiques en science de linformation

3 Séminaire Lirdhist 11janvier 3/59 Contexte ISI (1955) Scientométrie (1970) Bibliométrie (1969) Infométrie (1980) X métrie

4 Séminaire Lirdhist 11janvier 4/59 Domaines de recherche Infométrie mathématique –Modèles de circulation des documents –Distribution Théorie de linformation (TMC :Shannon) Scientométrie: usage des périodiques scientifiques Webométrie : structuration de corpus sur le web

5 Séminaire Lirdhist 11janvier 5/59 Infométrie mathématique Régularités statistiques observées Lois puissances (Inverse power law) Usages: circulation des documents

6 Séminaire Lirdhist 11janvier 6/59 Régularités statistiques observées Sources items –Chercheurs produisent des articles(Lotka) –Revues éditent des articles (Bradford) –Mots produisent des occurrences (Zipf) –Ouvrages produisent des emprunts –Articles produisent des commandes

7 Séminaire Lirdhist 11janvier 7/59 Régularités statistiques observées

8 Séminaire Lirdhist 11janvier 8/59 Régularités statistiques observées Bibliométrie distributionnelle –(fréquence - effectif)

9 Séminaire Lirdhist 11janvier 9/59 Régularités statistiques observées Loi de Lotka ( fréquence - effectif ) –En 1926 Lotka observe une régularité entre le nombre de publications dans un domaine scientifique et le nombre de ses membres.

10 Séminaire Lirdhist 11janvier 10/59

11 Séminaire Lirdhist 11janvier 11/59 Régularités statistiques observées Loi de Bradford ( rang-fréquences cumulées ) –En 1934 bradford pour résoudre le problème du « chaos documentaire »de la littérature scientifique observe une régularité de la répartition des articles dans les journaux selon leur aptitude à représenter un domaine scientifique.

12 Séminaire Lirdhist 11janvier 12/59

13 Séminaire Lirdhist 11janvier 13/59 Régularités statistiques observées Loi de Zipf ( rang fréquence ) –En 1935 Zipf analyse des corpus de données textuelles et observe des régularités sur la fréquence des mots.

14 Séminaire Lirdhist 11janvier 14/59

15 Séminaire Lirdhist 11janvier 15/59 Lois Puissances

16 Séminaire Lirdhist 11janvier 16/59 Lois puissances Caractéristiques –Décroissance avec une longue queue –Distributions asymétriques Concentration forte dun coté, large dispersion de lautre Caractéristique du champ social –Il existe un petit nombre de chercheurs qui publient un grand nombre darticles. –Présentes dans beaucoup dautres domaines épidémiologie

17 Séminaire Lirdhist 11janvier 17/59 Lois puissances Propriétés mathématiques –Pas de moments dordre n < a –Invariance déchelle –Lien avec la théorie de linformation (Loi du moindre effort :fonction deffort)

18 Séminaire Lirdhist 11janvier 18/59 Lois puissances Robustesse de la loi de lotka –Probabilité de publier n articles sachant que les chercheurs publient x articles en moyenne – Poisson

19 Séminaire Lirdhist 11janvier 19/59 Lois puissances Modèle Probabiliste –Loi de Pareto

20 Séminaire Lirdhist 11janvier 20/59 Lois puissances Modèle probabiliste –Modèle de lUrne de Polya –Le succès engendre le succès –Le résultat de Price de 1976 Loi des avantages cumulés Comportement asymptotique = loi puissance

21 Séminaire Lirdhist 11janvier 21/59 Une autre approche Quelques questions –Lien entre comportement social et description statistique ? –Échec = Non évènement –Prendre en compte le paramètre « No Use » –Processus discret / continu

22 Séminaire Lirdhist 11janvier 22/59 Usages Deux caractéristiques –Croissance de la quantité dinformation Mesure : augmentation de la littérature scientifique –Obsolescence de linformation Mesure : taux de citation dun article –La demi vie de citation dune revue(indicateur ISI) Mesure : % du fonds actif

23 Séminaire Lirdhist 11janvier 23/59 Usages circulation des documents Exemples –Circulation des ouvrages dans une bibliothèque –Commandes des articles chez un fournisseur de documents –Téléchargements de documents

24 Séminaire Lirdhist 11janvier 24/59 Usages paramètres de circulation des documents Corpus Temps –Durée dobservation –Fréquence dobservation Prise en compte des « No use » F i : i =0,1,2……..imax, nombre d items demandés i fois

25 Séminaire Lirdhist 11janvier 25/59 Emprunts livres : Bibliothèque Bordeaux Collection Payot Science 1984 Fréquence Emprunts Effectif Ouvrages >46 Emprunts 134 Ouvrages 408

26 Séminaire Lirdhist 11janvier 26/59 Commandes articles-Inist Parfums cosmétique Corps gras 1985 Fréquence Commande Effectif Articles Commandes 884 Articles 799

27 Séminaire Lirdhist 11janvier 27/59 Usage / Production dualité

28 Séminaire Lirdhist 11janvier 28/59 CommandesUsagersRevues Plus de Total Tableau - 2 – Commandes des revues à lInist durant la première semaine de janvier 1997

29 Séminaire Lirdhist 11janvier 29/59

30 Séminaire Lirdhist 11janvier 30/59

31 Séminaire Lirdhist 11janvier 31/59 Usages : modèle mathématique Modèle mathématique probabiliste – x t nombre de circulations pendant la période [o t] X t processus connu pour un paramètre

32 Séminaire Lirdhist 11janvier 32/59 Usages : modèle mathématique Lois de probabilité discrète –P : Processus Poissonien de taux / f fonction gamma ->Loi Binomiale négative Loi géométrique

33 Séminaire Lirdhist 11janvier 33/59 Emprûnts livres – Bibliothèque Bordeaux Collection Payot Science 1984 Ajustement par la moi binomiale négative EmpruntsOuv-ObservésOuv-Attendus , , ,42 386,97 413,00 551,35 total408

34 Séminaire Lirdhist 11janvier 34/59 Commandes Articles / Parfums cosmétique 1985 Fonction Puissance

35 Séminaire Lirdhist 11janvier 35/59 Usages commandes Volumes / Parfums cosmétique 1985 Fonction Puissance

36 Séminaire Lirdhist 11janvier 36/59 Usage : IPP ordre 2 Sources : revues/articles

37 Séminaire Lirdhist 11janvier 37/59 Usages : nombre darticles revue- JCR /1999 ArticlesRevues [1 50[239 [50 150[91 [ [41 [ [33 [ [15 [ [17 [ [8 >40027 Somme471

38 Séminaire Lirdhist 11janvier 38/59 Usages : nombre darticles produits revue- JCR /1999

39 Séminaire Lirdhist 11janvier 39/59 Usage champ infométrique

40 Séminaire Lirdhist 11janvier 40/59 Usage champ infométrique Analyse de la distribution de la demande –Les articles demandés (sources primaires) –Comptage au niveau des volumes (sources secondaires)

41 Séminaire Lirdhist 11janvier 41/59 Commandes articles-Inist Parfums cosmétique Corps gras 1985 Fréquence Commande Nombre Articles Nombre Volumes Nombre- Volumes >762 Commandes items

42 Séminaire Lirdhist 11janvier 42/59 USAGE modèle mathématique X (i) = probabilité pour quun volume soit demandé i fois A(i) = probabilité pour quun article soit demandé i fois Y( j) = probabilité pour quun volume ait j articles p o = probabilité pour quun article ne soit pas demandé G j (i) = probabilité pour quun volume ayant j articles soit demandé i fois

43 Séminaire Lirdhist 11janvier 43/59 USAGE utilisation dun modèle Approche positiviste –Ajuster une distribution observée par une distribution théorique Une autre approche

44 Séminaire Lirdhist 11janvier 44/59 Approche positiviste Ajustement dune distribution statistique Ajuster : pourquoi ? –Vérifier une loi –Modèle explicatif raisonnable Ajuster : intérêt –Analyse prévisionnelle –Création dindicateurs Ajuster : comment ?

45 Séminaire Lirdhist 11janvier 45/59 Commandes des Revues en chimie en 1985 Inist Génie chimique43 titres Appliqués :23 Théoriques:22 Polymères51 titres Appliqués: 22 Théoriques 29 Matériaux construction22 titres Peintures et Vernis10 titres Bois et Papier 6 titres Parfums,cosmétiques13 titres

46 Séminaire Lirdhist 11janvier 46/59 Questions posées Revues appliquées –Un article leader Cest moins vrai pour les revues fondamentales -> Créer des indicateurs

47 Séminaire Lirdhist 11janvier 47/59 Réponses Indicateur : Indicateur

48 Séminaire Lirdhist 11janvier 48/59 Réponses Ajuster la courbe de distribution des volumes / connaissant la distribution des articles. –Proportion darticles non demandés dans les volumes demandés –Répartition des articles dans les volumes Modèles dajustement

49 Séminaire Lirdhist 11janvier 49/59 Ajustement Parfums cosmétique Corps gras 1985 CommandesVolumes observés Volumes attendus 171,1%72,9% 213%19,2% 36,9%6,1% 43,9%1,3% 52,8%0,6% >62,2%0,2% Indicateur P o = 0.811m= 1,4

50 Séminaire Lirdhist 11janvier 50/59 Ajustement Indicateurs DomaineM1M2M3 x Bois Papier1,952,61,2 0,69 Peinture Verni2,3531,4 0,45 Matériaux con.2,3531,4 0,78 Poly. Appl.2,431,6 0,69 Parfuns Cos.2,43,21,4 0,60 Genie App.2,43,31,6 0,69 Genie Thé2,631,6 0,80 Poly Thé2,63,21,6 0,93

51 Séminaire Lirdhist 11janvier 51/59 Ajustement-Indicateurs DomaineCommandesNombre articles Nombre volumes Indice(3)Indice(2) Articles ,36 2,81,4 Articles ,63 3,31,8

52 Séminaire Lirdhist 11janvier 52/59 Questions posées Forme de la distribution de contenu Sens de la distribution de contenu Sens des conditions limites Pourquoi les distributions dusage sajustent suivant des lois particulières? –Loi binomiale négative, loi géométrique

53 Séminaire Lirdhist 11janvier 53/59 Graphe –5 Distributions de contenu des volumes des revues Scientometrics et JIS

54 Séminaire Lirdhist 11janvier 54/59 USAGE:une autre appoche Hypothèses Distribution dusage : Gj – G j loi binomiale de paramètre j et p o – Gj loi binomiale négative de paramètre j et p o Distribution de contenu :Yj –Poisson –Géométrique –Binomiale négative

55 Séminaire Lirdhist 11janvier 55/59 USAGE:approhe mathématique Condition limites Passage à la limite –Croissance et obsolescence de linformation

56 Séminaire Lirdhist 11janvier 56/59 USAGE:modèle mathématique Résultats Distribution Gj Distribution contenu Y Distribution dusage lim(X) BinomialPoisson Géométrique Négative binomiale Poisson M Géométrique M Neg. Bino M Négative binomiale Binomial Poisson Géométrique Négative binomiale Poisson M Géométrique M Neg. Bino M

57 Séminaire Lirdhist 11janvier 57/59 USAGE:une autre appoche interprétation des conditions limites N périodiques [0T] –Y: nombre articles produits [o T] – X(dt):nombre darticles commandés au moins 1fois [T T+dt]

58 Séminaire Lirdhist 11janvier 58/59 Quelques références bibliographiques Lois de l'information (Articles fondateurs) Lotka A. J., 1926 The frequency distribution of scientific productivity Journal of the Washington Academy of Sciences, 16 p , Bradford S. C., 1934 Sources of information on specific subjects. S. C. Bradford Engineering p , 26 janvier Zipf, G. K., 1935 The form and behavior of words The psycho-biology of language Boston : Houghton, 1935 p Price D. S., 1976 A general theory of bibliometric and other cumulative advantage process. Journal of the American Society for Information Science., Vol 27, N°5, 1976, p

59 Séminaire Lirdhist 11janvier 59/59 Quelques références bibliographiques (Travaux personnels sur la circulation des documents) Lafouge, T., Lainé-Cruzel S, 1997 A new explanation of the geometric law in the case of library circulation data. Information Processing and Management, Vol 33, No 4, p , Lafouge, T., 1998 Mathématiques du document et de linformation, Bibliométrie distributionnelle. Mémoire dhabilitation. Lafouge, T., Guinet E., 1999 A new explanation of the negative binomial law and the Poisson law with regard to library circulation data. Journal of Information Science, 25(1), p.89-93, 1999 Lafouge T., Boukacem B Application des lois infométriques en Science de lInformation. Dualité, champ infométrique dusage et de production. ISDM N°17


Télécharger ppt "Séminaire Lirdhist 11janvier 1/59 Thierry Lafouge Université Claude Bernard Lyon1 Laboratoire URSIDOC"

Présentations similaires


Annonces Google