La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Réseaux sociaux: une analyse centrée sur l'individu

Présentations similaires


Présentation au sujet: "Réseaux sociaux: une analyse centrée sur l'individu"— Transcription de la présentation:

1 Réseaux sociaux: une analyse centrée sur l'individu
Alina STOICA Orange Labs & LIAFA

2 Laboratoire SENSE: Sociologie des usages
Etudes du comportement de l'utilisateur (du client): Approche "qualitative": entretiens, enquêtes qualitatives Approche "quantitative": études des traces d'usages Communications par téléphone mobile Utilisations des plateformes sociales en ligne (MySpace, Flickr, Twitter, développées par Orange etc.) Connaissance des clients: développement de services, offres adaptés, ciblage de clients etc. – p 2

3 Bases de données (1) Téléphonie mobile:
liste des communications entre les clients d'Orange en Belgique Numéros chiffrés => identifiants Toutes les communications (appels et SMS) impliquant un ou deux clients Un mois de communication Données sociodémographiques (âge et sexe) – p 3

4 Bases de données (2) Plateformes en lignes:
aspirations de profils à partir de quelques profils initiaux BFS Toutes les informations du profil Liens déclarés avant l'aspiration – p 4

5 Caractérisation des clients: analyse des usages
Téléphonie mobile: Nombre d'appels, durée, fréquence, nombre de SMS etc. Croiser avec les données sociodémographiques Plateformes en lignes: Nombre de commentaires, quantité de contenu publié etc. Croiser avec les autres informations du profil – p 5

6 Caractérisation des clients: analyse du réseau social
On modélise les relations observées entre des personnes par un graphe (réseau social) les nœuds: les individus les liens correspondent aux relations observées – p 6

7 Caractérisation des clients: approche centrée sur l'individu
Décrire comment chaque nœud (individu) est connecté dans le réseau Analyse de la structure locale du réseau, autour de chaque nœud Gros volumes de données  mesures avec petite complexité – p 7

8 La méthode proposée ego
Etape1: calcul du réseau égocentré d'un nœud (ego)  lister les triangles contenant ego Eg(ego) ego – p 8

9 Etape 2: énumération des patterns dans le réseau égocentré

10 Exemple 10 nœuds: 4 isolés 5 liens: 1 isolés 2 1 – p 10

11 Description des liens formés par ego (positions de ses voisins)
Après étape 2: description de la façon dont ego est connecté dans le réseau Etape 3: calcul des positions occupées par les contacts d'ego Plusieurs positions dans un pattern: – p 11

12 Etape 2: énumération des patterns dans le réseau égocentré
Etape 3: calcul des positions dans les patterns – p 12

13 Un autre exemple Etape1: calcul du réseau égocentré d'un nœud (ego)

14 On obtient une caractérisation de la façon dont ego est connecté au réseau
Et de la façon dont ses contacts se placent les uns par rapport aux autres. – p 14

15 Avantages Applicable à tout réseau Connaissance locale du réseau
Rapide Motifs caractéristiques Description de la structure locale Ego Les contacts d'ego (les liens d'ego) En gros, la méthode peut être appliquée à n'importe quel réseau: on a déjà commencé sur Twitter, réseau de brevets de Romain, réseau de Massimiliano Avantages: calculs rapides, bonne description de la structure locale, on a pas besoin de connaître tout le réseau, juste les contacts d'ego et les liens entre eux – p 15

16 Le réseau de téléphonie mobile Mobistar (Orange en Belgique)
Application Le réseau de téléphonie mobile Mobistar (Orange en Belgique)

17 La base de données Les communications (appels et SMS) des clients de Mobistar pendant octobre 2006 Un enregistrement: Les identifiants (anonymisés) des deux personnes L'heure La durée Le type (appel vocal ou SMS) Pour chaque jour, 10 millions communications avec plus de 3 millions clients – p 17

18 Le réseau social Les nœuds: les clients de Mobistar
Un lien entre deux nœuds: au moins une communication dans chaque sens 3 millions de nœuds 6 millions de liens On représente les communications par un réseau social On connecte deux nœuds qui représentent 2 personnes A et B s'il y a eu au moins un appel de A vers B et un appel de B vers A pendent le mois d'octobre 2006 – p 18

19 Patterns caractéristiques (1)
Un pattern est "caractéristique" si: Définition 1: son nombre d'occurrences dans les réseaux égocentrés est supérieur à un seuil donné – p 19

20 Patterns caractéristiques (2)
Un pattern est "caractéristique" si: Définition 2: le nombre de réseaux égocentrés le contenant est supérieur à un seuil donné – p 20

21 Patterns caractéristiques (3)
Un pattern est "caractéristique" si : Définition 3: son nb d'occurrences dans les réseaux égocentrés est supérieur au nb d'occurrences dans des réseaux générés aléatoirement Pour chaque réseau égocentré, plusieurs générations en utilisant Orbis [1] [1] P. Mahadevan, D. Krioukov, K. Fall and A. Vahdat, “Systematic topology analysis and generation using degree correlations,” SIGCOMM, 2006 – p 21

22 Positions des contacts d'ego
On calcule la probabilité d'apparition dans les différentes positions du contact qui a le plus grand nombre de communications avec ego, du contact suivant (beaucoup d'appel aussi mais un peu moins), du contact suivant (moins d'appel) et d'un autre contact qui parle pas très souvent avec ego. Les position rouges sont centrales Les bleues et vertes sont intermédiaires Les noires sont périphériques – p 22

23 Positions des contacts d'ego: la fréquence des appels
En moyenne, pour chaque motif: Le contact qui parle le plus souvent avec ego Les contacts suivants et Le contact qui parle peu avec ego On calcule la probabilité d'apparition dans les différentes positions du contact qui a le plus grand nombre de communications avec ego, du contact suivant (beaucoup d'appel aussi mais un peu moins), du contact suivant (moins d'appel) et d'un autre contact qui parle pas très souvent avec ego. – p 23

24 Positions des contacts d'ego: la fréquence des appels

25 Positions des contacts d'ego: la durée des appels
En moyenne, pour chaque motif: Le contact qui la plus grande fréquence d'appel Le contact qui la plus grande durée d'appel et Le contact qui parle peu avec ego Quand on a trouvé ce résultat on s'est dit que c'était assez logique D'ailleurs il y a une étude sociologique qui le montre – p 25

26 Commentaires sur les résultats
Licoppe C., Smoreda Z., 2005, “Are social networks technologically embedded? How networks are changing today with changes in communication technology,” Social Networks, vol. 27, no. 4, pp. 317–335 Deux registres de communication: Présence connectée Présence intermittente – p 26

27 Le réseau des artistes sur MySpace: Analyse de la popularité en ligne
Application Le réseau des artistes sur MySpace: Analyse de la popularité en ligne

28 L'artiste MySpace, entrepreneur de sa notoriété
Nb de visites de la page Nb de commentaires Nb d'amis "marketing de soi-même" – p 28 presentation title 28

29 Construction des données
Aspiration BFS à partir de 7 profils initiaux Nb. total de profiles (artist ou fan) 21 153 Nb. de profiles artist 13 936 Nb. total de liens Nb. de liens entre artistes 83 201 Réciprocité des liens 40.1% Artists avec label “Major” 3 422 Artists avec label “Indie” 7 069 Artists sans label 3 445 – p 29 presentation title 29

30 Clustering des artistes à partir de la popularité en ligne
On caractérise chaque artiste par un vecteur: Nb. de visites de sa page audience Nb. de commentaires laissés sur sa page Nb. de gens l'avoir déclaré comme meilleur ami (autorité) Nb. d'artistes l'avoir déclaré comme meilleur ami (autorité artistique) Réciprocité de ses liens Label: "Major" (=3), "Indie" (=2) ou "Other" (=1) On groupe les individus avec Kohonen SOM – p 30

31 Résultat SOM – p 31

32 Clustering des cellules
k-means clustering + expectation maximization algorithm 5 clusters – p 32

33 Description des clusters
Vert (3): superstars, avec le plus de notoriété, à la fois influents et autoritaires; élites MySpace, avec une forte stratégie marketing online, populaires dans les medias traditionnels Bleu foncé (2): artistes influens avec une notoriété plus faible que les superstars mais avec une stratégie marketing efficace; souvent trendy, avant-garde music. Orange (5): artistes dynamiques d'un point de vue social, avec audience faible; groupes d'artistes non-professionnels bien intégrés dans des scènes locale Bleu (1): artistes avec une audience moyenne, faible autorité et peu de liens réciproques; sans stratégie MySpace importante Rouge (4): artistes anonymes avec peu d'audience et sans pratique sociale active Nord Ouest Est Réciprocité Audience + Autorité Sud – p 33 presentation title 33

34 A degré égal – p 34

35 A nombre de liens égal – p 35

36 Caractérisation des liens
En utilisant les positions dans les patterns: Clusters 1 et 4: liens sortants vers 3 Cluster 2: liens réciproques avec lui-même Cluster 3: liens réciproque avec lui-même dans les positions centrales et intermédiaires liens entrants avec 4 dans les positions périphériques Cluster 5: liens réciproques avec 2 et 5 dans les positions centrales liens sortant vers 3 dans les autres positions – p 36

37 On peut envisager de Faire des catégories de nœuds pour
grouper les nœuds qui se connectent de la même façon au réseau  rôle identifier les nœuds "spéciaux"  nœuds influents, leaders sociaux comparer à des caractéristiques exogènes au réseau  prédiction Mesurer l'évolution Ca rejoint la notion de rôle qui vise à grouper les nœuds qui ont des positions équivalentes dans le réseau (même s'il se trouvent loin l'un de l'autre dans le réseau); c'est différent de la notion de communauté qui vise à grouper les nœuds densément connectés entre eux Nœuds influent: augmente la vitesse de propagation d'un produit dans le réseau On peut prédire la forme du réseau autour du nœud en ayant ses autres caractéristiques, indépendantes du réseau, ou on peut déduire ses caractéristiques en sachant comment il est connecté au réseau Analyse de l'évolution du réseau: Comment la position de chaque nœud change-t-elle? Comment le réseau personnel de chaque individu évolue-t-il? Cette évolution est-elle liée à des propriétés du nœud, des autres nœuds? Peut-on prédire cette évolution? – p 37

38 Merci!


Télécharger ppt "Réseaux sociaux: une analyse centrée sur l'individu"

Présentations similaires


Annonces Google