Réseaux sociaux: une analyse centrée sur l'individu

Slides:



Advertisements
Présentations similaires
LES NOMBRES PREMIERS ET COMPOSÉS
Advertisements

[number 1-100].
Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Le marché du jeu vidéo en France
Page 1 Retour sur le e- tourisme. Page 2 Quelques chiffres…
Licence pro MPCQ : Cours
Distance inter-locuteur
Mon carnet De comportement
Classe : …………… Nom : …………………………………… Date : ………………..
Reconnaissance de la parole
Est Ouest Sud 11 1 Nord 1 Individuel 20 joueurs 15 rondes - 30 étuis (arc-en-ciel) Laval Du Breuil Adstock, Québec I-20-15ACBLScore S0515 RondeNE
Est Ouest Sud 11 1 Nord 1 Laval Du Breuil, Adstock, Québec I-17-17ACBLScore S0417 Allez à 1 Est Allez à 4 Sud Allez à 3 Est Allez à 2 Ouest RndNE
Est Ouest Sud 11 1 Nord 1 RondeNE SO
Est Ouest Sud 11 1 Nord 1 Individuel 15 ou 16 joueurs 15 rondes - 30 étuis Laval Du Breuil Adstock, Québec I-16-15ACBLScore S0415 RndNE
Sud Ouest Est Nord Individuel 36 joueurs
Les Prepositions.
La diapo suivante pour faire des algorithmes (colorier les ampoules …à varier pour éviter le « copiage ») et dénombrer (Entoure dans la bande numérique.
Construction des 3 hauteurs
2 1. Vos droits en tant quusagers 3 1. Vos droits en tant quusagers (suite) 4.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES COHESION CULTURELLE ET EXPANSION DES IDEES SUR LE TERRITOIRE EUROPEEN.
Améliorer les performances du chiffrage à flot SYND
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
1 5 octobre 2011 / paw Présentation du 7 octobre 2011.
Partenariat LH2- ZDNet Sujet Omnibus Octobre Partenariat LH2-ZDNet.fr 7 ème Sujet Omnibus Septembre 2012.
1 Bienvenue! Ministère de lEmploi et de la Solidarité sociale Direction des ressources humaines La conduite dun projet de refonte dun intranet Pascale.
Interagir avec un objet mixte Propriétés physiques et numériques Céline Coutrix, Laurence Nigay Équipe Ingénierie de lInteraction Homme-Machine (IIHM)
1 Cours numéro 3 Graphes et informatique Définitions Exemple de modélisation Utilisation de ce document strictement réservée aux étudiants de l IFSIC.
Application des algorithmes génétiques
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
1 SERVICE PUBLIC DE LEMPLOI REGION ILE DE France Tableau de bord Juillet- Août 2007.
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
PM18 MONTAGE DU BLINDAGE AUTOUR DE LA QRL F. DELSAUX - 25 JAN 2005
1 Journée de regroupement des correspondants "Egalité et genre" - 21 novembre 2011 Rectorat de Rouen - SAIO - CD-HD Résultats scolaires, appréciations.
LES NOMBRES PREMIERS ET COMPOSÉS
Cairn.info Chercher : Repérer : Progresser 13/01/ { } Revues et diffusion des savoirs scientifiques : retour d’expérience de Cairn.info
La Saint-Valentin Par Matt Maxwell.
Unit 4: Les animaux Unit 4: Les animaux.
1 INETOP
Synthèse Applications des réseaux de neurones en reconnaissance de formes et en vision par ordinateur.
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
Les modèles linéaires (Generalized Linear Models, GLM)
La Distribution des Données
Tournoi de Flyball Bouin-Plumoison 2008 Tournoi de Flyball
Notre calendrier français MARS 2014
Annexe 1 VISITE SUR
Résultats Régionaux ENP 2006 C.Mourlan Coordinatrice FELIN.
C'est pour bientôt.....
Veuillez trouver ci-joint
Concurrence régionale, ambitions mondiales.
Réunion 29/11/20131 Projet L412 Nov Recherche dun ouvrage …. Sur Dieppe.
LA GESTION COLLABORATIVE DE PROJETS Grâce aux outils du Web /03/2011 Académie de Créteil - Nadine DUDRAGNE 1.
LUNDI – MARDI – MERCREDI – JEUDI – VENDREDI – SAMEDI – DIMANCHE
RADIO ET MÉDIAS SOCIAUX
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 - Programme de Seconde (juin 2009) Statistique et probabilités
CALENDRIER-PLAYBOY 2020.
1 Nestlé – Optifibre Zones administrables via le back-office.
1 Sites de presse : vers de nouvelles mesures Luciano Bosio - Bruno Schmutz Avril 2007.
Les Chiffres Prêts?
Médiathèque de Chauffailles du 3 au 28 mars 2009.
Partie II: Temps et évolution Energie et mouvements des particules
Transcription de la présentation:

Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

Laboratoire SENSE: Sociologie des usages Etudes du comportement de l'utilisateur (du client): Approche "qualitative": entretiens, enquêtes qualitatives Approche "quantitative": études des traces d'usages Communications par téléphone mobile Utilisations des plateformes sociales en ligne (MySpace, Flickr, Twitter, développées par Orange etc.) Connaissance des clients: développement de services, offres adaptés, ciblage de clients etc. – p 2

Bases de données (1) Téléphonie mobile: liste des communications entre les clients d'Orange en Belgique Numéros chiffrés => identifiants Toutes les communications (appels et SMS) impliquant un ou deux clients Un mois de communication Données sociodémographiques (âge et sexe) – p 3

Bases de données (2) Plateformes en lignes: aspirations de profils à partir de quelques profils initiaux BFS Toutes les informations du profil Liens déclarés avant l'aspiration – p 4

Caractérisation des clients: analyse des usages Téléphonie mobile: Nombre d'appels, durée, fréquence, nombre de SMS etc. Croiser avec les données sociodémographiques Plateformes en lignes: Nombre de commentaires, quantité de contenu publié etc. Croiser avec les autres informations du profil – p 5

Caractérisation des clients: analyse du réseau social On modélise les relations observées entre des personnes par un graphe (réseau social) les nœuds: les individus les liens correspondent aux relations observées – p 6

Caractérisation des clients: approche centrée sur l'individu Décrire comment chaque nœud (individu) est connecté dans le réseau Analyse de la structure locale du réseau, autour de chaque nœud Gros volumes de données  mesures avec petite complexité – p 7

La méthode proposée ego Etape1: calcul du réseau égocentré d'un nœud (ego)  lister les triangles contenant ego Eg(ego) ego – p 8

Etape 2: énumération des patterns dans le réseau égocentré

Exemple 10 nœuds: 4 isolés 5 liens: 1 isolés 2 1 – p 10

Description des liens formés par ego (positions de ses voisins) Après étape 2: description de la façon dont ego est connecté dans le réseau Etape 3: calcul des positions occupées par les contacts d'ego Plusieurs positions dans un pattern: – p 11

Etape 2: énumération des patterns dans le réseau égocentré Etape 3: calcul des positions dans les patterns – p 12

Un autre exemple Etape1: calcul du réseau égocentré d'un nœud (ego)

On obtient une caractérisation de la façon dont ego est connecté au réseau Et de la façon dont ses contacts se placent les uns par rapport aux autres. – p 14

Avantages Applicable à tout réseau Connaissance locale du réseau Rapide Motifs caractéristiques Description de la structure locale Ego Les contacts d'ego (les liens d'ego) En gros, la méthode peut être appliquée à n'importe quel réseau: on a déjà commencé sur Twitter, réseau de brevets de Romain, réseau de Massimiliano Avantages: calculs rapides, bonne description de la structure locale, on a pas besoin de connaître tout le réseau, juste les contacts d'ego et les liens entre eux – p 15

Le réseau de téléphonie mobile Mobistar (Orange en Belgique) Application Le réseau de téléphonie mobile Mobistar (Orange en Belgique)

La base de données Les communications (appels et SMS) des clients de Mobistar pendant octobre 2006 Un enregistrement: Les identifiants (anonymisés) des deux personnes L'heure La durée Le type (appel vocal ou SMS) Pour chaque jour, 10 millions communications avec plus de 3 millions clients – p 17

Le réseau social Les nœuds: les clients de Mobistar Un lien entre deux nœuds: au moins une communication dans chaque sens 3 millions de nœuds 6 millions de liens On représente les communications par un réseau social On connecte deux nœuds qui représentent 2 personnes A et B s'il y a eu au moins un appel de A vers B et un appel de B vers A pendent le mois d'octobre 2006 – p 18

Patterns caractéristiques (1) Un pattern est "caractéristique" si: Définition 1: son nombre d'occurrences dans les réseaux égocentrés est supérieur à un seuil donné – p 19

Patterns caractéristiques (2) Un pattern est "caractéristique" si: Définition 2: le nombre de réseaux égocentrés le contenant est supérieur à un seuil donné – p 20

Patterns caractéristiques (3) Un pattern est "caractéristique" si : Définition 3: son nb d'occurrences dans les réseaux égocentrés est supérieur au nb d'occurrences dans des réseaux générés aléatoirement Pour chaque réseau égocentré, plusieurs générations en utilisant Orbis [1] [1] P. Mahadevan, D. Krioukov, K. Fall and A. Vahdat, “Systematic topology analysis and generation using degree correlations,” SIGCOMM, 2006 – p 21

Positions des contacts d'ego On calcule la probabilité d'apparition dans les différentes positions du contact qui a le plus grand nombre de communications avec ego, du contact suivant (beaucoup d'appel aussi mais un peu moins), du contact suivant (moins d'appel) et d'un autre contact qui parle pas très souvent avec ego. Les position rouges sont centrales Les bleues et vertes sont intermédiaires Les noires sont périphériques – p 22

Positions des contacts d'ego: la fréquence des appels En moyenne, pour chaque motif: Le contact qui parle le plus souvent avec ego Les contacts suivants et Le contact qui parle peu avec ego On calcule la probabilité d'apparition dans les différentes positions du contact qui a le plus grand nombre de communications avec ego, du contact suivant (beaucoup d'appel aussi mais un peu moins), du contact suivant (moins d'appel) et d'un autre contact qui parle pas très souvent avec ego. – p 23

Positions des contacts d'ego: la fréquence des appels

Positions des contacts d'ego: la durée des appels En moyenne, pour chaque motif: Le contact qui la plus grande fréquence d'appel Le contact qui la plus grande durée d'appel et Le contact qui parle peu avec ego Quand on a trouvé ce résultat on s'est dit que c'était assez logique D'ailleurs il y a une étude sociologique qui le montre – p 25

Commentaires sur les résultats Licoppe C., Smoreda Z., 2005, “Are social networks technologically embedded? How networks are changing today with changes in communication technology,” Social Networks, vol. 27, no. 4, pp. 317–335 Deux registres de communication: Présence connectée Présence intermittente – p 26

Le réseau des artistes sur MySpace: Analyse de la popularité en ligne Application Le réseau des artistes sur MySpace: Analyse de la popularité en ligne

L'artiste MySpace, entrepreneur de sa notoriété Nb de visites de la page Nb de commentaires Nb d'amis "marketing de soi-même" – p 28 presentation title 28

Construction des données Aspiration BFS à partir de 7 profils initiaux Nb. total de profiles (artist ou fan) 21 153 Nb. de profiles artist 13 936 Nb. total de liens 143 831 Nb. de liens entre artistes 83 201 Réciprocité des liens 40.1% Artists avec label “Major” 3 422 Artists avec label “Indie” 7 069 Artists sans label 3 445 – p 29 presentation title 29

Clustering des artistes à partir de la popularité en ligne On caractérise chaque artiste par un vecteur: Nb. de visites de sa page audience Nb. de commentaires laissés sur sa page Nb. de gens l'avoir déclaré comme meilleur ami (autorité) Nb. d'artistes l'avoir déclaré comme meilleur ami (autorité artistique) Réciprocité de ses liens Label: "Major" (=3), "Indie" (=2) ou "Other" (=1) On groupe les individus avec Kohonen SOM – p 30

Résultat SOM – p 31

Clustering des cellules k-means clustering + expectation maximization algorithm 5 clusters – p 32

Description des clusters Vert (3): superstars, avec le plus de notoriété, à la fois influents et autoritaires; élites MySpace, avec une forte stratégie marketing online, populaires dans les medias traditionnels Bleu foncé (2): artistes influens avec une notoriété plus faible que les superstars mais avec une stratégie marketing efficace; souvent trendy, avant-garde music. Orange (5): artistes dynamiques d'un point de vue social, avec audience faible; groupes d'artistes non-professionnels bien intégrés dans des scènes locale Bleu (1): artistes avec une audience moyenne, faible autorité et peu de liens réciproques; sans stratégie MySpace importante Rouge (4): artistes anonymes avec peu d'audience et sans pratique sociale active Nord Ouest Est Réciprocité Audience + Autorité Sud – p 33 presentation title 33

A degré égal – p 34

A nombre de liens égal – p 35

Caractérisation des liens En utilisant les positions dans les patterns: Clusters 1 et 4: liens sortants vers 3 Cluster 2: liens réciproques avec lui-même Cluster 3: liens réciproque avec lui-même dans les positions centrales et intermédiaires liens entrants avec 4 dans les positions périphériques Cluster 5: liens réciproques avec 2 et 5 dans les positions centrales liens sortant vers 3 dans les autres positions – p 36

On peut envisager de Faire des catégories de nœuds pour grouper les nœuds qui se connectent de la même façon au réseau  rôle identifier les nœuds "spéciaux"  nœuds influents, leaders sociaux comparer à des caractéristiques exogènes au réseau  prédiction Mesurer l'évolution Ca rejoint la notion de rôle qui vise à grouper les nœuds qui ont des positions équivalentes dans le réseau (même s'il se trouvent loin l'un de l'autre dans le réseau); c'est différent de la notion de communauté qui vise à grouper les nœuds densément connectés entre eux Nœuds influent: augmente la vitesse de propagation d'un produit dans le réseau On peut prédire la forme du réseau autour du nœud en ayant ses autres caractéristiques, indépendantes du réseau, ou on peut déduire ses caractéristiques en sachant comment il est connecté au réseau Analyse de l'évolution du réseau: Comment la position de chaque nœud change-t-elle? Comment le réseau personnel de chaque individu évolue-t-il? Cette évolution est-elle liée à des propriétés du nœud, des autres nœuds? Peut-on prédire cette évolution? – p 37

Merci!