Un modèle de rationalité orienté vers la coopération C. Sibertin-Blanc M. Mailliard - Intro ~ slide 1 – poli -rapide Bonjour Je m’appelle mm et je poursuis mon doctorat d’informatique à l’irit. Les travaux que nous présentons aujourd’hui s’inscrivent dans un projet de formalisation d’une th. sociologique, la sociologie de l’action organisée. Nous menons ce projet conjointement avec les sociologues du ciress, de l’ut1. Ce que nous cherchons à faire dans ce projet, c’est représenter formellement. Représenter la structure et la dynamique de systèmes sociaux conformément à cette théorie sociologique. L’idée principale de cette présentation est que la coopération est essentielle dans le cadre d’un jeu social. Ce que nous proposons c’est un modèle de la rationalité des acteurs qui soit orienté vers la coopération.
Système de règles pour modéliser la rationalité des acteurs sociaux La sociologie de l’action organisée: la théorie sociologique qui inspire Le jeu social Système de règles pour modéliser la rationalité des acteurs sociaux Adaptation orientée vers la coopération - Plan ~ slide 2 – poli /solennelle 1- J’introduirais d’abord la sao. La théorie sociologique qui inspire nos travaux 2- De là je présenterai en quoi consiste le jeu social et ses règles. Nous verrons également que sous certaines conditions le jeu social peut correspondre à un dilemme du prisonnier. Nous nous servirons de ce jeu comme exemple. 3- De là nous nous interrogerons sur la pertinence d’un mécanisme simple basé sur un système de règle afin de représenter la rationalité limitée des acteurs. Nous verrons en quoi le mécanisme proposé n’est pas satisfaisant pour rendre compte de comportement coopératifs, indispensables pour établir la stabilisation de relations sociales durables. 4- Cela nous conduira à un deuxième modèle de l’acteur social qui incite à la coopération. Nous mettrons en avant la nécessité pour un acteur de pouvoir évaluer la distance à ses objectifs, et de pouvoir adapter son comportement en fonction de cette distance, tantôt de façon à explorer les possibilité du jeu social, tantôt de façon à exploiter les connaissances acquises lors de l’exploration. Enfin nous conclurons sur les limites de notre travail, Et nous ouvrirons sur les perspectives de travail envisagées.
La Sociologie de l’Action Organisée (ou Analyse Stratégique) Héritière de la sociologie des entreprises Crozier 1962 : le phénomène bureaucratique, Friedberg 1993 : l’acteur et le système Système d’Action Concret : organisation dont les membres sont durablement engagés pour contribuer à la réalisation des objectifs Expliquer la nature du comportement des acteurs sociaux Rendre compte de la stabilité des rapports sociaux dans les SAC - SAO – Histoire / Théorie / Objectifs (SAC) ~ slide 3 –pédagogue modeste Il existe plusieurs type de sociologies suivant les objets d’étude et les perspectives envisagées sur ces objets. La sao est une héritière de la sociologie des entreprises et s’inscrit plus généralement dans la sociologie des organisations. Michel Crozier initie ainsi le mouvement en 62 avec le phénomène bureaucratique où il étudie notamment les relations de pouvoir dans les ateliers des manufactures de tabacs de la seita. En 93 Friedberg et Crozier affine leur théorie sur les systèmes d’action concret dans un ouvrage intitulé l’ « acteur et le système ».(…) Un système d’action concret est une organisation dont les membres sont durablement engagés pour contribuer à la réalisation des objectifs. A ce titre les entreprises, les universités, les institutions sont pensées comme des sac. L’objet de la sao est d’expliquer la nature du comportement des acteurs sociaux afin de comprendre comment ils stabilisent leurs rapports sociaux dans les sac.
La Sociologie de l’Action Organisée Les acteurs sociaux ont un comportement stratégique : maintenir ou accroître son pouvoir sur les autres Le pourvoir s’exerce par la maîtrise de Zones d’Incertitudes (une ressource dont d’autres ont besoin) dont on fixe les termes de l’échange (la façon dont les autres pourront utiliser) Chaque acteur tout à la fois contrôle et est dépendant des autres Cette stratégie est mise en œuvre dans le cadre d’une rationalité limitée - SAO – Postulats(Acteur stratégique / ZI / TE / interdépendance/ Rationalité Lim.) «« pédagogue Le comportement des acteurs est décrit comme étant stratégique. La sao analyse essentiellement la structuration des jeux sociaux sous l’angle du pouvoir. Le pourvoir = capacité à influencer le comportement d’autrui Les acteurs sociaux cherchent ainsi à maintenir ou à accroître leur pouvoir sur les autres. C’est en quelque sorte leur méta objectif. Le pouvoir s’exerce par la maîtrise de Zones d’Incertitudes : une ressource dont les autres ont besoin (!= formes: compétence, K et utilisation des normes de l’organisation). Dont on fixe les termes de l’échange (la façon dont les autres pourront l’utiliser) Les acteurs sont ainsi pris dans un tissus d’interdépendances mutuelles où chacun tout à la fois contrôle et est dépendant des autres. Ainsi la stratégie des acteurs consiste a tiré au mieux parti des ressources qu’ils contrôlent afin d’orienter la distribution des termes de l’échange à leur avantage. L’exercice de la stratégie est contraintes par la capacité limitée des acteurs à accéder à et à traiter l’information. Ou autrement dit la stratégie des acteurs s’exerce dans le cadre d’une rationalité limitée.
La Sociologie de l’Action Organisée Grille d’analyse très largement utilisée par les consultants en organisation, les sociologues d’entreprise Essentiellement empirique Notre projet, en collaboration avec des sociologues du CIRESS : Formaliser cette théorie => laboratoire virtuel Méta-modèle de la structure du jeu Simulation du comportement des acteurs sociaux facteurs endogènes de l’évolution du jeu Les connaissances produites par les théoriciens de la sao ont permises l’établissement de grilles d’analyse très largement utilisées par les consultants en organisation et les sociologues d’entreprise. Toutefois ces connaissances sont essentiellement éparpillées dans des recueils monographiques qui font de la sao une sociologie essentiellement empirique, qui souffre d’un défaut de théorisation. Ainsi l’effort de notre projet trouve sa place dans un processus de formalisation d’un savoir empirique. Nous proposons d’aborder le problème de formalisation de la sao comme un processus itératif de construction de connaissances qui se décompose en trois étapes : proposer un méta modèle de la structure des sac, simuler le comportement des acteurs sociaux, et rendre compte des facteurs endogènes de l’évolution du jeu social. L’idée sous-jacente à cette démarche est de proposer un laboratoire virtuel permettant à des chercheurs, des étudiants et à des consultants de manipuler in vitro le phénomène qu’ils découvrent, étudient ou projettent.
Le jeu social : les données A = {a1, …, aN}, les acteurs R = {r1, …, rM}, les ressources Espace des états d’une ressource : [-1, 1] ter, l’état d’une ressource [-1, 1] Espace des états du système : [-1, 1]M Maîtrise d’une ressource, m : R A m(r) est l’acteur qui fixe l’état de la ressource r Action : déplacement de l’état d’une ressource, réalisée par l’acteur qui maîtrise cette ressource Transition : Etat x Action Etat (e1, …, eM) x (d1, …, dM) : (e1 + d1, …, eM + dM) Maîtrise : m est surjective, tt acteur contrôle au moins une ressource
Le jeu social : les données Impact de l’état d’une ressource sur la possibilité d’y accéder pour un acteur : effetr (a) : [-1, 1] [-1, 1] état de r : la façon dont a peut accéder à r solde de a pour r = effetr(a) (ter) : ce que l’acteur qui maîtrise r octroie à a Chaque acteur place des enjeux sur certaines ressources, en fonction du besoin qu’il en a pour réaliser ses objectifs : enjeu : A x R [0, 10] normalisation des enjeux : a A, r R enjeu(a, r) = 10 La fonction d’utilité de chaque acteur : satis(a) = r R enjeu(a, r) * effetr(a) (ter) les moyens dont il dispose pour réaliser ses objectifs enjeux : nécessité d ’utiliser la ressource pondéré par l’importance de l’objectif Tout jeu social admet un équilibre de Nash : chaque acteur maximise à son profit l’effet des ressources qu’il contrôle
Le jeu social : les règles Comportement d’un acteur = valeur qu’il fixe aux termes de l’échange des ressources qu’il contrôle fonctionnement du jeu social : chacun ajuste son comportement en fonction du comportement des autres Jeu stabilisé : les acteurs ne changent plus de comportement, ils jouent l’action nulle, chacun accepte : le niveau de sa propre satisfaction le niveau de la satisfaction de chacun des autres Objectif du jeu : obtenir une forte satisfaction
Le jeu social : les règles On cherche un modèle de rationalité des acteurs tq : le jeux itéré soit stationnaire (les comportements sont stabilisés) la satisfaction de chaque acteur est « maximal » Pour ne pas faire d’hypothèse sur les règles d’un comportement social, chaque acteur construit son propre processus de décision par apprentissage, avec le minimum de connaissance sur la structure du jeu : ses enjeux, les soldes qu’il reçoit apprentissage : les règles du comportement social s’apprennent, se découvrent Apprentissage ajustement, co-adaptation
Le jeu social : Exemple Jean et Marie prennent régulièrement l’apéro ensembles, Jean détient le pastis, Marie les olives => A = {J, M}, R = {p, o}, m(p) = J, m(o) = M Chacun garde pour lui et donne à l’autre une part +- grande de la ressource qu’il contrôle => effetp(J)(te) = -te = - effetp(M)(te) effeto(M)(te) = -te = - effeto(J)(te) Marie préfère le pastis, Jean préfère les olives => enjeu(M, p) = 8, enjeu(M, o) = 2, satis(M) = 8*tep - 2*teo enjeu(J, o) = 8, enjeu(J, p) = 2, satis(J) = - 2*tep + 8*teo Tout garder : te = -1 Tout donner : te = 1 Erreurs garder +1 donner –1 Jeu somme nulle
Le jeu social : Exemple C’est un dilemme du prisonnier, dès que chacun place davantage d’enjeux sur la ressource que l’autre contrôle Matrice des paiements Jean pour les comportements extrêmes Marie Toute valeur de tep dans [-1, 1] correspond à un comportement de J, de même que pour teo et M donner tep= 1 garder tep= - 1 donner : teo= 1 6, 6 - 10, 10 garder : teo= - 1 10, - 10 - 6, - 6 Pas sur du sens de la dernière phrase.
Un modèle de rationalité : Système de règles Chaque acteur est muni d’un système de règles de la forme {situation, action, force}, où : situation = liste des soldes qu’il reçoit pour chacune des ressources dont il a besoin, (état du système perçu par l’acteur, via les fonctions d’effet) action = liste des déplacements à appliquer aux termes de l’échange de chacune des ressources qu’il contrôle, force : une valeur numérique qui évalue l’efficacité de la règle. Cf. les systèmes de classeur
Système de règles
(situation courante, action au hasard, force initiale) Système de règles Renforcement - calculer la satisfaction courante et la comparer avec celle de l’étape précédente - renforcer en conséquence la règle précédemment appliquée : + - bonus - appliquer un facteur d’oubli à toutes les règles : - oubli - supprimer les règles dont la force est négative. Sélection - sélectionner les règles dont la composante situation est proche de la situation courante de l’acteur - choisir la plus forte parmi elles - s’il n’y en a pas, créer une nouvelle règle : (situation courante, action au hasard, force initiale) Action - apliquer l’action de la règle choisie, ou de celle créée
Système de règles : bilan Information dont dispose chaque acteur : soldes qui lui sont attribués, calculer sa satisfaction, et la comparer avec la précédente Expérimentations différentes valeurs des paramètres du système de règles variantes du jeu, avec des enjeux différents ne donnent pas de bonnes conditions: jeu non stabilisé, satisfaction peu élevée. Pour obtenir une bonne satisfaction, la coopération est essentielle dans les jeux à somme non nulle pas de bonnes conditions de stabilisation: taux de coopération trop faible
Inciter à la coopération Permettre à chaque acteur de situer sa satisfaction courante dans le domaine de valeur de sa fonction de satisfaction satisfaction basse : priorité à l’exploration satisfaction haute : priorité à l’exploitation, garder le même comportement => stabilisation du jeu Explorer : renouveler davantage les règles déterminé par bonus, oubli, force initiale. actions plus énergiques Pb : où placer la frontière exploration / exploitation ?
Inciter à la coopération La frontière exploration / exploitation Critère 1 : elle doit être aussi haute que le niveau de satisfaction auquel chacun peut prétendre Critère 2 : pour que le système se stabilise, elle doit descendre suffisamment bas pour que chacun cesse d’explorer => Chaque acteur a son propre seuil, qui décroît progressivement seuil_sat := satisfaction_max ‘initialisation seuil_satn = seuil_satn-1 + *(satisn-1 - seuil_satn-1) avec = 1/Πa contrôle r nombre_d_état(r) Chaque acteur a son propre seuil, qu’il découvre progressivement La vitesse de décroissance est fonction de la complexité du jeu pour a
Inciter à la coopération : explorer / exploiter Oubli des règles - en-dessous de seuil_sat : proportionnel à (seuil_sat – satis) - au-dessus de seuil_sat : pas d’oubli Renforcement des règles tq satisn = satisn-1 - en-dessous de seuil_sat : pénalisée - au-dessus de seuil_sat : renforcée Intensité de l’action des règles créées - en-dessous de seuil_sat : déplacement important des termes de l’échange (modifie significativement l’état du jeu) - au-dessus de seuil_sat : négligeable (stabiliser l’état du jeu)
Inciter à la coopération : résultats Tout donner Optimum de Pareto
Conclusion Structure de jeu particulière, dont les propriétés restent à explorer Rationalité qui cherche à atteindre un optimum de Pareto, plutôt qu’un équilibre de Nash Etudier d’autres rationalités : l’optimum global écart type minimum (réduire les inégalités) maximiser la satisfaction minimal
La Sociologie de l’Action Organisée Organization individual actor interaction, balance build constraint ((peut être inutile))