1 Amal Elouarari Commerce électronique: systèmes et architectures Avril 2003.

Slides:



Advertisements
Présentations similaires
La coopération : une approche engageante!
Advertisements

LES NOMBRES PREMIERS ET COMPOSÉS
[number 1-100].
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
1. 2 Évaluer des cours en ligne cest évaluer lensemble du processus denseignement et dapprentissage. La qualité des savoirs.
Fabrice Lauri, François Charpillet, Daniel Szer
Licence pro MPCQ : Cours
Faculté des Sciences de la Santé
Karima Boudaoud, Charles McCathieNevile
CONDUIRE une REUNION.
Proposition de recherches sur ABI (Pro Quest) Lise Herzhaft (Urfist de Lyon) et MH Prévoteau (Bibliothèque Université Paris 2) Mise en forme par Nolwenn.
Les Systèmes Multi Agents
Est Ouest Sud 11 1 Nord 1 Laval Du Breuil, Adstock, Québec I-17-17ACBLScore S0417 Allez à 1 Est Allez à 4 Sud Allez à 3 Est Allez à 2 Ouest RndNE
Sud Ouest Est Nord Individuel 36 joueurs
1. 2 Informations nécessaires à la création dun intervenant 1.Sa désignation –Son identité, ses coordonnées, son statut 2.Sa situation administrative.
1 La Commission européenne pour l'efficacité de la justice Association des magistrats du pouvoir judiciaire de la République et canton de Genève, 26 janvier.
Eric BONJOUR, Maryvonne DULMET
PLAN DU COURS Outils de traitement des risques
Le Modèle Logique de Données
Architecture de réseaux
Systèmes Experts implémentation en Prolog
La diapo suivante pour faire des algorithmes (colorier les ampoules …à varier pour éviter le « copiage ») et dénombrer (Entoure dans la bande numérique.
Interactions - Systèmes Multi - Agents Master IMA - 1 Environnement
univ-lr.fr
Gestion des connaissances
sur le concept de médiation
Évaluer pour faire apprendre dans une approche par compétences
Pédagogie par Objectifs
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
Bases de l’Intelligence Artificielle Distribuée
Interagir avec un objet mixte Propriétés physiques et numériques Céline Coutrix, Laurence Nigay Équipe Ingénierie de lInteraction Homme-Machine (IIHM)
le profil UML en temps réel MARTE
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 1 : La notion de système.
L’avancement du mémoire 19 avril 2005
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 3 : Laide à la décision Laide.
Pourquoi les réseaux de neurones de type « perceptron multicouche » conviennent-ils à l’apprentissage Stéphane Canu, INSA de Rouen , PSI André Elisseeff,
Rappel au Code de sécurité des travaux 1 Code de sécurité des travaux Rappel du personnel initié Chapitre Lignes de Transport (Aériennes)
Chapitre 2 Définition du besoin et description du besoin.
Identification et formation des dirigeants PDD-251.FR 1 Identification et formation des dirigeants.
La voyage de Jean Pierre
1 Conduite du changement LA CONDUITE DU CHANGEMENT.
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 4 : Laide à la communication.
La pensée du jour « Il faut rendre mesurable ce qui est réellement important plutôt que de rendre important ce qui est facilement mesurable. » Source inconnue.
SCIENCES DE L ’INGENIEUR
2 TP avec l ’aide d ’un modeleur 3D :
Interprétation de séquences dimages pour des applications MédiaSpace Alberto AVANZI François BREMOND Monique THONNAT Projet ORION INRIA de Sophia Antipolis.
Orléans, CFA, 20 Mars M. Bétrancourt 1 Mireille Bétrancourt TECFA, Faculté de Psychologie et éducation Université de Genève Pour un usage des technologies.
Graphe d ’interaction La réalisation du graphe d ’interaction permet d ’assurer l'uniformité des pages et de navigation qui rendent un projet plus fonctionnel.
1.1 LES VECTEURS GÉOMÉTRIQUES
Vincent Thomas Christine Bourjot Vincent Chevrier
Ecaterina Giacomini Pacurar
Notre calendrier français MARS 2014
C'est pour bientôt.....
Veuillez trouver ci-joint
LUNDI – MARDI – MERCREDI – JEUDI – VENDREDI – SAMEDI – DIMANCHE
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Biologie générale 5ème année
CALENDRIER-PLAYBOY 2020.
1. Présentation générale du système
Des théories d'apprentissage
Exercice de vérification 1 p
Les Chiffres Prêts?
Présentation du démonstrateur ATLAS Projet ANR 07 TLOG
Partie II: Temps et évolution Energie et mouvements des particules
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
Distributed Planning Distributed Problem Solving, motivations, strategies. Distributed Planning : Centralized planning for distributed plans. Distributed.
L'ENRICHISSEMENT DES CONNAISSANCES DANS LES RESEAUX
Démarche d’enseignement de l’APL : analyser
Transcription de la présentation:

1 Amal Elouarari Commerce électronique: systèmes et architectures Avril 2003

2 Plan de la présentation n Lapprentissage: aperçu général –Modèle général dun agent qui apprend –Présentation de quelques techniques dapprentissage n Lapprentissage dans les systèmes multi agents –De l apprentissage mono-agent à multi-agent –Qu apprend un agent dans un SMA ? –Caractéristiques multi-agents des apprentissages n Conclusion

3 De l'apprentissage "mono agent" à multi agents L'apprentissage en IA système interagissant globalement avec son environnement = Base de connaissances + module d exécution L'apprentissage porte sur : stratégie performance algorithmique forme des connaissances

4 De l'apprentissage "mono agent" à multi agents Pourquoi? n Complexité des SMA n profiter de lexpérience des autres n Système ouvert n Réduire la communication

5 De l'apprentissage "mono agent" à multi gents Difficulté : Réutiliser en IAD En IA: Processus cognitif En IAD : Processus social

6 De l'apprentissage "mono agent" à multi gents Communiquer et apprendre n [Feber 95] Les interactions s'expriment... à partir d'une série d'actions dont les conséquences exercent en retour une influence sur le comportement futur des agents ". Lapprentissage intègre une phase de communication : Classification

7 De l'apprentissage "mono agent" à multi gents [Brazdil et al 91] définissent des catégories d'apprentissage daprès le moment de communication : n Avant l'apprentissage : échange de données ---> apprentissage centralisé dans un agent n Pendant l'apprentissage : les agents apprennent en même temps qu'ils envoient leurs données ----> besoin d'algorithme d'apprentissage spécialisé n Après l'apprentissage : intégration des connaissances n Après lapprentissage : intégration distribuée du problème

8 De l'apprentissage "mono agent" à multi gents Communiquer pour apprendre n Les communications : –Partie de lapprentissage * apprentissage distribué par échange de message ( Protocole de négociation ) * feedback pour lapprentissage par renforcement ( comportement social )

9 n Source de données : * lagent apprend directement sur le contenu de lacte quil reçoit * lagent apprend indirectement sur lacte dans sa forme : 1. èvaluer la pertinence de lagent émetteur 2. En identifiant quel acte de langage a été effectué, lagent qui écoute apprend que lémetteur croit les différentes pré conditions du plan qui mènent a effectuer cet acte [Cohen et al 79] De l'apprentissage "mono agent" à multi gents

10 Quapprend un agent dans SMA ? n Les axes de classifications : Le système multi agent : le point de convergence de plusieurs axes d'analyse. l'approche Vowels décompose l'analyse d'un système multi agents selon quatre facettes :. Agent,. Environnement,.Interaction,. Organisation.

11 Quapprend un agent dans SMA ?

12 Apprentissage centré Agent n Ses propres comportements mieux organiser ses actions pour atteindre ses buts. Plusieurs comportements possibles Un agent dispose de plusieurs comportements possibles par lhistorique du comportement passé, il peut décider dadopter un comportement alternatif

13 Apprentissage centré Agent n La représentation des autres Nécessité de lapprentissage : n Un nouvel agent arrive construire une représentation (direct ou par annuaire central) Protocole de présentation n Un ancien agent présente un comportement variable –des différences p/r à sa présentation Lapprentissage se fait par interprétation des actions de lagent en confrontant le résultat observé a celui attendu.

14 Apprentissage centré Agent n Exemple : agent dinterface quand lagent ne sait pas répondre à une requête, il sadresse aux agents pour lesquels il sait quils peuvent y répondre. Pour affiner sa représentation des autres, il leur demande de répondre à une requête quil sait traiter pour évaluer la qualité de leurs réponses.

15 Apprentissage centré Environnement n Deux cas : n mettre à jour une connaissance erronée de lagent sur son environnement n acquérir des connaissances sur des parties de lenvironnement inaccessibles

16 Apprentissage centré Environnement n Raffinement des connaissances sur lenvironnement en cas de connaissance fausse ou incomplète par apprentissage interne ou perception dinformations supplémentaires. Définir des modèles pour raffiner la connaissance

17 Apprentissage centré Environnement n Suite à une erreur détectée : spécialiser sa connaissance pour que lerreur ne se produise plus. [Byrne et al.96] n apprentissage de concepts par intégration de situations de lenvironnement observé : à chaque intégration dune nouvelle situation * modifier les liens entre concepts * créer de nouveaux noeuds conceptuels [CARAMEL Sabah.97]

18 Apprentissage centré Environnement n Les perceptions distribuées de lenvironnement chaque agent perçoit une partie de lenvironnement coopérer pour apprendre Protocole dinteraction

19 Apprentissage centré Environnement n Système MALE de [Sian.91] (Multi Agent Learning Environment) contexte dapplication des cours de marché du thé, du café, du cacao... Chaque agent connaît une partie pour prédire les fluctuations du marché,les agents négocient en introduisant leurs points de vue n [Davies et al.95] les agents ont chacun accès à une base de données ils communiquent pour partager des données, des résultats partiels ou le résultat complet.

20 Apprentissage centré Interaction n Utilisation des interactions : –un agent dispose de plusieurs actes –il apprend à mieux les utiliser : < les adresser à des agents mieux choisis < différer leur émission Deux aspects des interactions peuvent être appris : concepts ou intentions implicites dans une communication utilisation de protocoles dinteraction

21 Apprentissage centré Interaction n La sémantique des communications –la sémantique utilisée dépend de chaque agent –possibilité dincompréhension et échec de lacte Saccorder sur une sémantique commune de lacte par lapprentissage. Par exemple : un modèle de négociation des relations sociales dans les communications :position dautorité. Si lun des deux agents nen a pas conscience, il lapprend par négociation

22 Apprentissage centré Interaction n Les protocoles dinteraction –les agents interagissent dans le cadre de protocoles –lapprentissage : les agents possèdent des moyens dévaluation de leurs interactions. –Lévaluation : < les messages reçus en retour à des messages émis < caractéristiques de ces messages (délai de réponse...)

23 Apprentissage centré Interaction n Illustration : modèle où chaque agent dispose dun ensemble de squelettes (partie de protocole les concernant). Par les interactions : induire des protocoles dinteractions globaux relations entre les actes.

24 Apprentissage centré Organisation n Lorganisation = cadre dans lequel les agents vont interagir n Pour la définir : –normes contraignant la liberté des agents –des rôles assignés aux agents –structure dactions coordonnées par graphe de relations (autorité...)

25 Apprentissage centré Organisation Deux aspects : n les agents en sont conscients : lorganisation est explicitement implantée (centralisée ou distribuée) dans chaque agent chaque agent connaît son rôle et ceux des agents avec qui va interagir n Organisation émergente : uniquement constatée par un observateur

26 Apprentissage centré Organisation n Lapprentissage centré organisation modifie lorganisation existante pour : n Une meilleure coordination des actions n une meilleure répartition des rôles...

27 Apprentissage centré Organisation n La coordination Les agents construisent un plan de coordination lapprentissage a lieu après lexécution de ce plan [Weiss 93] : n les agents proposent plusieurs actions pour la situation courante n les actions sont dotées dune mise selon leur pertinence (estimée par lagent) n plan global de coordination n Suivant le succès du plan dactions, les agents modifient les mises de leurs actions.

28 Apprentissage centré Organisation Illustration n [Sen et al.98] : deux agents poussent un cube suivant un chemin défini : - Observer la position du cube p/r au chemin après chaque poussée - Modifier la force et langle associés à la pression exercée dans la situation courante Par lapprentissage, ils finissent par exercer des poussées complémentaires pour déplacer le cube plus rapidement à deux.

29 Apprentissage centré Organisation Les rôles n les agents disposent de plusieurs rôles n choisir un rôle suivant la situation courante et les spécificités de chaque agent n Lobjectif de lapprentissage est de rendre le choix du rôle judicieux Dans certains cas, lagent peut modifier les rôles existants

30 Apprentissage centré Organisation n Robots footballeurs [Aubineau et al.97] Situation :position du ballon par rapport au robot choisir : frappeur ou défenseur évaluer le succès dans un futur proche : un but est marqué ou non n Rôles fusionnés (poids équivalents) : succession des comportements des rôles fusionnés(frapper puis défendre) n Apprentissage par renforcement : rôles complémentaires pour les agents dune même équipe

31 Apprentissage centré Organisation n Lauto organisation réorganiser après détection dune incohérence ou conflit [Camps 98] : les agents, en propageant les messages reçus qui ont mis en évidence le problème, finissent par trouver un agent compétent.

32 Les caractéristiques multi agents des apprentissages n La distribution n lasynchronisme n la coopération n Interprétations des interactions

33 Les caractéristiques multi agents des apprentissages n Difficulté de spécifier pour chacun des types dapprentissage le domaine dapplication : n domaine à faible interaction (apprentissage de ses propres comportements) n domaine à forte coopération représentation des autres ou de la coordination n domaine naturellement distribué auto organisation - apprentissage des perceptions n domaine composé dagents hétérogènes apprentissage des rôles ou de la coordination

34 Conclusion n Pourquoi apprendre (Complexité, système ouvert, comportement inconnu) n Quoi apprendre (Compétence, organisation, coordination, communication) n Comment apprendre ( isole ou interactif, intégrer lexpérience des autres...) n Type dapprentissage approprié : partir des caractéristiques multi agent

35 Références n [Davies et al.95] Davies(W.H.E) et Edwards(P.) – Distributed learning : An agnt-based approach to data-mining. In : Proceedings o ML95 n [Sen et al.98] Sen(S.),Sekeran(M.) et Hale(J.) – Learning to coordinate without sharing information. In : Readings in Agents, èd. Par Huhns(M.N.) et Singh (M.) n [Sian91] Sian(S.S.) –Adaptation based on coopative learning in multi-agent systems. In Decontralized A. 2,èd par Demazeau(Y.) et Muller (J-P.) n [Weiss93] Weiss (G) –Learning to coordinate actions in multi- agent systems. In : 13th intrnational Joint Conerene on Artiicial Intelligence.

36 Des questions