Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique Modélisation du conditionnement pavlovien et du conditionnement opérant Jean.

Slides:

Advertisements

Présentations similaires

S-SYSTEMS ETAPPROCHE HYBRIDE

Advertisements

Réseaux neuronaux - Architectures et algorithmes

L'interopérabilité dans l'innovation 2

Apprentissage et béhaviorisme

Apprentissage de représentation et auto-organisation modulaire pour un agent autonome Bruno Scherrer 6 janvier 2003 Directeurs : F. Alexandre, F. Charpillet.

Du multilinguisme, à la multi culturalité, en passant par la multidisciplinarité

Théorie sociale cognitive

Temps de réaction et facteurs computationnels

La méthode expérimentale TD 2 - Licence Laure Fernandez

28 Février 2007 Inspection AIS AUTISME 49

Aspects cognitifs de la gestion d’environnements dynamiques

Amélioration des techniques d'optimisation combinatoire par utilisation d'un mécanisme de retour d'expérience : Application à la sélection de scénarios.

ACS et Séquences Comportementales en environnements non-markoviens

simulateur de réseau de machines UML connectées par WiFi mode ad-hoc

Qu’est-ce qu’apprendre? Où en sommes-nous avec l’apprentissage?

L’APPRENTISSAGE Chapitre 5

Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble

Psychologie Cognitive & Apprentissage

L’apprentissage et le phénomène d’attention en publicité

Docteur Boudarène Mahmoud

pour lancer la discussion

Simulation multi-agent de phénomènes collectifs : quelques questions d’ordre épistémologique Frédéric AMBLARD Institut de Recherche en Informatique de.

5.1 LE CONDITIONNEMENT CLASSIQUE 5.2 LE CONDITIONNEMENT OPÉRANT

Apprentissage associatif

Centre EMOTION / CNRS PARIS VI UMR 7593 Hôpital de la Salpetrière

Paradigme constructiviste

Modélisation d'un comportement addictif à l'aide de réseaux de neurones artificiels Modèles Constat biologique: Les comportements addictifs avec recompense.

Emotion et Thérapies Comportementales et Cognitives: Naissance d’une 3ème Vague? Pierre Philippot Et... Céline Baeyens, Céline Douilliez, Aurore Neumann.

Sociologie de la famille PLAN - Introduction 1. Parenté et famille: une ouverture ethnologique 2. Modernisation et famille 3. Couple et famille.

Les micromondes TECFA Constructivisme et constructionisme

Mémoires associatives

Chapitre 7 Réseau ART.

Cours 2 : Une conception de la psychologie cognitive

Vincent Thomas Christine Bourjot Vincent Chevrier

Modélisation de la lecture grâce à un modèle connexionniste

Paradigme Constructivisme social

1 er décembre 2005IFT6010 – Jean-Yves Guyomarc’h Colorless green ideas…. Une « guerre de religion »

Le béhaviorisme L’être humain comme animal

Vers un nouvel empirisme: l’ancien et le nouvel empirisme John Goldsmith Université de Chicago CNRS MoDyCo.

Modèle neuromimètique de l’apprentissage par renforcement Les aspects temporels (réponse retardée) peuvent être facilement intégrés au niveau cortical.

Réponse créative du “Fantôme” Comment écrire un article dans les actualités.

Ecole behavioriste (comportementaliste)

Méthodes d’assimilation: Le problème du point de vue de la mesure (P. Prunet, Noveltis) Assimilation de données en zones cotières (P. De Mey, LEGOS/POC)

La facilitation / inhibition sociale

Christelle Scharff IFI 2004

Algorithmes pour le web “A Unified Approach to Personalization Based on Probabilistic Latent Semantic Models of Web Usage and Content”

CSI 4506: Introduction à l’Intelligence Artificielle

Sureté de fonctionnement dans les WNCS

Simulation du rôle de la communication dans l’établissement d’un réseau de liens sociaux Projet GPL :

Comportements des consommateurs Cours 3: L’apprentissage et les attitudes Jacques Nantel Ph.D. winter 1995.

Annual Best Practices Sessions / Ateliers annuels sur les pratiques exemplaires PERFORMANCE MONITORING, REPORTING AND EVALUATION: WHAT’S THE POINT OF.

Reconnaissance de visage par vidéo

Annual Best Practices Sessions / Ateliers annuels sur les pratiques exemplaires PERFORMANCE MONITORING, REPORTING AND EVALUATION: WHAT’S THE POINT OF.

Les procédés métiers : conception, modélisation et systèmes Claude Godart Université de Lorraine - Esstin 1.

Predictive State Representation

Le chaos pourquoi ? Permet de modéliser un type de mouvement récent qui n’est ni uniforme, ni accéléré. Des dynamiques chaotiques ont été mises en évidence.

1 Le GT1 « Diagnostic, prise de décision, contrôle cognitif et gestion des risques » Le GT1 « Diagnostic, prise de décision, contrôle cognitif et gestion.

Activités cognitives dans les systèmes d’information et interfaces homme-machine GT 3.

SCI6304 – Bibliométrie et communication savante Cours 1 Introduction

Plan de la présentation

Approche Interdomaine de la Rationalité Évolutionniste A.I.R.E.

Cours STAF – M. Bétrancourt & N. Descryver Constructivisme et constructionisme Micromondes spécialisés Efficacité : qu’est-ce qui est appris.

EXTRACTION D’ÉLÉMENTS CURVILIGNES GUIDÉE PAR DES MÉCANISMES ATTENTIONNELS POUR DES IMAGES DE TÉLÉDÉTECTION : APPROCHE PAR FUSION DE DONNÉES EXTRACTION.

OBJET ET METHODE 1 OBJET - malade et maladie - fonction soignante

IFT 703 Informatique cognitive ACT-R Modèle symbolique et perceptuel

Catégoriser pour comprendre Développement des concepts d'objets chez l'enfant D’après Françoise Bonthoux Laboratoire de Psychologie et Neurocognition (associé.

1 Le rôle architectural du client : un essai de typologie des processus coopétitifs dans l’industrie de défense américaine Colette Depeyre & Hervé Dumez.

Les approches en psychologie Lecture Chapitre 1 1.

PROFA. DRA. HELOISA ALBUQUERQUE COSTA AVRIL 2015 PROFA. DRA. HELOISA ALBUQUERQUE COSTA AVRIL 2015 Aquisição e Aprendizagem de Francês Língua Estrangeira.

Animal School: RaisingSmallSouls.com Carol Ann Tomlinson – Critical.

Transcription de la présentation:

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique Modélisation du conditionnement pavlovien et du conditionnement opérant Jean Marc Salotti Institut de Cognitique de Bordeaux

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique Sommaire 1.Introduction 2.Conditionnement 3.Modèles du conditionnement 4.Idées fondamentales 5.Apprentissage incrémental 6.Simulateur 7.Conclusion

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique 1. Introduction EA487 : équipe pluridisciplinaire en sciences de la cognition et facteurs humains I.A., neurosciences cognitives, psychologie cognitive, épistémologie Modélisation de processus cognitifs Robotique autonome Projet CNRS en neuroscience computationnelle

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique CNRS Project: Plasticity of amygdala networks in affective memories associated with opiate withdrawal

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique Conditionnement : -Intérêt en robotique : inspiration des modèles de l'apprentissage comportemental animal -Conditionnement opérant = dressage -Conditionnement = base de l'apprentissage séquentiel ? -Mouvement = séquence d'événements perceptuels et moteurs -Traitement de l'information = séquence d'opérations mentales

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique 1. Conditionnement 1) Conditionnement classique (CC3): (Cloche + nourriture  cherche nourriture ) x 3 ==> Cloche  cherche nourriture 2) Extinction CC3 + (cloche  cherche nourriture) x 3 ==> Cloche  ne fait rien

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique 3) Inhibition latente (Cloche  rien) x 3 + CC3 ==> Cloche  rien (Cloche  rien) x 3 + CC5 ==> Cloche  cherche nourriture 4) Blocking CC3 + (Cloche+Lumière+Nourr.  ch. Nour) x 3 ==> Lumière  ne fait rien

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique 5) Conditionnement de second degré CC3 + (Lumière+Cloche+Nour.  ch. nour.) x 3 ==> Lumière  cherche nourriture 6) Conditionnement opérant (dressage) (Appuie levier+nourriture  ch. nour.) x 3 ==> appuie levier  cherche nourriture IL, blocking, conditionnement de 2 nd degré, … aussi pour le conditionnement opérant

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique 2. Modéles du conditionnement Modèle de Rescorla et Wagner : Vx : "associative strength" d'un stimulus X Rescorla R.A. and Wagner A.R., A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and nonreinforcement, In Black, A. H., & Prokasy, W. F. (Eds.), Classical conditioning II: Current research and theory, 64-99, New York: Appleton-Century-Crofts, (1972).

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique TD modèle de Sutton and Barto Apprentissage par renforcement Système de prédiction Etat X => Etat Y Lien avec réseaux de neurones Qu'est-ce qu'un état ??? R.S. Sutton and A.G. Barto, 'A temporal-difference model of classical conditioning', Proceedings of the 9th Annual Conference of the Cognitive Science Society, , 1987.

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique Autres travaux : C. Balkenius and J. Morén, 'Computational models of classical conditioning: a comparative study', in Mayer, J.-A., Roitblat, H. L., Wilson, S. W., and Blumberg, B. (Eds.), From Animals to Animats 5. Cambridge, MA: MIT Press, N.A. Schmajuk, Y. Lam and J.A. Gray, 'Latent inhibition :A neural network approach', Journal of Experimental Psychology : Animal Behavior Processes, 22 (3) :321–349, Computational models of classical conditioning (Schmajuk) conditioning

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique 3. Idées fondamentales Système de prédiction => réseau bayésien -Nœud du réseau = perception d'un stimulus -Nœud du réseau = déclenchement du stimulus Et le changement de fréquence du métronome ? Et les actions ? -Nœud du réseau = événement représentationnel !!! -Evénement perceptif -Début d'action -Fin d'action

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique Caractéristiques de l'apprentissage : - Apprentissage structurel (NP-difficile) - Apprentissage des paramètres Spécificités : - Apprentissage sur peu d'exemples - Dynamique temporelle complexe - Evolution des paramètres ! (extinction, réacquis. …) - Dépend de l'ordre de présentation des exemples !!! - Réseaux simples !

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique Flash lumineux Bruit soudain Vue nourriture Début aller vers nour. Fin aller vers nour. Début manger Récompense Début appuyer levier Fin appuyer levier Cond. classique Cond. opérant Réseau bayésien à apprendre Partie du réseau déjà apprise Lien SC action Prédit que, mais n'oblige pas à

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique 4. Apprentissage incrémental -Trace de chaque événement sur 5 secondes -On observe E1 et E2. -E1 E2 Ssi t(E2) -t(E1) < 5s E2 n'était pas prédit par un E3, (1) ou alors E3=E1 E2 prédit une récompense (appr. motivé, évite de complexifier inutilement le réseau) (1) => Activation des événements attendus

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique Algorithme For each active trace Ax If reward present or expected For each active trace Ay (Y different from X) If (Eligible(Y)) or (W X->Y >0.5) If Start(X) < Start(Y) For each finishing trace A X If Ax predicted a reward that did not occur Look for the set of possible mistaken stimuli For each mistaken stim. M and prediction Y If A X occurred without expectation of any Reward and A X >0.2 A X =k A X (inhib. latente)

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique + règles ad hoc pour sélection et contrôle de l'action !

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique 5. Simulateur

Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique 6. Conclusion Construction incrémentale d'un réseau bayésien (système de prédiction) permettant le conditionnement classique et opérant Perspectives –SC composés, généralisation, réacquisition spontanée, oubli … –Apprentissage séquentiel motivé –Apprentissage opératoire (Langage ? Maths ?)