Intelligence Artificielle Développementale

Slides:



Advertisements
Présentations similaires
Candidature à une allocation de recherche en informatique
Advertisements

Techniques de l’intelligence artificielle (MIF24)
La GNU/GPL v3 du point de vue des administrations publiques _______ L'importance des SaaS Pascal Verniory responsable du service juridique du Centre.
Réseaux neuronaux - Architectures et algorithmes
Contrefaçon sur internet: comment agir en droit comparé? Le point sur la stratégie possible et les décisions marquantes en Allemagne Dr. Martin Köhler.
Licence 2 Option de découverte (1L4INJM) APPLICATIONS INFORMATIQUES POUR LINTERACTION HOMME-ROBOT Responsable : Julien PINQUIER
Le raisonnement mécanisé
DEA Sciences Cognitives
LE BENCHMARKING 1.
Choisir les membres de votre équipe. « Personne ne peut siffler une symphonie. Seul un orchestre peut la jouer. » ~Halford E. Luccock 1.
1. 2 LE DÎNER TRADITIONNEL CHINOIS OU LIMAGE DUN MODÈLE SYSTÉMIQUE DE LAPPRENTISSAGE EN MILIEU SCOLAIRE.
M-Traces et Système à Base de M-Traces
Systèmes à base de connaissances
1 DISIC Option Systèmes Intelligents / Données, Documents et Connaissances DISIC Option Systèmes Intelligents / Données, Documents et Connaissances.
Girard Pia & Laffont Caroline
ACS et Séquences Comportementales en environnements non-markoviens
1 B Système Enjeux et principes Cours DESS Nantes 04 Décembre 2002 Didier ESSAME.
LI.A ça ressemble à ça… des fois…. Ou pas… Rappels et définition de lIA – Lidée quon sen fait – Jusquoù on va aujourdhui / dans le futur? – Petit Etat.
Schéma de Développement Stratégique
1 : Environnement électrique
Sélection automatique d’index et de vues matérialisées
Des RRA à la diagnosticabilité
L’évaluation des élèves en SVT
Collecte de données en ligne
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 3 : Laide à la décision Laide.
Karin Lundgren-Cayrol
Présentation du Learning Tool Cours de formation des arbitres 1 er avril
Maths, Fourmis, Informatique et Petits Chevaux - 1
Validation d’applications pour les Legos Mindstorms
Département fédéral de lintérieur DFI Office fédéral de la statistique OFS La qualité de lemploi en Suisse Silvia Perrenoud Journées suisses de la statistique.
Maîtrise des risques et sûreté de fonctionnement – Avignon – 6-10 Octobre 2008 Modélisation des dysfonctionnements dun système dans le cadre dactivités.
LE DISCOURS PHILOSOPHIQUE
Développer en C avec Eclipse Introduction Création d'un projet Ajout de fichiers Compilation Exécution Utiliser le débogueur Département dinformatique.
Chapitre 3 Syntaxe et sémantique.
Stage dintroduction Programme dergothérapie 20 mars 2013 Hiver 2013.
SOCLE COMMUN AU COLLEGE. Loi dorientation et de programme pour lAvenir de lEcole (23 avril 2005):
Les réseaux de neurones artificiels (RNA)
1 er décembre 2005IFT6010 – Jean-Yves Guyomarc’h Colorless green ideas…. Une « guerre de religion »
Intelligence artificielle développementale 27 Mars t oliviergeorgeon.com1/29.
‘‘Open Data base Connectivity‘‘
Ingénierie des connaissances d’expérience tracée Analyse de l'activité à partir de traces 18 Décembre 2013
Intelligence Artificielle et plagiarisme constructif
Techniques de l’intelligence artificielle
1 Modèle pédagogique d’un système d’apprentissage (SA)
Conférence du groupe X- Environnement, 24 avril 2013 L’impact écologique des infrastructures numériques Cédric Gossart Institut Mines-Télécom Télécom Ecole.
Voici les mouvements de Mars et de la Terre dans le référentiel héliocentrique Sens de rotation LE SOLEIL MARS LA TERRE.
Réalisation d’un atelier de conception, de fabrication numérique et d’expérimentation adapté à la pédagogie par problèmes et par projets Projet retenu.
Création et présentation d’un tableau avec Word 2007
Formation Initiateurs Club 2013 – 2014
Présenté par : Attia Hamza Merzouk Abdelkrim 2003/2004
1. Présentation générale du système
Agents intelligents.  L’IA peut être envisagée de différentes manières. Les deux questions essentielles qu’ il convient de se poser sont: Vous intéressez-vous.
e1 Machine de Turing (MT) qui ajoute un bâton à une suite de bâtons
RENCONTRES ENTRE ENSEIGNANTS DES COLLEGE Décembre 2009 TITRE DDEC 29 Socle Commun des Connaissances et des Compétences Partager des expériences.
Des approches cognitives aux approches émergentes de l’apprentissage
Séminaire 10 Juin 2008 Pervasive Learning Network : P-LearNet Institut TELECOM.
Laurence Chérel et Catherine Madrid
Modèle neuromimètique de l’apprentissage par renforcement Les aspects temporels (réponse retardée) peuvent être facilement intégrés au niveau cortical.
PPE Bouchard Rémi Courot Lucas Donnay Thomas Floret Thomas.
Relevez le numéro de votre logo préféré et adressez-le à : En cas d’hésitation, vous pouvez choisir jusqu’à 3 logos. Seront pris.
EG01 - Ergonomie 1 Le portail de recherche cartographique Soutenance finale Vincent GUYONGM02 Nordin MIMOUNIGM05.
Nouveaux Programmes 2010 Frédéric Marquet Classe de Seconde Nouveaux Programmes 2010.
Méthodologie de la recherche
Communication dans un SIC : morphologie d’un paysage d’agents
Algorithmique et programmation (1)‏
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
Du discours aux modèles… Une tentative d’articulation
Pédagogie inclusive des perspectives autochtones Transdisciplinaire Processus et contenu.
GPA-779 Application des systèmes experts et des réseaux de neurones.
Jean Marc Salotti - Institut de Cognitique de Bordeaux - GT4 GDR Robotique Modélisation du conditionnement pavlovien et du conditionnement opérant Jean.
Transcription de la présentation:

Intelligence Artificielle Développementale 1er Avril 2014 Olivier.georgeon@liris.cnrs.fr http://www.oliviergeorgeon.com t oliviergeorgeon.com

Plan Vers de la recherche en robotique. Conclusion du cours. Demos Conclusion du cours. Travaux pratiques Développez votre agent auto-programmant (suite). oliviergeorgeon.com

Recherche en robotique Panoramic camera Ground optic sensor Bumper tactile sensor http://liris.cnrs.fr/simon.gay/index.php?page=eirl&lang=en oliviergeorgeon.com

Expérimentation http://liris.cnrs.fr/simon.gay/index.php?page=eirl&lang=en oliviergeorgeon.com

Conclusion sur l’IA développementale oliviergeorgeon.com

Positionnement dans le cadre de l’IA Symbolique Non symbolique Newell & Simon (1972) goals drive problem solving; (1976) Physical Symbol Systems. oliviergeorgeon.com

IA symbolique “L’environnement” passe des symboles à l’agent en input. C’est comme si les états du monde étaient étiquetés et qu’on passait une étiquette à l’agent. Et qu’on avait codé la sémantique de ses étiquettes sous forme de règles Par exemple: si comestible alors manger Tous les fruits sont commestibles Une pomme est un fruit Donc, si je percois une pomme alors je mange Il ne faut pas confondre symbolique et discret. “L’environnement” passe des symboles à l’agent en input. Nous codons une sémantique des symboles dans l’agent. Nous implémentons un « moteur de raisonnement ». (ne pas confondre symbolique et discret) oliviergeorgeon.com

Positionnement dans le cadre de l’IA « Perception and action arise together, dialectically forming each other » (Clancey, 1992) Apprentissage « désincarnée » Cognition située (Clancey 1992) Apprentissage par enregistrement (Georgeon, 2014) Apprentissage par l’expérience William Clancey (1992) claims that “perception and action arise together, dialectically forming each other” (p.5). En confondant naivement “input” et “perception” (Crowley, 2014) Apprentissage par renforcement. A E Réseaux de neurones. Machine learning. Symbolic Non-symbolic Newell & Simon (1972) goals drive problem solving; (1976) Physical Symbol Systems. oliviergeorgeon.com

Apprentissage « désincarné » 1 2 4 2 4 3 On ne peut toujours pas étudier comment l’agent modèle le monde car on suppose que les observations représentent directement le monde On ne suppose pas qu’une observation correspond à un seul état du monde. Mais on suppose qu’un état du monde correspond à une observation. L’environnement passe des “observations” en input de l’agent. La relation monde -> observation est “statistiquement” une surjection. Nous implémentons des algorithmes qui supposent qu’un état du monde donné induit une observation donnée (bien que partielle et bruitée). oliviergeorgeon.com

Positionnement dans le cadre de l’IA Théories Paradigme de validation Behavioral analysis rather than performance measure Implementations Phenomenology (Dreyfus, 2007) “even more Heideggarian AI” Radical Interactionism, ECA (Georgeon et al., 2013) perception-action inversion (Pfeifer & Scheier, 1994) Horde (Sutton et al., 2011) Théorie des systèmes SMC theory (O’Regan & Noë, 2001) Cognition située (Clancey 1992) “intrinsic motivation” (Oudeyer et al. 2007) Apprentissage par enregistrement (Georgeon, 2014) Apprentissage par l’expérience Apprentissage « désincarnée » William Clancey (1992) claims that “perception and action arise together, dialectically forming each other” (p.5). En confondant naivement “input” et “perception” (Crowley, 2014) Reinforcement Learning. Neural networks. Machine learning. A* etc. Symbolic Non-symbolic Newell & Simon (1972) goals drive problem solving; (1976) Physical Symbol Systems. oliviergeorgeon.com

Cécité au changement http://nivea.psycho.univ-paris5.fr/ oliviergeorgeon.com

Apprentissage par l’expérience Time L’environnement passe le résultat d’une expérience initiée par l’agent. C’est contre-intuitif! Nous implémentons des algorithmes qui apprennent à “maitriser les contingences sensorimotrices” (O’Regan & Noë, 2001). oliviergeorgeon.com

Accepter cette contre-intuitivité Nous avons l’impression que le soleil tourne autour de la terre. Impression est trompeuse ! (Copernic, 1519) Nous avons l’impression de recevoir des données sur l’état du monde. Impression trompeuse! (Philosophie de la connaissance depuis les lumières, au moins). Comment transcrire cette contre-intuitivité dans les algorithmes? oliviergeorgeon.com

Enjeux: cognition sémantique Raisonnement et langage Systèmes à bases de règles, Ontologies, IA traditionnelle. Cognition sémantique Ancrage de la connaissance dans l’expérience, Construction de sens. Auto-programmation. Adaptation stimumuls-response Apprentissage par renforcement, Réseaux de neurones, machine learning classique. oliviergeorgeon.com

Conclusion Raisonner en termes d’interactions Plutôt que de séparer perception et action. Raisonner en termes de comportements générés Plutôt qu’en termes de données apprises. Garder son esprit critique Inventer de nouvelles approches. oliviergeorgeon.com

Inventer de nouvelles approches Problème formalisé « Hard problem of AI » A E A E Etc. oliviergeorgeon.com

Travaux dirigés 4eme partie (suite). Salles TP6 et TP7 Groupes de 2 oliviergeorgeon.com

Environnement 3 modifié Se comporte comme Environnement 0 jusqu’au cycle 5, puis comme environnement 1 jusqu’au cycle 10, puis comme environnement 0 . Implémentation If (step <= 5 or step > 10) If (experiment = e1) then result = r1 If (experiment = e2) then result = r2 Else If (experiment = e1) then result = r2 If (experiment = e2) then result = r1 Step++ oliviergeorgeon.com

Agent 3 dans Environnement 3 0. e1r1,-1,0 1. e1r1,-1,0 learn (e1r1e1r1),-2,1 activated (e1r1e1r1),-2,1 propose e1,-1 2. e2r2,1,0 learn (e1r1e2r2),0,1 3. e2r2,1,0 learn (e2r2e2r2),2,1 activated (e2r2e2r2),2,1 propose e2,1 4. e2r2,1,0 activated (e2r2e2r2),2,2 propose e2,2 5. e2r1,-1,0 learn (e2r2e2r1),0,1 6. e2r1,-1,0 learn (e2r1e2r1),-2,1 activated (e2r1e2r1),-2,1 propose e2,-1 7. e1r2,1,0 learn (e2r1e1r2),0,1 8. e1r2,1,0 learn (e1r2e1r2),2,1 activated (e1r2e1r2),2,1 propose e1,1 9. e1r2,1,0 activated (e1r2e1r2),2,2 propose e1,2 10. e1r1,-1,0 learn (e1r2e1r1),0,1 activated (e1r1e2r2),0,1 activated (e1r1e1r1),-2,1 propose e2,1 propose e1,-1 11. e2r2,1,0 activated (e2r2e2r1),0,1 activated (e2r2e2r2),2,2 12. e2r2,1,0 activated (e2r2e2r2),2,3 propose e2,2 13. e2r2,1,0 oliviergeorgeon.com

Principe de l’Agent 3 … PASSE PRESENT FUTUR AGENT Activé Choisit (it-1,it) (i11,i12) i12 (i11i11) Choisit it-1 it e1 i11 i11 Apprend Propose Execute Active it-4 it-3 it-2 it-1 it = i11 i11 … Temps PASSE PRESENT FUTUR oliviergeorgeon.com

Environnement 4 Retourne résultat r2 uniquement après deux fois la même expérience. e1 -> r1, e1 -> r2, e1 -> r1, e1-> r1, … e1->r1, e2 -> r1, e2->r2, e2 -> r1, …, e2 -> r1, e1 -> r1, e1 -> r2, e2 -> r1, e2 -> r2, e1 -> r1, e1 -> r2, … If (experiencet-2!=experiencet && experiencet-1==experiencet) result = r2; else result = r1; oliviergeorgeon.com

Rapport Agent 1 Agent 2 Agent 3 Conclusion Explications du code Traces dans les environnements 0 et 1 avec différentes motivations. Explications du comportement Agent 2 Traces dans les environnements 0 à 2 avec différentes motivations. Agent 3 Traces dans les environnements 0 et 4 avec différentes motivations. Explications des comportement Conclusion Quelle serait la prochaine étape pour faire l’agent 4 capable de s’adapter aux environnements 1 à 4? oliviergeorgeon.com