Paris F-RO 98 14-16/1/98 De lemploi de modèles pour explorer de nouvelles stratégies de conduite de culture : application à la conduite du blé M.H. Chatelin.

Slides:



Advertisements
Présentations similaires
Application aux constellations de satellites
Advertisements

Fabrice Lauri, François Charpillet, Daniel Szer
Cours 4-b Méthode des éléments finis 2D
Contrôle des processus : Introduction au Contrôle Qualité
Treuil IRD Abdelwahed FSSM-Marrakech
A. Cornuéjols IAA (basé sur Rob Schapires IJCAI99 talk) Combiner des apprenants: le boosting.
Jean-Louis Foulley, Christèle Robert* INRA-Génétique animale, SGQA Jouy-en-Josas; *SAGA Castanet Tolosan Journées didactiques INRIA « Modèles.
Efficient Simplification of Point-Sampled Surfaces
26/03/2017 ANR CARPEiNTER Approche multi-pas multi-échelle Lyudmyla YUSHCHENKO & Frédéric GOLAY Institut.
DEME - La méthode d’enquête – introduction
Application de réseaux bayésiens à la détection de fumées polluantes
Xavier Décoret* Frédo Durand° François Sillion*
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
Optimisation dans les télécommunications
METHODES DE SIMULATION DE LA VITESSE DU VENT
Bouyekhf Rachid-Lyuboumir Gruitch Laboratoire SeT UTBM
Modélisation des systèmes non linéaires par des SIFs
Stage réalisé à l ’INRA d ’AVIGNON
Sélection automatique d’index et de vues matérialisées
                                        République Algérienne Démocratique et Populaire Ministère de l’Enseignement Supérieur et de la Recherche Scientifique.
Méthodes d‘optimisation en finance
UNIVERSITE DES SCIENCES ET DE LA TECHNOLOGIE D’ORAN
Deheuvels O. CIRAD - UMR System
Application des algorithmes génétiques
15. 1 MILLION $ $ $ $ $ $ $ $ $ $ 04.
Simulation multi-agent de phénomènes collectifs : quelques questions d’ordre épistémologique Frédéric AMBLARD Institut de Recherche en Informatique de.
Algorithmes Branch & Bound
RÉSOLUTION DE PROBLÈMES
DURIBREUX, Michèle & COCQUEBERT & HOURIEZ, Bernard,
Décodage des informations
Etude longitudinale d’essais multilocaux: apports du modèle mixte
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Outils danalyse statistiques « programmation par lexemple » S. Canu,
Méthode des k plus proches voisins
Introduction - Modèle Discret – Modèle Continu - Algorithmes - Conclusion
SYSTEMES D’INFORMATION
Méthodes de prévision (STT-3220)
Commentaires sur les biais écologiques et les échelles non emboîtées
Universté de la Manouba
Modélisation de la topologie avec le Graphe Génératif Gaussien
1 Algotel /05/04 Modélisation analytique des algorithmes dordonnancement GPS & WFQ BOCKSTAL Charles, GARCIA J.M. et BRUN Olivier.
Vincent Thomas Christine Bourjot Vincent Chevrier
Ecaterina Giacomini Pacurar
Introduction à la programmation linéaire
Introduction à la programmation linéaire
La gestion par activités (ABM)
1 Séminaire LOVe du 29/03/07 Combinaison d'objets (fusion centralisée) T3.2 Combinaison de pistages (fusion décentralisée) T3.3.
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Propagation de radionucléides issus dun stockage dans une couche dargile.
Réseaux bayésiens: Inférence
Introduction Objet de la programmation mathématique, construction d'un modèle mathématique, problème général de programmation mathématique et classification,
Présentation de la méthode des Eléments Finis
Probabilités et Statistiques
Programmation dynamique
Amélioration de la simulation stochastique
Supports de formation au SQ Unifié
Ministère de l’Enseignement Supérieur et de la Recherche Scientifique
© Petko ValtchevUniversité de Montréal Février IFT 2251 Génie Logiciel Conception Hiver 2002 Petko Valtchev.
2008/ Plan du cours 1.Introduction –Contenu du cours 2.Logique mathématique –Calcul propositionnel –Calcul des prédicats –Logique floue et aide à.
Un processus pour la prise de décision spatiale.
Recherches locales et méta-heuristiques
Cours 12 Retour sur l ’examen L ’enseignement dans le cadre du travail de responsable au soutien pédagogique Mise en situation et application concrètes.
Application à la viabilité des systèmes irrigués à Podor de la modélisation à la restitution aux paysans Olivier Barreteau.
Knowledge discovery in Databases (KDD)
20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.
4ème journées PDM IA - Vendredi 7 mai 2004 Recherche en ligne pour la résolution de PDMs Laurent Péret, Frédérick Garcia INRA Toulouse, équipe Méthodes.
Stratégies optimales pour le déploiement des variétés résistantes Modélisation analytique de la durabilité des résistances Pietravalle S. van den Bosch.
Apprentissage semi-supervisé avec des modèles discriminants : application au résumé automatique de texte Massih-Réza Amini LIP6, Université de Paris VI.
GdR MoMaS Novembre 2003 Conditions d’interface optimales algébriques pour la vibro-élasticité. François-Xavier Roux (ONERA) Laurent Sériès (ONERA) Yacine.
Transcription de la présentation:

Paris F-RO /1/98 De lemploi de modèles pour explorer de nouvelles stratégies de conduite de culture : application à la conduite du blé M.H. Chatelin Station d'Economie et Sociologie Rurales INRA Grignon, France F. Garcia Unité de Biométrie et d'Intelligence Artificielle INRA Castanet Tolosan, BP27 Auzeville, France XITEK, un outil daide à lexploration basé sur lapprentissage automatique

Paris F-RO /1/98 AD pour la gestion de parcelles en grande culture Un besoin rendu nécessaire par le nouveau contexte de production Une solution basée sur la simulation de stratégies de conduite : DECIBLE simulateur DECIBLE stratégie

Paris F-RO /1/98 Le simulateur DECIBLE [Aubry et al. 92,97] DECIBLE se décompose en 2 parties : un modèle de croissance du blé un modèle décisionnel pour la gestion de la parcelle –La gestion du blé dhiver est un processus décisionnel séquentiel –Des règles SI.. ALORS.. sont utilisées à chaque étape de décision semisapport N1apport N2 t récolte

Paris F-RO /1/98 Schéma général de DECIBLE Simulateur de croissance du blé Simulateur de gestion de la parcelle semis N1 N2 récolte Règles de décision semis Série climatique rendement, maladies, résidus... Règles de décision N1 Règles de décision N2 Règles de décision récolte

Paris F-RO /1/98 Vers un système daide à lexploration Les concepteurs ont des difficultés à imaginer de nouvelles stratégies de conduite Besoin dun outil daide à la découverte de nouvelles stratégies de qualité espace des stratégies qualité Stratégies courantes ? ?

Paris F-RO /1/98 Génération automatique de stratégies La gestion du blé peut être représenté comme un Problème Décisionnel de Markov Les algorithmes de Programmation Dynamique ne sont pas utilisables car : –forte complexité algorithmique –pas de modèle probabiliste des transitions –la représentation des stratégies nest pas adaptée

Paris F-RO /1/98 XITEK : Un outil daide à lexploration basé sur lapprentissage automatique Le système itérativement génère, transforme et teste des stratégies en vue doptimiser leur qualité. générateur de climats aléatoires module dapprentissage simulateur DECIBLE Évaluation de la stratégie stratégie

Paris F-RO /1/98 Définition des stratégies Pour chaque étape de décision, des espaces détats et de décisions S i et D i sont définis Une stratégie est une séquence de fonctions de décision de S i dans D i SEMISN1N2Récolte N_sol [0,100]kg/ha J_1cm [01/03,15/05] BA_1cm [30,120]g/m² date_N2 [01/03,15/05] qt_N2 [0,200]g/m² date_récolte J_tallage Nb_pieds date_N1 [15/01,01/03] qt_N1 [0,100]g/m² date_semis [15/09,15/12] densité [100,300]g/m² variété {soisson,..} variables détat observées variables de décision

Paris F-RO /1/98 Quelle représentation des stratégies ? Discrétisation des S i et D i Partitionnement des S i et D i (CMAC) Utilisation de règles de décision SI s1 in [s1 début ; s1 fin ]... sp in [sp début ; sp fin ] ALORSd1 in [d1 début ; d1 fin ]... dq in [dq début ; dq fin ] Réseaux neuronaux

Paris F-RO /1/98 Simulation de stratégies et évaluation Ssemis Dsemis sini t Si Di SN1 DN1 Un critère numérique r semis r récolte est associé à chaque trajectoire on recherche des stratégies qui maximisent E(r semis r récolte )

Paris F-RO /1/98 Apprentissage par renforcement des stratégies A.R. est une nouvelle technique pour résoudre les problèmes décisionnels de Markov. Son principe est le suivant : stratégie n+1 = stratégie n + n. erreur n –erreur n est une estimation aléatoire de lécart entre stratégie n et stratégie* disponible à chaque étape – n tend lentement vers 0

Paris F-RO /1/98 Algorithmes dApprentissage par Renforcement Il existe des méthodes dA.R. basées sur une convergence asymptotique selon des critères dévaluation différents : –critère -pondéré : Algorithme Q-learning [Watkins 89] –critère moyen Algorithme R-learning [Schwartz 93] Représentation discrète

Paris F-RO /1/98 Particularité de notre problème Horizon fini, N étapes non stationnarité : espaces détats et dactions différents à chaque étape domaines mixtes (discrets, continus)

Paris F-RO /1/98 A.R en Horizon fini - non stationnaire [Garcia, Ndiaye 97] Adaptation des méthodes existantes : Q-learning en horizon fini R-learning en horizon fini Introduction d un nouvel algorithme : RH-learning (critère moyen)

Paris F-RO /1/98 A.R. pour les domaines continus Représentation CMAC : partitionnement uniforme des espaces détats et dactions Approximation dune fonction de valeur V(e,d) = ( 1 + … + ng )/ng Apprentissage des poids i

Paris F-RO /1/98 Des résultats partiels

Paris F-RO /1/98

Paris F-RO /1/98 Conclusion XITEK est en cours de développement les premiers résultats confirment la complexité du problème doptimisation sous-jacent l approche A.R. est ici validée sur un problème de grande taille un important travail doit être poursuivi concernant la visualisation et lanalyse des stratégies générées notre prochaine étape concerne la génération directe ou indirecte de règles de décision.

Paris F-RO /1/98 La représentation CMAC pour lestimation de fonctions f(s) = (w 1 + … + w ng )/ng s

Paris F-RO /1/98 Exemple de règle de décision pour le semis 15/1015/1101/0931/1231/10 date Soissons Sideral Pactol densité Espace Etats Espace Décisions Règle variéte

Paris F-RO /1/98 Lien stratégie / fonction de valeur Pour une stratégie et s in S i on définit : Q i (s,d) = E(r i r harvest | s,d, i+1,.., harvest ), et on cherche qui maximise Q i (s,d), avec i (s) = argmax Q i (s,d) Les fonctions Q i (s,d) sont représentées par des estimateurs CMAC.

Paris F-RO /1/98 Autre fonction de valeur considérée R i (s,d) = Q i (s,d) - (N-i+1) avec = 1/N E(r semis r récolte | ) et N le nombre détapes de décision avec toujours i (s) = argmax R i (s,d)

Paris F-RO /1/98 Apprentissage des fonctions de valeurs A partir des observation (s,d,s,r) à létape i, on met a jour l estimation courante de Q i (s,d) (Q- learning) ou de R i (s,d) et (R-learning) Q i n+1 (s,d) += n {r + max d Q i+1 n (s,d) - Q i n (s,d) } R i n+1 (s,d) += n {r - n + max d R i+1 n (s,d) - R i n (s,d) } n+1 += n {r - n + max d R i+1 n (s,d)-R i n (s,d)}

Paris F-RO /1/98 A.R., horizon fini et CMAC En pratique, cet apprentissage est adapté à la représentation CMAC, et ce sont les poids des cellules qui sont mis à jour. L hypothèse horizon fini amène à adapter le Q- learning et le R-learning. Ce dernier savère être le plus efficace

Paris F-RO /1/98