1 Décisions dans lincertain Eric Sanlaville ISIMA 3 F3, master SIAD novembre 2008.

Slides:



Advertisements
Présentations similaires
Résolution Graphique d'un Programme Linéaire
Advertisements

La Méthode de Simplexe Standardisation
Chapitre 4: Le comportement des clients de l'UC
« Systèmes électroniques »
Gestion de portefeuille Support n° 5 Catherine Bruneau
ETUDE DU NEWS BOY PROBLEM
UMLV 1 Problème G = (S, A) graphe (orienté) Calculer H = (S, B) où B est la clôture réflexive et transitive de A. Note : (s,t) B ssi il existe un chemin.
1 MONDER2006 – 11/01/ Etudes de sensibilité pour la prospective électrique française à laide du modèle MARKAL Edi Assoumou.
Méthodes de simulation
Bloc 2 : Modèles d’optimisation par la programmation linéaire
Défi écriture BEF Couverture. Défi écriture BEF Page 1.
A.Faÿ 1 Recherche opérationnelle Résumé de cours.
Construction de Box-Plot ou diagrammes en boîtes ou boîtes à moustaches Construire une boîte à moustaches …
variable aléatoire Discrète
Houssein ALAEDDINE Kamal SERRHINI
Nombre de chaînes de longueur r
2.5 Champ électrique produit par une distribution continue de charges.
                                        République Algérienne Démocratique et Populaire Ministère de l’Enseignement Supérieur et de la Recherche Scientifique.
2) Les critères de choix d’ un investissement
Conception et analyse des algorithmes
Contrôle « rapide » Indiquer vos nom et prénom sur votre feuille
Septième étape : travailler avec des graphes probabilistes
Suites de matrices Quelques usages récurrents
Décodage des informations
1 4 Lanalyse des avantages et des coûts 4.1 Avantages financiers et économiques; 4.2 L'évaluation des avantages financiers 4.3 L'évaluation des avantages.
Optimisation linéaire
Le cas de la demande déterministe non stationnaire
Chapitre 3bis Applications linéaires et Matrices
Introduction - Modèle Discret – Modèle Continu - Algorithmes - Conclusion
Maîtrise des risques et sûreté de fonctionnement – Avignon – 6-10 Octobre 2008 Modélisation des dysfonctionnements dun système dans le cadre dactivités.
TECHNIQUES QUANTITATIVES APPLIQUEES A LA FINANCE
Test bilan de calcul mental N°1 :
II- L’algorithme du recuit simulé (pseudo-code)
DeweyBroche par François-Frédéric Tougas. c i b l e comprendre identifier bâtir l a n c e r évaluer 2.
Courbes de Hermite Michael E. Mortenson, Geometric Modeling. Wiley, 1997, 523p.
Programmation linéaire en nombres entiers : la méthode du simplexe
Universté de la Manouba
Algorithmes d ’approximation
Démographie d'entreprises sur la base des chaînes de Markov: une application aux données belges François COPPENS Fabienne VERDUYN Direction Analyse Micro-économique.
Les prévisions et la gestion de la demande
1 Séminaire LOVe du 29/03/07 Combinaison d'objets (fusion centralisée) T3.2 Combinaison de pistages (fusion décentralisée) T3.3.
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Programmation dynamique
Atelier de formation : MAT optimisation II (les graphes).
Méthodes de prévision (STT-3220)
Programmation linéaire en nombres entiers : les méthodes de troncature
STT-3220 Méthodes de prévision
Réseaux bayésiens: Inférence
GOL503 Spécificités sectorielles
Introduction Objet de la programmation mathématique, construction d'un modèle mathématique, problème général de programmation mathématique et classification,
Processus stochastiques
Coupes efficaces pour la relaxation lagrangienne
1 Notations Asymptotiques Et Complexité Notations asymptotiques : 0 et  Complexité des algorithmes Exemples de calcul de complexité.
Programmation dynamique
Probabilités et Statistiques Année 2010/2011
Evaluation de la valeur d’une entreprise
Probas-Stats 1A novembre 10 1 Probabilités et Statistiques Année 2010/2011
Calendrier (sur MathSV)
6. Problème de flot à coût minimum.
Modélisation et simulation de système de production
Probabilités et Statistiques
Rappels sur les fonctions et les suites aléatoires
Probabilités et Statistiques
Commande optimale linéaire quadratique de Lunar Lander
Rappel de statistiques
Recuit simulé Une métaheuristique venue de la métallurgie.
Probabilités et Statistiques
AIDE à la DECISION Critères IAE de Picardie - LP1.
1 Théorie de la finance Gestion de portefeuille Moyenne-variance Master Sciences de Gestion – Semestre II - Université Mohammed V Faculté des Sciences.
Transcription de la présentation:

1 Décisions dans lincertain Eric Sanlaville ISIMA 3 F3, master SIAD novembre 2008

Partie 3 Processus de décision markoviens

3 Modèles markoviens pour la prise de décision en horizon lointain Soit un système dont les états sont : Soit un système dont les états sont : E 1, E 2,… E N Une suite de décisions doit être prise, à chaque période de temps (seconde, jour, mois, année,…) Une suite de décisions doit être prise, à chaque période de temps (seconde, jour, mois, année,…) Létat du système à la période suivante, ainsi que le coût de la transition dépendent uniquement de létat présent, de la décision prise Létat du système à la période suivante, ainsi que le coût de la transition dépendent uniquement de létat présent, de la décision prise

4 Rappels sur chaînes de markov On connaît la probabilité de transition dun état à un autre en une période p ij. On connaît la probabilité de transition dun état à un autre en une période p ij. Etats récurrents : quand on les quitte, on est sûr dy revenir Etats récurrents : quand on les quitte, on est sûr dy revenir Etats transitoires : ce nest pas certain. Etats transitoires : ce nest pas certain.

5 Rappels sur chaînes de markov P est la matrice des probas de transition P est la matrice des probas de transition G =(V,E) est le graphe associé. G =(V,E) est le graphe associé. (i,j) est dans E si et seulement si p ij >0 (i,j) est dans E si et seulement si p ij >0 Une chaîne ergodique a tous ses états récurrents. Son graphe est alors fortement connexe Une chaîne ergodique a tous ses états récurrents. Son graphe est alors fortement connexe

6 Rappels sur chaînes de markov Résultat en horizon fini : Soit q(n) le vecteur ligne des probabilités des états après n transitions. On a q(n+1) = q(n)P.

7 Rappels sur chaînes de markov Résultat en horizon infini : Si la chaîne est ergodique, le vecteur des probabilités des états admet une limite quand le nombre de transitions tend vers linfini, Et = P.

8 chaînes de markov avec coûts On associe à chaque arc (i,j)un coût Aij. Lespérance du coût en une transition à partir de létat i est notée a i et vaut : a i = A ij. P ij Lespérance du coût en n transitions à partir de létat i est noté v i (n) et vaut (écriture vect): v(n) = a + P v(n-1) = v(n-1) + P n a.

9 chaînes de markov avec coûts Si la chaîne admet une distribution limite, Lespérance du coût en une transition en régime stationnaire vaut : g = lim v i (n) –v i (n-1) = lim p. a j g = lim v i (n) –v i (n-1) = lim p ij n. a jdoù g =.a

10 Chaînes avec coûts et décisions On associe à chaque état i un ensemble de décisions : K i. On associe à chaque état i un ensemble de décisions : K i. Proba de transition : p ijk : proba daller de i à j sachant que lon a pris la décision k. Proba de transition : p ijk : proba daller de i à j sachant que lon a pris la décision k. Coût de transition A ijk : coût de la transition de i vers j si lon a pris la décision k. Coût de transition A ijk : coût de la transition de i vers j si lon a pris la décision k.

11 exemples Marketing Marketing Système : ventes dun produit. Système : ventes dun produit. Décisions : publicité, changement de produit,… Décisions : publicité, changement de produit,… parc de ressources (machines, camions, etc…) parc de ressources (machines, camions, etc…) Gestion de stock : décisions dachat. Coût de stockage. Gestion de stock : décisions dachat. Coût de stockage.

12 Horizon fini On note maintenant v(n) le vecteur des espérances des coûts minimaux en n périodes. On note maintenant v(n) le vecteur des espérances des coûts minimaux en n périodes. v i (n)= min k {aik + p ijk.v j (n-1)} v i (n)= min k {aik + p ijk.v j (n-1)} On peut donc calculer ce vecteur par une récurrence arrière. On peut donc calculer ce vecteur par une récurrence arrière.

13 Horizon infini

14 Horizon infini Après résolution du PL Après résolution du PL Si ik > 0, cela signifie que lon doit prendre la décision k dans létat i. de plus ik est alors la proba de létat i pour la politique optimale. Si ik > 0, cela signifie que lon doit prendre la décision k dans létat i. de plus ik est alors la proba de létat i pour la politique optimale. Si ik = 0 pour tout k : létat i est transitoire pour la politique optimale Si ik = 0 pour tout k : létat i est transitoire pour la politique optimale

15 Taux dactualisation = 1/1+i, i taux dintérêt = 1/1+i, i taux dintérêt Horizon fini : Horizon fini : v i (n)= min k {a ik + p ijk.v j (n-1)} Horizon infini ? Horizon infini ? Vi : espérance du coût total passage à la limite : V i = min k {a ik + p ijk.V j }

16 Actualisation en horizon infini Où les j sont des valeurs strictt positives.

17 Actualisation en horizon infini Pour connaître les décisions associées à ces coûts, Il faut regarder les variables duales: Une variable duale strictement positive associée à Un couple (i,k) signifie que la décision optimale pour Létat i est k