Programmation dynamique

Slides:



Advertisements
Présentations similaires
La recherche de chemin optimal
Advertisements

La Méthode de Simplexe Standardisation
Chapitre annexe. Récursivité
Gestion de portefeuille
Thèmes du chapitre 3 La prise de décisions : l’essence même de la gestion 1. Le contexte de la prise de décisions 2. La méthode rationnelle de prise de décisions.
Algorithmes et structures de données avancés
Fonctions & procédures
Calculs de complexité d'algorithmes
Simplification et abstraction de dessins au trait
Gouvernance, refinancement et risque de faillite: une approche MFG Une étape vers une nouvelle modélisation du risque de liquidité
A.Faÿ 1 Recherche opérationnelle Résumé de cours.
Plus rapide chemin bicritère : un problème d’aménagement du territoire
variable aléatoire Discrète
IAS 23 « Coûts d'emprunt ».
                                        République Algérienne Démocratique et Populaire Ministère de l’Enseignement Supérieur et de la Recherche Scientifique.
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
IAS 2 « Stocks ».
Plus courts chemins On présente dans ce chapitre un problème typique de cheminement dans les graphes : la recherche d'un plus court chemin entre deux sommets.
Algorithmique et Programmation
Algorithmes Branch & Bound
Décodage des informations
Introduction à la conception de Bases de Données Relationnelles
Chapitre 2 : La fonction de transfert
Programmation linéaire
Méthode des k plus proches voisins
III – Convergence Asymptotique
DEA Perception et Traitement de l’Information
Introduction - Modèle Discret – Modèle Continu - Algorithmes - Conclusion
Algorithme de Bellman-Ford
II- L’algorithme du recuit simulé (pseudo-code)
GPA750 Les ateliers multigammes Chapitre 5
Courbes de Bézier.
Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles d’affaiblissement par la pluie sur les liaisons Terre-Satellite.
Algorithmes d ’approximation
Optimisation linéaire
1 Décisions dans lincertain Eric Sanlaville ISIMA 3 F3, master SIAD novembre 2008.
3. Théorie de la production (offre) (suite)
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Institut Supérieur des Etudes Technologiques de Djerba Exposé du Traitement de Données Réalisé par: Khalifa Marwa Magroun Amira Jawadi Souad L2MDW.
Programmation dynamique
GPA750 – Gestion de Projets
Technique de points de contrôle: Formes de Bézier
Programmation linéaire en nombres entiers : les méthodes de troncature

VISION GLOBALE DU PROJET
GOL503 Spécificités sectorielles
Introduction Objet de la programmation mathématique, construction d'un modèle mathématique, problème général de programmation mathématique et classification,
Présentation de la méthode des Eléments Finis
07/22/09 1.
Coupes efficaces pour la relaxation lagrangienne
Apérisentation Sur les graphes évolutifs Mardi 22 novembre 16h30.
ANALYSE METHODE & OUTILS
Rappel... Valeurs propres et vecteurs propres. Définitions;
PROGRAMMATION SCIENTIFIQUE EN C
Suites numériques Définitions.
Chapitre 3-B : AUTOMATIQUE : LES S.L.C.I.
GRAPHES EN INFORMATIQUE. INTRODUCTION Les objets mathématiques appelés graphes apparaissent dans de nombreux domaines comme les mathématiques, la biologie,
les méthodes de recherche locale
Le raisonnement par récurrence
Chapitre 3 :Algèbre de Boole
Université de Sherbrooke
Tutorat 7 - Introduction au Routage et OSPF
Institut Supérieur des Sciences Appliquées et de Technologie Sousse
Programmation linéaire en nombres entiers
Recherches locales et méta-heuristiques
Programmation dynamique
Méthode des moindres carrés (1)
Chapitre 4 Variables aléatoires discrètes
Recuit simulé Une métaheuristique venue de la métallurgie.
Transcription de la présentation:

Programmation dynamique Chapitre 2 Programmation dynamique

Programmation dynamique La programmation dynamique est une méthode de conception d'algorithme qui peut être employée quand la solution à un problème peut être vue comme le résultat d'une série de décisions

Formulation d’un problème en programmation dynamique Formulation du problème de la programmation dynamique en tant qu’un système dynamique à étapes discrètes Deux caractéristiques principales du problème de base déterminent sa structure : (1) un système dynamique sous-jacent à étapes discretes, et (2) un coût fonctionnel qui est additif dans le temps.

Programmation dynamique Déterministe vs stochastique Les méthodes de programmation dynamique basés sur des modèles déterministes supposent que le coût et le changement de l’état résultants de chaque décision, même pour leurs valeurs futures, sont connus avec certitude. Pour les systèmes stochastiques ( ex: gestion de stock), la fonction coût dépendent des perturbations aléatoires. Il est alors impossible de minimiser les coûts totaux. L’approche traditionnelle consiste à minimiser leur espérance.

Le plus court chemin Pour trouver le plus court chemin dans un graphe à plusieurs étapes: Appliquer la méthode glouton (greedy method) : Un algorithme glouton est un algorithme qui suit le principe de faire, étape par étape, un choix optimum local, dans l'espoir d'obtenir un résultat optimum global. le plus court chemin de S à T est :1 + 2 + 5 = 8

Le plus court chemin dans les graphes à plusieurs étapes par exemple. La méthode de Glouton ne peut pas être appliquée à ce cas : (S, A, D, T) 1+4+18 = 23. Le vrai court chemin est : (S, C, F, T) 5+2+2 = 9.

Approche de programmation dynamique (approche vers l'avant) : d(S, T) = min{1+d(A, T), 2+d(B, T), 5+d(C, T)} d(A,T) = min{4+d(D,T), 11+d(E,T)} = min{4+18, 11+13} = 22.

d (B, T) = minute {9+d (D, T), 5+d (E, T), 16+d (F, T)} d (C, T) = min {2+d (F, T)} = 2+2 = 4 d (S, T) = min {1+d (A, T), 2+d (B, T), 5+d (C, T)} = min {1+22, 2+18, 5+4} = 9. La manière ci-dessus du raisonnement s'appelle raisonnement en arrière.

Approche en arrière (raisonnement vers l'avant) d (S, A) = 1 d (S, B) = 2 d (S, C) = 5 d (S, D)=min {d (S, A)+d (A, D), d (S, B)+d (B, D)} = min {1+4, 2+9} = 5 d (S, E)=min {d (S, A)+d (A, E), d (S, B)+d (B, E)} = min {1+11, 2+5} = 7 d (S, F)=min {d (S, B)+d (B, F), d (S, C)+d (C, F)} = min {2+16, 5+2} = 7

d (S, T) = min {d (S, D)+d (D, T), d (S, E)+ d (E, T), d (S, F)+d (F, T)} = min {5+18, 7+13, 7+2} = 9

Principe de l'optimalité Principe de l'optimalité : Supposer qu'en résolvant un problème, nous doivent faire un ordre des décisions D1, D2,…, DN. Si cet ordre est optimal, alors les dernières décisions de k, 1  n du  k doivent être optimales. Dans le problème du plus court chemin Si I, i1, i2,…, j est un court chemin d'I à j, alors i1, i2,…, j doit être un court chemin d'i1 à j

Programmation dynamique Caractéristiques d’un problème de programmation dynamique Le problème peut être décomposé en étapes et une décision doit être prise à chaque étape. Ces décisions sont interdépendantes et séquentielles. A chaque étape correspond un certain nombre d’états. Dans l’exemple du voyageur, les états à chaque étape sont représentés par les villes que le voyageur les visiter. Le nombre de ces états dans l’exemple est fini. Le nombre d’états peut être infinie (xn IN) ou continue (xn IR) A chaque étape, la décision prise transforme l’état actuel en un état associé à l’étape suivante (dans certains cas avec une distribution de probabilité).

Programmation dynamique Etant donné un état, une stratégie optimale pour les étapes restantes est indépendante des décisions prises aux étapes précédentes. d’autres termes, l’état actuel contient toute l’information nécessaire aux décisions futures. Cette propriété est dite principe d’optimalité. L’algorithme de recherche de la solution optimale commence par trouver la stratégie optimale pour tous les états de la dernière étape. Une relation de récurrence identifie la stratégie optimale dans chaque état de l’étape n à partir de la stratégie optimale dans chaque état de l’étape n+1. Utilisant cette relation de récurrence, l’algorithme procède à reculons étape par étape. Il détermine la stratégie optimale pour chaque état de chaque étape.