La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Plan dexpérience dynamique pour la maximisation Aspect théorique Mise en œuvre expérimentale Présence ou absence de bruit ? Choix du paramètre ? Choix.

Présentations similaires


Présentation au sujet: "Plan dexpérience dynamique pour la maximisation Aspect théorique Mise en œuvre expérimentale Présence ou absence de bruit ? Choix du paramètre ? Choix."— Transcription de la présentation:

1 Plan dexpérience dynamique pour la maximisation Aspect théorique Mise en œuvre expérimentale Présence ou absence de bruit ? Choix du paramètre ? Choix de lalgorithme ? Choix de la fonction ? 1

2 f est très coûteuse à évaluer f est supposée régulière, lisse Optimisation stochastique : Donc : 2 Aspect théorique

3 La borne du regret cumulé dépend de la rapidité dobtention du gain dinformation. Mathématiquement 3 T Etablit une nouvelle connexion entre GP-UCB et ED

4 GP-UCB Partie théorique:Partie théorique: –Description du modèle –Gain dinformation et Experimental Design –Algorithme GP-UCB Partie expérimentale:Partie expérimentale: –Comparaison avec GP- UCB et ED –Influence de plusieurs maxima –Hypothése de régularité –Influence du bruit –Exemple en dimension 2 4

5 Calcul de la moyenne, de la covariance et de la variance 5 Oùet Aspect théorique

6 Objectif : Trouver le maximum de f en lévaluant le minimum de fois Ce que lon sait faire : Pour chaque x, calculer simplement et Stratégie : Choisir soigneusement (grâce à une borne de confiance) le prochain x à évaluer 6 Aspect théorique

7 7 Le prochain x que lon évaluera sera donc x1x1 x2x2 x3x3 Aspect théorique

8 Algorithme Initialisation : On dispose du GP Prior, selon lequel f est supposée être échantillonnée, et des valeurs aux bords f (0) et f (1). Itérations : Tant que lon est trop loin du maximum théorique, on calcule (soit par ED soit par GB-UCB) puis puis et 8 Aspect théorique

9 Mais comment choisir ? cf. Théorème 1 de Gaussian Process Optimization in the Bandit Setting: No Regret and Experimental Design Soit et alors le Aspect théorique 9 regret cumulé est en

10 Expérimentations T = 44 T = 8 Experimental Design (ED) GP - Upper Confidence Bound (GP-UCB) 10 Lequel des 2 algorithmes choisir ? GP-UCB

11 Expérimentations Quelle « régularité » pour f ? (avec GP-UCB) T = 3 T = 6 T = 8 T = 12 Fonction trop irrégulière : Ne converge pas ! 11

12 Expérimentations 12 Plus dévaluations Moins de précision T = 28T = 18 Influence dun bruit additif gaussien ?

13 Choix de et influence de cette constante sur le nombre ditérations T : / n ? Expérimentations Nombre dévaluations de f en fonction de n 13

14 Intérêt : obtention du maximum –Rapidement –Précisément Limites : –Lhypothèse fonction « régulière » est indispensable. –On na pas une idée « globale » de la fonction. CONCLUSION 14


Télécharger ppt "Plan dexpérience dynamique pour la maximisation Aspect théorique Mise en œuvre expérimentale Présence ou absence de bruit ? Choix du paramètre ? Choix."

Présentations similaires


Annonces Google