Incertitude, risque et apprentissage ECO8071 – Charles Séguin Inspiré en partie de notes de Larry Karp et Christian Traeger
L’INCERTITUDE, qu’est-ce? Ne pas connaître la valeur d’un élément? Ne pas connaître la probabilité d’un événement? Ne pas avoir conscience de la possibilité d’un événement? Un exemple : lancer une pièce de monnaie en l’air Qu’est-ce qui est incertain? Est-ce risqué?
CATÉGORISATION de l’incertain Incertitude : Je connais toutes les possibilités; Je représente la vraisemblance de leur occurrence par des probabilités.
CATÉGORISATION de l’incertain Incertitude Ambiguïté et flou : Je connais toutes les possibilités; Je ne peux représenter la vraisemblance de leur occurrence par des probabilités uniques. ? ?
CATÉGORISATION de l’incertain Incertitude Ambiguïté et flou Inconscience : Je ne connais pas toutes les possibilités. Nous allons nous concentrer sur l’incertitude. ?
INCERTITUDE et RISQUE Lancer une pièce est-il risqué? Parier sur le résultat du lancé d’une pièce est-il risqué? Il y a risque lorsque l’objectif (utilité, profit, etc.) d’un agent est incertain. L’incertitude d’un élément affectant l’utilité d’un agent expose cet agent au risque.
REPRÉSENTATION de l’incertitude Variable aléatoire : Une variable dont les valeurs possibles sont associées à des probabilités. Probabilité : Nombre entre 0 et 1 qui mesure la vraisemblance; La somme des probabilités des valeurs d’une variable aléatoire est 1. Pile ou face : Parier 100 $ sur pile :
DISTINCTIONS importantes ou non Incertitude Probabilité Fondamentale : La variable est aléatoire indépendamment de la perception de l’agent; (Purement) stochastique. Perceptive : Certaines limitations de l’agent rendent la variable aléatoire; Incertitude (propre). Objective : Tirée de données statistiques ou d’un raisonnement logique. Subjective : Représente les croyances de l’agent; Il peut y avoir des probabilités subjectives différentes pour le même événement.
ESPÉRANCE et UTILITÉ ESPÉRÉE Somme des valeurs d’une variable aléatoire pondérée par leurs probabilités; Pari : Utilité espérée : Somme de l’utilité des valeurs d’une variable aléatoire pondérée par leurs probabilité
APPRENTISSAGE Concept dynamique; Consiste à mettre à jour les probabilités d’une variable aléatoire avec des informations nouvelles; Après que la pièce soit retombée : Quels sont les probabilités? Vas-tu parier 100 $ sur pile? L’apprentissage peut influencer une décision risquée.
TYPES d’Apprentissage Surprise (Naïf) : L’apprentissage n’est pris en compte qu’une fois qu’il s’est produit. Anticipé (Sophistiqué) : L’apprentissage est pris en compte avant qu’il se produise. Passif : L’apprentissage est exogène aux décisions de l’agent. Actif : L’apprentissage est affecté par les décision de l’agent.
Un exemple simple (décision binaire) 2 périodes; Décision : construire un barrage ou pas (irréversible); Bénéfices : un barrage génère des bénéfices de 10M $ par période; Coûts : un barrage dénature la rivière sur laquelle il est construit, ce qui génère des coûts incertains de 3M $ ou 35M $ avec probabilités égales (peu importe le moment de construction); L’objectif du décideur est de maximiser l’espérance des bénéfices nets des coûts.
Exemple simple SANS APPRENTISSAGE Doit-on construire et quand? Période 1 Période 2 Bénéfices nets espérées Déjà fait oui Construire oui non Construire non
Exemple simple AVEC APPRENTISSAGE ANTICIPÉ Si j’anticipe que je vais connaître la valeur des coûts avec certitude à la période 2? Période 1 Période 2 Bénéfices nets Espérance 35 Déjà fait App. oui 3 Déjà fait Construire oui 35 Cons. non non App. oui 3 Cons. non
Exemple simple apprentissage NON-anticipé Que se passe-t-il à la période 1 si le décideur n’anticipe pas qu’il apprendra la vraie valeur des dommages à la rivière? Décision identique à l’absence d’apprentissage. Est-ce toujours le cas? Non…
Valeur d’OPTION (quasi) Dans l’exemple précédent, l’apprentissage augmente la valeur maximale de l’objectif (ex ante); La différence entre la valeur de l’objectif ex ante avec apprentissage anticipé et sans apprentissage anticipé est la valeur d’option; Dans le cas de notre exemple, la valeur d’option d’attendre d’apprendre avant de décider de construite ou non le barrage est de 2,5M $. La valeur d’option peut-elle être négative?
Deuxième exemple (décision CONTINUE) Un problème de changements climatiques : Deux périodes : Niveau d’émission dans la période i : Incertitude sur les dommages : Objectif : Quel est le niveau optimal d’émission sans apprentissage? Réponse : Objectif maximisé : 2,5
Deuxième exemple APPRENTISSAGE NON-ANTICIPÉ Décision sans apprentissage à la période 1 et décision contingente à la période 2. Période 1 Période 2 Objectif ex post Objectif espéré
Deuxième exemple APPRENTISSAGE ANTICIPÉ Décision contingente à la période 2 utilisée pour résoudre les émissions de la période 1. Période 1 Période 2 Objectif espéré
Prudence L’anticipation de l’apprentissage ne diminue pas nécessairement les actions irréversibles optimales précédents l’apprentissage; Cela dépend de la nature du problème, du type d’apprentissage et de la prudence du décideur; La prudence caractérise les préférences du décideur par rapport à un changement de niveau de risque; Si le risque augmente dans une période, un décideur préférera transférer de la richesse vers cette période si il est prudent; Un décideur est prudent si la troisième dérivé de sa fonction d’utilité (objectif) est positive.
Principe de précaution Qu’est-ce? Définition de la Convention-Cadre des Nations Unies sur les Changements Climatiques : Lorsqu’il y a risque de dommages irréversibles ou importants, le manque de certitude scientifique complète ne devrait pas justifier de repousser des mesures efficientes pour prévenir la dégradation de l’environnement. Que pensez-vous de cette définition? Peut-elle aider à faire des choix?
Résolution PARTIELLE de l’incertitude Les exemples précédents ont considérés uniquement une résolution complète de l’incertitude. Qu’est-ce qu’une résolution partielle? Prenez le dernier exemple. Si au lieu d’apprendre la valeur de S, le décideur modifiait les probabilités attribués à chacune des réalisations de S. Avec probabilités égales, le décideur peut apprendre que : a : b :
Apprentissage ACTIF L’apprentissage est actif lorsque le décideur peut influencer l’arrivée d’information. Cela implique souvent un arbitrage entre quête d’information et coûts. Revenons à notre exemple de changements climatiques (résolution complète de l’incertitude): Supposons que la résolution complète de l’incertitude est incertaine et que cette incertitude dépend des émissions de la première période; Avec probabilité j’apprends avec certitude la valeur de S, sinon je n’apprends rien, et .
Incertitude avec INFÉRENCE BAYÉSIENNE Théorème de Bayes : En mots : sachant les probabilités inconditionnelles des événements A et B, ainsi que la probabilité conditionnelle de B si A a déjà été observé, quelle est la probabilité de A conditionnelle à l’observation de B? En math : Pour l’apprentissage : Le décideur a ex ante une distribution a priori de la variable aléatoire; L’observation d’un signal fournira de l’information sur cette variable et permettra d’établir une distribution a posteriori; Dans les deux premiers exemples avec distributions discrètes, le signal donnait une information parfaite sur la variable aléatoire, ce qui impliquait une distribution a posteriori où une seule valeur avait une probabilité de 1.
Distributions conjuguées Un truc de modélisation pour utiliser l’inférence bayésienne, les distributions conjuguées. Si la probabilité postérieure appartient à la même famille que l’antérieure, cette dernière est la conjuguée de la distribution conditionnelle du signal. Si est la conjuguée antérieure de , alors la distribution appartient à la même famille que . Exemple : si le signal est distribué conditionnellement Poisson et que A est distribué Gamma, alors A conditionnel au signal est aussi distribué Gamma (signal dist. selon binomiale négative).
Distributions conjuguées EXEMPLE Revenons encore à l’exemple de changement climatique. S peut prendre les valeurs entières ; Quel est le signal? Sur quoi apprend-t-on? Qu’est qui est fondamentalement incertain?