La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Comparaison et sélection Bayésienne de modèles Julien Diard Laboratoire.

Présentations similaires


Présentation au sujet: "Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Comparaison et sélection Bayésienne de modèles Julien Diard Laboratoire."— Transcription de la présentation:

1 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Comparaison et sélection Bayésienne de modèles Julien Diard Laboratoire de Psychologie et NeuroCognition – CNRS UE Cognition bayésienne 24/02/2009

2 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Correctif Ernst & Banks 2

3 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » Cas mono-modal

4 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » % 67% 133% 200% Integration visuo-haptique 4

5 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 5

6 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 6

7 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Importance des variables cachées 7

8 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Modélisation dune série temporelle 8

9 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 P( y) 9

10 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Variable cachée V1 = {Bleu, Rouge} V1=RV1=B 10

11 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 P( y | [V1=R]) P( y | [V1=B]) 11

12 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 V2 = {Bleu, Rouge} [V1=R] [V1=B] P( y | [V1=R] [V2=R]) P( y | [V1=R] [V2=B]) P( y | [V1=B] [V2=R]) P( y | [V1=B] [V2=B]) 12

13 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Digression : entropie Déf : Exemple : [Shannon, 1948] 13

14 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Exemple 2 : P(X), X = {-1, 0, 1} 14

15 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Variables cachées, connaissance et entropie Théorème : Les variables cachées apportent de linformation P( y | [V1=B] [V2=B]) P( y) 15

16 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Prédiction de la prochaine valeur ? P( y) P( y | [V1=B] [V2=B]) 16

17 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Pour 2007, [V1=B] et [V2=B] 17

18 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne »

19 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 19

20 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Sources 20

21 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Devinettes Quel est le suivant ? –{1, 3, 5, 7, 9, 11, ?} –{1, 1, 2, 3, 5, 8, 13, ?} –{0, 4, 7, 6, 8, 2, 5, 8, 9, 3, ?} 21

22 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Réponses –{1, 3, 5, 7, 9, 11, ?} 42 –{1, 1, 2, 3, 5, 8, 13, ?} 42 –{0, 4, 7, 6, 8, 2, 5, 8, 9, 3, ?} 42 22

23 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Devinette n° 2 Combien de méthodes pour définir une relation mathématique ? 23

24 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Combien de méthodes pour définir une relation mathématique ? –Par fonction analytique f E F x | f(x) –Par extension Ensemble de points (pas pratique pour un ensemble infini) 24

25 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Quelle méthode pour la devinette ? Passage de points à une fonction Utilisation de la fonction pour prédire le point suivant Modélisation –Passage de points à un modèle –Utilisation du modèle pour prédire le point suivant 25

26 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Modélisation Définition dune classe de modèles Sélection du modèle –Qui maximise une mesure donnée Méthode très générale ! –Machine learning Réseau de neurone Algorithmes génétiques Apprentissage bayésien –Curve fitting –Optimisation 26

27 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Mesures de qualité de modèles Falsifiability –Existe-t-il des observations incompatibles ? Explanatory adequacy –Make sense of the data but also established findings Interpretability –Réifiabilité : les paramètres sont liés à dautres processus Faithfulness –La qualité du modèle vient de sa structure, pas de propriétés du calcul, de la simulation Goodness of fit Complexity (or simplicity) Generalizability 27 (Myung 03) (Léna Soler, Introduction à lépistémologie, Ellipses, 2000)

28 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne »

29 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Fit vs complexity Fit to regularity –Intéressant à modéliser Fit to experimental noise –Pas intéressant 29

30 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Théorème Par n points passe un unique polynôme de degré n-1 –n points (ou contraintes) –Polynôme degré n-1 a n paramètres f(x) = ax 2 + bx + c Par deux points passe une unique droite Par trois points passe une unique parabole 30

31 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Théorème Par n points passe un unique polynôme de degré n-1 Idem développement limité de Taylor Idem Transformée de Fourier –avec assez de paramètres, on approxime tout 31

32 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Fit vs complexity 32

33 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Complexité dun modèle = Nombre de paramètres + Forme fonctionnelle –M1 : y = sin(cos(ax)) a exp(-bx)/x b –M2 : y = ax b –M3 : y = ax + b 33 a=12 b=1

34 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Fonctionnelle de Tikhonov Mesure à minimiser –R(M, Δ) = G M (Δ) + λ H(M) –G M (Δ) mesure de fit –H(M) mesure de complexité (indépendante de Δ) –λ : poids relatif Tradeoff a résoudre : complexity regularization (idem en machine learning) 34

35 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne »

36 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Generalizability 36

37 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Mesure de generalisation –Mesure de la divergence moyenne (discrepancy) entre un modèle M et le vrai modèle M T –Mesure de divergence entre distribution de probabilité D –D(f,g) > D(f,f)=0 si f g 37

38 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Mesure de generalisation Mesure de la divergence moyenne (discrepancy) entre un modèle M et le vrai modèle M T M T est évidemment inconnu 38

39 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 39

40 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Cross-validation (CV) Estimer la généralisation du modèle sans connaître le vrai modèle –Partitionner les données Δ –Identification de paramètres sur la partie calibration –Estimation de la capacité de généralisation sur la partie validation 40

41 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Méthodes de CV Split-sample, hold-out method Split-half cross-validation –Coupe en deux Δ = Δ 1, Δ 2 –Estime les paramètres sur Δ 1 –Calcule lerreur de prédiction sur Δ 2 e 1 –Intervertir Δ 1, Δ 2, recommencer e 2 Validation croisée –Erreur de prédiction finale : moyenne des erreurs de prédiction (e 1 + e 2 ) / 2 41

42 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Méthodes de CV Leave-one-out cross-validation –Découper en n-1 données pour lidentification, et 1 donnée pour lerreur de prédiction –Répéter n fois –Erreur de prédiction moyenne sur les n étapes 42

43 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Méthodes de CV K-fold cross-validation –K blocs de taille n/K –Données pour lidentification : K-1 blocs (taille n-n/K) –Données pour la prédiction : 1 bloc (taille n/K) –Idem leave-n/K-out –Choix de K change le résultat 43

44 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Méthode de CV Bootstrapping –Tirage avec replacement subsamples au lieu de subsets des données –.632+ bootstrap method 63,2 % de Δ pour lidentification 44

45 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Critique de la CV Large training set overfitting Small training set underfitting Trouver le bon découpage –même problème que trouver la bonne pondération dans la fonctionnelle de Tikhonov Rien résolu (mais facile à coder) 45

46 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 46

47 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Mesures de distances entre distributions de probabilités Kullback-Leibler –Distance / divergence de Kullback-Leibler –KL divergence –Information gain –Relative entropy Cross entropy Mutual information 47

48 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 KL divergence Pas une mesure de distance –D(p,q) D(q,p) –D(p,q) > 0 pour tout p,q –D(p,q) = 0 ssi p k = q k pour tout k 48

49 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Cross entropy Entropie H(p), cross-entropie H(p,q) Relation avec la KL divergence 49

50 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Mutual information mesurée en bits I(X,Y) = I(Y,X) I(X,Y) 0 50

51 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 51

52 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 En modélisation probabiliste Un modèle –Point expérimental δ = {x,y} –P(δ) = P(y | x) P(x) –P(δ | θ 1 ) = P(y | x θ 1 ) P(x | θ 1 ) –P(δ | θ 1 m 1 ) = P(y | x θ 1 m 1 ) P(x | θ 1 m 1 ) 52

53 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 En modélisation probabiliste Plusieurs modèles –Espace de paramètres Θ = {θ 1, θ 2, …} –Classe des modèles M = {m 1, m 2, …} –Un modèle : P(y | x [Θ = θ 1 ] [M = m 1 ]) Méta-modèle, modèle hiérarchique –P(Δ Θ M) = P(δ i Θ M) = P(x y Θ M) = P(y | x Θ M) P(x | Θ M) P(Θ | M) P(M) 53

54 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Mesure de comparaison des modèles Probabilité dun modèle m 1, au vu de données expérimentales Δ –P(Δ Θ M) = P(δ i Θ M) = P(x y Θ M) = P(y | x Θ M) P(x | Θ M) P(Θ | M) P(M) = P(δ i | Θ M) P(Θ | M) P(M) 54

55 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » Soient –Un seul modèle M –D = {d 1, …, d n }, un ensemble de données expérimentales – un ensemble de paramètres de M Quel est le modèle le plus probable, au vu des données ? (Règle de Bayes) (Hyp i.i.d.)

56 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » Si P( ) = uniforme – Modèle de maximum de vraisemblance Maximum Likelihood (MLE) Si P( ) uniforme –Modèle = prior vraisemblance Modèle de maximum a posteriori (MAP) Modèle bayésien Posterior Prior Vraisemblance

57 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Goodness of fit en probabilités Maximiser la vraisemblance P(Δ | Θ M) P(Δ | Θ M) = Π i P(δ i | Θ M) max P(Δ | Θ M) = max log P(Δ | Θ M) = max log Π i P(δ i | Θ M) = max Σ i log P(δ i | Θ M) 57

58 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 58

59 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » Tel monsieur Jourdain… Un phénomène génère des couples x,y Un modèle –prédit y = F(x), F linéaire, F = ax + b –autorise du « bruit » dans les mesures On observe D = {d x1, …, d xn } Question –Quels sont les paramètres a, b les plus probables ?

60 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » Tel monsieur Jourdain…

61 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » Tel monsieur Jourdain…

62 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Moindre carrés de lerreur Comme –un Réseau de Neurones & Backpropagation (Mitchell 95, p167) –Une régression linéaire –… 62

63 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » Least square fitting sur Mathworld

64 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » Pour aller plus loin… Inférence dans les cas non-linéaires Moindres carrés Bayésien Espace de modèles – = {3x+2, 4x 3 -2x 2 +4} Priors hiérarchiques –P( | ) Rasoir dOccam automatique…

65 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 65

66 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Odds, posterior odds, evidence Une hypothèse H (modèle), et Odds, log odds (stats) 66

67 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Posterior odds Evidence 67 Odds, posterior odds, evidence

68 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 68

69 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Identification de paramètres vs Sélection de modèles Identification de paramètres –P(θ | Δ) –P(θ | Δ M) learning Sélection de modèle –P(M θ | Δ) –P(M | Δ) 69

70 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Comparaison de modèles Basés sur la vraisemblance –AIC Akaike Information Criterion –BIC Bayesian Information Criterion –MDL Minimum Description Length –BMS Bayesian Model Selection 70

71 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 AIC avec k le nombre de paramètres Modèle M qui minimise la mesure AIC Fonctionnelle de Tikhonov –AIC = lack of fit + complexity Dérive de lapproximation pour de larges ensembles de données de la KL divergence 71

72 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 BIC avec –k le nombre de paramètres –n le nombre de données Dérive de lapproximation pour de larges ensembles de données de la Bayesian Model Selection 72

73 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 MDL avec –k le nombre de paramètres –n le nombre de données –I(θ) la matrice dinformation de Fisher –|.| le déterminant de la matrice 73

74 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 MDL Mesure de complexité qui prend en compte la forme fonctionnelle Provient de la théorie de linformation –Compression des données Δ par modèle + déviation 74

75 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 BMS Vraisemblance –P(Δ | θ M) Vraisemblance marginale –P(Δ | M) = Σ θ P(Δ | θ M) P(θ | M) 75

76 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Bayesian model selection Attention –BMS Bayesian model selection –BMS Bootstrap model selection 76

77 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 77

78 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 « vraie » Bayesian model selection Prior sur M uniforme ou pas Prior sur les paramètres θ uniformes ou pas 78

79 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Bayesian model selection Intégrale sur lespace des paramètres –MAP si on la fait –méthodes de Monte-Carlo (voire, méthode de Gibbs (Mitchell 95)) si on tire aléatoirement dans θ pour approximer Gibbs sampling Metropolis-Hastings Random walk methods –Approximation du log vraisemblance autour de BMSL Bayesian Model Selection Laplace approximation 79

80 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Bayes Factor Extension du odds Ratio de vraisemblances marginales si prior uniforme sur M –P(M 1 ) = P(M 2 ) 80

81 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Bayesian Model Selection –na pas la forme dune fonctionnelle de Tikhonov –et pourtant, mesure la complexité des M 81

82 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 BMS et mesure de complexité « Occam automatique » : intuition Si et P(Δ | θ) concentré autour de –Alors P(θ 2 | Δ) pénalisé par la normalisation sur Θ 2 (espace plus grand) 82

83 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Plan Modélisation : choix des variables Comparaison et sélection de modèles –Cadre général : fit, complexité, capacité de généralisation –Méthodes de validation croisée –Apparté : mesures de distance entre distribution de probabilités Sélection bayésienne de modèles –Sélection probabiliste vs. Bayésienne –Tel monsieur Jourdain… un exemple –Apparté : vocabulaire –Sélection « bayésienne » de modèles : AIC, BIC, MDL, BMS –Sélection bayésienne de modèles Questions ouvertes 83

84 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Distinguabilité des modèles Sélectionner un modèle, ok Boucle expérimentale : –où prendre la prochaine donnée expérimentale ? –Notion philosophique dexpérience cruciale (discriminante) Distinguer les modèles 84

85 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Distinguabilité des modèles Modèle de distinguabilité en PBR –Extension du méta-modèle de fit 85

86 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Question ouverte Deux problèmes inverses –Perception Phénomène = f -1 (stimuli) –Modélisation Modèle = f -1 (observations) Doit-on conclure que le cerveau construit des modèles comme un scientifique le fait ? Le cerveau est-il bayésien ? 86

87 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Question ouverte Pourquoi 42 ? 87

88 Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Merci de votre attention ! Questions ?


Télécharger ppt "Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Comparaison et sélection Bayésienne de modèles Julien Diard Laboratoire."

Présentations similaires


Annonces Google