Habilitation à Diriger des Recherches

Slides:



Advertisements
Présentations similaires
La Méthode de Simplexe Standardisation
Advertisements

Fabrice Lauri, François Charpillet, Daniel Szer
Licence pro MPCQ : Cours
Distance inter-locuteur
Les déterminants des investissements des salariés dans les FCPE d’Actionnariat Salarié Monsieur le Président, messieurs les membres du jury, je vous remercie.
Classification et prédiction
Calcul géométrique avec des données incertaines
LE CALCUL LITTÉRAL AU COLLÈGE
La pensée critique en Mathématiques Module 1 Les racines carrées et le théorème de Pythagore 8e année Par Tina Noble.
C1 Bio-statistiques F. KOHLER
Inférence statistique
1. Les caractéristiques de dispersion. 11. Utilité.
Page : 1 / 6 Conduite de projet Examen du 13 mai 2002 Durée : 3h30mn Le support de cours et les notes sont nécessaires La notation tiendra compte très.
A Pyramid Approach to Subpixel Registration Based on Intensity
Auteurs : P. Hellier C. Barillot E. Mémin P.Pérez
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
Maria-João Rendas CNRS – I3S Novembre 2006
SYMETRIE CENTRALE OU SYMETRIE PAR RAPPORT A UN POINT.
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Estimation de la survie comparaison des courbes de survie FRT C3.
Modélisation et commande hybrides d’un onduleur multiniveaux monophasé
Fusion de données SENSO
Analyse de la variance à un facteur
1 Analyse de la variance multivariée Michel Tenenhaus.
Modèle Linéaire Généralisé (Proc Genmod)
La perception subjective de la corrélation dans les nuages de points
DEA instrumentation et commande
Christelle Scharff IFI 2004
Application des algorithmes génétiques
Dynamique dopinions sur réseaux Amblard F.*, Deffuant G.* *C emagref-LISC.
Système coopératif pour l'aide à la conduite
Pourquoi les réseaux de neurones de type « perceptron multicouche » conviennent-ils à l’apprentissage Stéphane Canu, INSA de Rouen , PSI André Elisseeff,
Etude longitudinale d’essais multilocaux: apports du modèle mixte
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Méthode des k plus proches voisins
Échantillonnage (STT-2000)
LES NOMBRES PREMIERS ET COMPOSÉS
Le 14 décembre 2007 CONCEVOIR ET METTRE EN ŒUVRE UN DISPOSITIF DE RECHERCHE Recherche appliquée et recherche fondamentale Séverine Halimi-Falkowicz Docteur.
TECHNIQUES QUANTITATIVES APPLIQUEES A LA FINANCE
Réseaux de neurones.
Introduction aux plans dexpériences P. Lambert Daprès J.-M. Fuerbringer, Design of Experiments, Mai 2006.
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
Mémoires associatives
Chapitre 7 Réseau ART.
Synthèse Applications des réseaux de neurones en reconnaissance de formes et en vision par ordinateur.
Représentation des systèmes dynamiques dans l’espace d’état
Courbes de Bézier.
La corrélation et la régression multiple
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Gilbert TOUT NEST QUE CALCUL Vous vous êtes certainement déjà demandé ce que voulait dire « se donner à 100% » ?
LES ERREURS DE PRÉVISION e t = X t - P t X1X2X3X4 X5 X6…X1X2X3X4 X5 X6…X1X2X3X4 X5 X6…X1X2X3X4 X5 X6… P5P6P5P6P5P6P5P6 e5e6e5e6e5e6e5e6.
SUJET D’ENTRAINEMENT n°4
Paramètres génétiques des courses d’endurance D’après A. Ricard et M
Modélisation géométrique de base
ASI 3 Méthodes numériques pour l’ingénieur
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
SUJET D’ENTRAINEMENT n°1
Coupes efficaces pour la relaxation lagrangienne
Antennes-BIE à surface combinée
1 Modèle pédagogique d’un système d’apprentissage (SA)
1 - Programme de Seconde (juin 2009) Statistique et probabilités
Probabilités et Statistiques
CONSEQUENCES PRATIQUES EFFET DU TOUCHER SUR LA REQUÊTE
1 Une méthode itérative pour l'unfolding des données expérimentales, stabilisée dynamiquement(*) Bogdan MALAESCU LAL LLR 28/09/2009 (*arxiv: )
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Rappels de statistiques descriptives
Concepts fondamentaux: statistiques et distributions
Transcription de la présentation:

Habilitation à Diriger des Recherches Université de Provence Aix-Marseille I Marseille -2011 Quelques Modèles et Méthodes pour l’Etude de la Cognition Dossier présenté pour l’obtention d’une Habilitation à Diriger des Recherches par Pierre Courrieu Chargé de Recherche au CNRS Laboratoire de Psychologie Cognitive - UMR 6146 Centre National de la Recherche Scientifique 1

Jury Professeur Hervé Glotin (rapporteur) Docteur Jonathan Grainger (président) Docteur Ronald Peereman (rapporteur) Professeur Laurent Pezard (examinateur) Docteur Arnaud Rey (rapporteur) Docteur Simon Thorpe (examinateur) 2

Travaux présentés . Perception des lettres Courrieu & De Falco (1989); Courrieu, Farioli, & Grainger (2004) . Modèles de codage de données Courrieu (2001, 2002) . Modèles de codage d’images Courrieu (2006, 2007) . Réseaux de neurones et apprentissage supervisé Courrieu (2005) . Méthodes de calcul des paramètres de modèles Courrieu (1994, 1997, 2009) . Méthodes de validation de modèles et bases de données Rey et al. (2009); Rey & Courrieu (2010) * Courrieu, Brand-D’Abrescia, Peereman, Spieler, & Rey (2011) 3

Publications récentes . Dans la catégorie « modèles »: * Courrieu, P. (2011). Quick approximation of bivariate functions. British Journal of Mathematical and Statistical Psychology, in press. . Dans la catégorie « méthodes »: Courrieu, P., & Rey, A. (2011). Missing data imputation and corrected statistics for large-scale behavioral databases. Behavior Research Methods, 43, 310-330. 4

. Critères usuels de sélection de modèles (AIC, BIC, Bayes Factor) Courrieu, Brand-d’Abrescia, Peereman, Spieler, & Rey (2011) Validated intraclass correlation statistics to test item performance models Behavior Research Methods, 43(1), 37-55 . Critères usuels de sélection de modèles (AIC, BIC, Bayes Factor) = Sélectionner un ‘gagnant’ parmi des modèles concurrents Mais cela ne dit pas si un modèle rend convenablement compte des observations. . Variance des données = part systématique + part aléatoire Part systématique = part de variance dont les modèles peuvent rendre compte 5

Sujet 1 Sujet 2 … Sujet n Moyennes par item Item 1 X(1,1) X(1, 2) 6 Quelle est la part de variance reproductible dans le vecteur M des moyennes par item ? Sujet 1 Sujet 2 … Sujet n Moyennes par item Item 1 X(1,1) X(1, 2) X(1, n) M(1) Item 2 X(2, 1) X(2, 2) X(2, n) M(2) Item m X(m, 1) X(m, 2) X(m, n) M(m)

. Si la mesure expérimentale X peut se décomposer en: X(i,j) =   (j)  (i)  (i,j), 1≤i≤m, 1≤j≤n,  = moyenne générale  = effet sujet  = effet item  = effet aléatoire le vecteur M (moyennes par item) contient une part de variance reproductible égale au coefficient de corrélation intraclasse (ICC):  = nq / (nq + 1), avec: q = Var()/Var(). . Estimation de l’ICC, avec i.c., par analyse de la variance. . Le test ECVT (Courrieu et al., 2011) permet de savoir si une base de données quelconque est conforme à ce modèle. 7

8 La conformité au modèle a été vérifiée pour plusieurs bases de données (Rey et al., 2009; Rey & Courrieu, 2010; Courrieu et al., 2011)

9 Soit B une variable prédictive exacte, à une transformation linéaire près, c’est-à-dire telle que: B = a + b, avec a ≠ 0, Alors on peut montrer que: r2(M,B)   , où  est l’ICC des données. Par ailleurs: si r2 <  (significativement): sous-ajustement = modèle insuffisant si r2 >  (significativement): sur-ajustement = le modèle ajuste du bruit des données (car il utilise trop de paramètres libres).

10 Intersection du carré de corrélation avec l’intervalle de confiance (99%) de l’ICC au voisinage du modèle exact (comp. 20)

11 Fréquence de détection des sous-ajustements et sur-ajustements en fonction de l’écart au modèle exact (complexité 20).

. Apprentissage de fonctions booléennes ou continues 12 Courrieu (2011) - Quick approximation of bivariate functions. British J. Mathematical & Statistical Psychology, in press . Apprentissage de fonctions booléennes ou continues = acquisition d’une expertise . Mais nous savons aussi estimer des fonctions rapidement et sans aucun apprentissage spécifique = « degré zéro » de l’expertise Comment procédons-nous?

13 Exemple: quelle sera la température à Montélimar ?

14 Présentation d’un problème (Expérience 1)

15 Problèmes et réponses moyennes (± 2.2) de 16 sujets

16 Performances prédictives de 11 modèles (pour l’ensemble des 16 problèmes) Model r2 AIC BIC Bayes Factor (≥3.2: substantial) Nearest Neighbor Lipschitz Interpolator Gaussian RBFN Phi NN (Courrieu, 2005) Hardy Multiquadric Radial Spline Multilayer Perceptron Cascade Correlation NN Shepard (1968) Quadratic Polynomial ABI (Courrieu, 2011) 0.705 0.725 0.838 0.775 0.383 0.819 0.737 0.828 0.576 0.950 28.86 22.50 25.09 12.28 23.08 793.95 14.43 53.88 19.86 147.91 8.00 148.69 9.54 >1000 652 3.94 871 11.53 174.16 1 Human responses’ ICC .999 confidence interval 0.985 [0.959, 0.997]

17 Surfaces de généralisation de 4 modèles (données Extrapolation 1)

Un choix optimal des valeurs des fonctions poids donne: 18 Expression du modèle inconnu par des fonctions de pondération des données X Un choix optimal des valeurs des fonctions poids donne: r2 = 0.976  [0.959, 0.997]

19 Valeurs des fonctions poids sur un problème d’extrapolation

20 Valeurs des fonctions poids sur un problème d’interpolation

f1,2 f2 f1 x x2 x1 Approximation linéaire: 21 Comment estimer la fonction en un point (X) étant données ses valeurs (f1 et f2) en deux autres points (X1 et X2) ? . Approximation linéaire: f1,2 f2 f1 x x2 x1

22 Comment choisir des bipoints appropriés ? L’extériorité ℰ(X,Xi,Xj) est la distance du point X au point le plus proche du segment joignant Xi et Xj (Courrieu, 1994) Un pavage de Voronoi est construit par le système visuel (Dry, 2008). Il est induit par la distance de X à son plus proche voisin connu: d0(X) = mink d(X,Xk) La pertinence d’un bipoint (Xi,Xj) dont les extrémités sont voisines dans le pavage de Voronoi est donnée par: ij(X)=exp(-(ℰ(X,Xi,Xj)/d0(X))) Sa probabilité d’échantillonnage est donnée par la règle de Luce (1977): pij(X) = ij(X) / k,lkl(X).

23 Production des réponses de généralisation Etant donné un point de généralisation X, échantillonner (avec remise) N bipoints suivant leurs probabilités, et faire la moyenne des approximations linéaires obtenues au point X. L’espérance et la variance de la réponse sont: E(f(X)) = ij pij(X) fij(X) Var(f(X)) = ij pij(X) (fij(X) - E(f(X)))2 / N où N est en fait une variable aléatoire entière non modélisée pour le moment.

24 Surfaces de généralisation du modèle ABI

25 Performances prédictives du modèle ABI Réponses moyennes r = 0.975, r2 = 0.950  [0.959,0.997] Conclusion: Sous-ajustement significatif, mais proche d’une solution acceptable. Dispersions (S.D.) r = 0.653, p<.01 (N=1 fixé) r = 0.978, p<.001 (2≤N≤10, mode=4, estimé)

26 Notations financières de dettes souveraines 2010 « The Big Three » Country Dagong Moody’s Standard & Poor’s Fitch Ratings China Saudi Arab Russia Brazil India Indonesia Venezuela Argentina Canada Netherlands Germany U.S. U.K. France Belgium Spain Israel Italy Thailand Mexico Romania Iceland Greece Philippine 1 2 5 6 8 9 10 14 3 4 11 13 7 15 12

Pour qui sont les boulets des Trois Grâces? 27 Dagong and « The Big Three » Notations souveraines de 24 pays par Moody’s, Standard & Poor’s, et Fitch Ratings ICC= 0.995 (i.c. 99.9%: [0.983, 0.999]) Comparaison des notations par Dagong (agence chinoise) r2 = 0.789 (r2/ICC = 0.793) Pour qui sont les boulets des Trois Grâces? … Et pour qui celui du Dragon?