Habilitation à Diriger des Recherches

Slides:

Advertisements

Présentations similaires

La Méthode de Simplexe Standardisation

Advertisements

Fabrice Lauri, François Charpillet, Daniel Szer

Licence pro MPCQ : Cours

Distance inter-locuteur

Les déterminants des investissements des salariés dans les FCPE d’Actionnariat Salarié Monsieur le Président, messieurs les membres du jury, je vous remercie.

Classification et prédiction

Calcul géométrique avec des données incertaines

LE CALCUL LITTÉRAL AU COLLÈGE

La pensée critique en Mathématiques Module 1 Les racines carrées et le théorème de Pythagore 8e année Par Tina Noble.

C1 Bio-statistiques F. KOHLER

Inférence statistique

1. Les caractéristiques de dispersion. 11. Utilité.

Page : 1 / 6 Conduite de projet Examen du 13 mai 2002 Durée : 3h30mn Le support de cours et les notes sont nécessaires La notation tiendra compte très.

A Pyramid Approach to Subpixel Registration Based on Intensity

Auteurs : P. Hellier C. Barillot E. Mémin P.Pérez

1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.

Maria-João Rendas CNRS – I3S Novembre 2006

SYMETRIE CENTRALE OU SYMETRIE PAR RAPPORT A UN POINT.

LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.

Estimation de la survie comparaison des courbes de survie FRT C3.

Modélisation et commande hybrides d’un onduleur multiniveaux monophasé

Fusion de données SENSO

Analyse de la variance à un facteur

1 Analyse de la variance multivariée Michel Tenenhaus.

Modèle Linéaire Généralisé (Proc Genmod)

La perception subjective de la corrélation dans les nuages de points

DEA instrumentation et commande

Christelle Scharff IFI 2004

Application des algorithmes génétiques

Dynamique dopinions sur réseaux Amblard F.*, Deffuant G.* *C emagref-LISC.

Système coopératif pour l'aide à la conduite

Pourquoi les réseaux de neurones de type « perceptron multicouche » conviennent-ils à l’apprentissage Stéphane Canu, INSA de Rouen , PSI André Elisseeff,

Etude longitudinale d’essais multilocaux: apports du modèle mixte

Cours Corporate finance Eléments de théorie du portefeuille Le Medaf

Méthode des k plus proches voisins

Échantillonnage (STT-2000)

LES NOMBRES PREMIERS ET COMPOSÉS

Le 14 décembre 2007 CONCEVOIR ET METTRE EN ŒUVRE UN DISPOSITIF DE RECHERCHE Recherche appliquée et recherche fondamentale Séverine Halimi-Falkowicz Docteur.

TECHNIQUES QUANTITATIVES APPLIQUEES A LA FINANCE

Réseaux de neurones.

Introduction aux plans dexpériences P. Lambert Daprès J.-M. Fuerbringer, Design of Experiments, Mai 2006.

1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]

Mémoires associatives

Chapitre 7 Réseau ART.

Synthèse Applications des réseaux de neurones en reconnaissance de formes et en vision par ordinateur.

Représentation des systèmes dynamiques dans l’espace d’état

Courbes de Bézier.

La corrélation et la régression multiple

La corrélation et la régression

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.

Les modèles linéaires (Generalized Linear Models, GLM)

Corrélation Principe fondamental d’une analyse de corrélation

Gilbert TOUT NEST QUE CALCUL Vous vous êtes certainement déjà demandé ce que voulait dire « se donner à 100% » ?

LES ERREURS DE PRÉVISION e t = X t - P t X1X2X3X4 X5 X6…X1X2X3X4 X5 X6…X1X2X3X4 X5 X6…X1X2X3X4 X5 X6… P5P6P5P6P5P6P5P6 e5e6e5e6e5e6e5e6.

SUJET D’ENTRAINEMENT n°4

Paramètres génétiques des courses d’endurance D’après A. Ricard et M

Modélisation géométrique de base

ASI 3 Méthodes numériques pour l’ingénieur

Régression linéaire multiple : hypothèses & interprétation. Partie 2.

SUJET D’ENTRAINEMENT n°1

Coupes efficaces pour la relaxation lagrangienne

Antennes-BIE à surface combinée

1 Modèle pédagogique d’un système d’apprentissage (SA)

1 - Programme de Seconde (juin 2009) Statistique et probabilités

Probabilités et Statistiques

CONSEQUENCES PRATIQUES EFFET DU TOUCHER SUR LA REQUÊTE

1 Une méthode itérative pour l'unfolding des données expérimentales, stabilisée dynamiquement(*) Bogdan MALAESCU LAL LLR 28/09/2009 (*arxiv: )

ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage

Rappels de statistiques descriptives

Concepts fondamentaux: statistiques et distributions

Transcription de la présentation:

Habilitation à Diriger des Recherches Université de Provence Aix-Marseille I Marseille -2011 Quelques Modèles et Méthodes pour l’Etude de la Cognition Dossier présenté pour l’obtention d’une Habilitation à Diriger des Recherches par Pierre Courrieu Chargé de Recherche au CNRS Laboratoire de Psychologie Cognitive - UMR 6146 Centre National de la Recherche Scientifique 1

Jury Professeur Hervé Glotin (rapporteur) Docteur Jonathan Grainger (président) Docteur Ronald Peereman (rapporteur) Professeur Laurent Pezard (examinateur) Docteur Arnaud Rey (rapporteur) Docteur Simon Thorpe (examinateur) 2

Travaux présentés . Perception des lettres Courrieu & De Falco (1989); Courrieu, Farioli, & Grainger (2004) . Modèles de codage de données Courrieu (2001, 2002) . Modèles de codage d’images Courrieu (2006, 2007) . Réseaux de neurones et apprentissage supervisé Courrieu (2005) . Méthodes de calcul des paramètres de modèles Courrieu (1994, 1997, 2009) . Méthodes de validation de modèles et bases de données Rey et al. (2009); Rey & Courrieu (2010) * Courrieu, Brand-D’Abrescia, Peereman, Spieler, & Rey (2011) 3

Publications récentes . Dans la catégorie « modèles »: * Courrieu, P. (2011). Quick approximation of bivariate functions. British Journal of Mathematical and Statistical Psychology, in press. . Dans la catégorie « méthodes »: Courrieu, P., & Rey, A. (2011). Missing data imputation and corrected statistics for large-scale behavioral databases. Behavior Research Methods, 43, 310-330. 4

. Critères usuels de sélection de modèles (AIC, BIC, Bayes Factor) Courrieu, Brand-d’Abrescia, Peereman, Spieler, & Rey (2011) Validated intraclass correlation statistics to test item performance models Behavior Research Methods, 43(1), 37-55 . Critères usuels de sélection de modèles (AIC, BIC, Bayes Factor) = Sélectionner un ‘gagnant’ parmi des modèles concurrents Mais cela ne dit pas si un modèle rend convenablement compte des observations. . Variance des données = part systématique + part aléatoire Part systématique = part de variance dont les modèles peuvent rendre compte 5

Sujet 1 Sujet 2 … Sujet n Moyennes par item Item 1 X(1,1) X(1, 2) 6 Quelle est la part de variance reproductible dans le vecteur M des moyennes par item ? Sujet 1 Sujet 2 … Sujet n Moyennes par item Item 1 X(1,1) X(1, 2) X(1, n) M(1) Item 2 X(2, 1) X(2, 2) X(2, n) M(2) Item m X(m, 1) X(m, 2) X(m, n) M(m)

. Si la mesure expérimentale X peut se décomposer en: X(i,j) =   (j)  (i)  (i,j), 1≤i≤m, 1≤j≤n,  = moyenne générale  = effet sujet  = effet item  = effet aléatoire le vecteur M (moyennes par item) contient une part de variance reproductible égale au coefficient de corrélation intraclasse (ICC):  = nq / (nq + 1), avec: q = Var()/Var(). . Estimation de l’ICC, avec i.c., par analyse de la variance. . Le test ECVT (Courrieu et al., 2011) permet de savoir si une base de données quelconque est conforme à ce modèle. 7

8 La conformité au modèle a été vérifiée pour plusieurs bases de données (Rey et al., 2009; Rey & Courrieu, 2010; Courrieu et al., 2011)

9 Soit B une variable prédictive exacte, à une transformation linéaire près, c’est-à-dire telle que: B = a + b, avec a ≠ 0, Alors on peut montrer que: r2(M,B)   , où  est l’ICC des données. Par ailleurs: si r2 <  (significativement): sous-ajustement = modèle insuffisant si r2 >  (significativement): sur-ajustement = le modèle ajuste du bruit des données (car il utilise trop de paramètres libres).

10 Intersection du carré de corrélation avec l’intervalle de confiance (99%) de l’ICC au voisinage du modèle exact (comp. 20)

11 Fréquence de détection des sous-ajustements et sur-ajustements en fonction de l’écart au modèle exact (complexité 20).

. Apprentissage de fonctions booléennes ou continues 12 Courrieu (2011) - Quick approximation of bivariate functions. British J. Mathematical & Statistical Psychology, in press . Apprentissage de fonctions booléennes ou continues = acquisition d’une expertise . Mais nous savons aussi estimer des fonctions rapidement et sans aucun apprentissage spécifique = « degré zéro » de l’expertise Comment procédons-nous?

13 Exemple: quelle sera la température à Montélimar ?

14 Présentation d’un problème (Expérience 1)

15 Problèmes et réponses moyennes (± 2.2) de 16 sujets

16 Performances prédictives de 11 modèles (pour l’ensemble des 16 problèmes) Model r2 AIC BIC Bayes Factor (≥3.2: substantial) Nearest Neighbor Lipschitz Interpolator Gaussian RBFN Phi NN (Courrieu, 2005) Hardy Multiquadric Radial Spline Multilayer Perceptron Cascade Correlation NN Shepard (1968) Quadratic Polynomial ABI (Courrieu, 2011) 0.705 0.725 0.838 0.775 0.383 0.819 0.737 0.828 0.576 0.950 28.86 22.50 25.09 12.28 23.08 793.95 14.43 53.88 19.86 147.91 8.00 148.69 9.54 >1000 652 3.94 871 11.53 174.16 1 Human responses’ ICC .999 confidence interval 0.985 [0.959, 0.997]

17 Surfaces de généralisation de 4 modèles (données Extrapolation 1)

Un choix optimal des valeurs des fonctions poids donne: 18 Expression du modèle inconnu par des fonctions de pondération des données X Un choix optimal des valeurs des fonctions poids donne: r2 = 0.976  [0.959, 0.997]

19 Valeurs des fonctions poids sur un problème d’extrapolation

20 Valeurs des fonctions poids sur un problème d’interpolation

f1,2 f2 f1 x x2 x1 Approximation linéaire: 21 Comment estimer la fonction en un point (X) étant données ses valeurs (f1 et f2) en deux autres points (X1 et X2) ? . Approximation linéaire: f1,2 f2 f1 x x2 x1

22 Comment choisir des bipoints appropriés ? L’extériorité ℰ(X,Xi,Xj) est la distance du point X au point le plus proche du segment joignant Xi et Xj (Courrieu, 1994) Un pavage de Voronoi est construit par le système visuel (Dry, 2008). Il est induit par la distance de X à son plus proche voisin connu: d0(X) = mink d(X,Xk) La pertinence d’un bipoint (Xi,Xj) dont les extrémités sont voisines dans le pavage de Voronoi est donnée par: ij(X)=exp(-(ℰ(X,Xi,Xj)/d0(X))) Sa probabilité d’échantillonnage est donnée par la règle de Luce (1977): pij(X) = ij(X) / k,lkl(X).

23 Production des réponses de généralisation Etant donné un point de généralisation X, échantillonner (avec remise) N bipoints suivant leurs probabilités, et faire la moyenne des approximations linéaires obtenues au point X. L’espérance et la variance de la réponse sont: E(f(X)) = ij pij(X) fij(X) Var(f(X)) = ij pij(X) (fij(X) - E(f(X)))2 / N où N est en fait une variable aléatoire entière non modélisée pour le moment.

24 Surfaces de généralisation du modèle ABI

25 Performances prédictives du modèle ABI Réponses moyennes r = 0.975, r2 = 0.950  [0.959,0.997] Conclusion: Sous-ajustement significatif, mais proche d’une solution acceptable. Dispersions (S.D.) r = 0.653, p<.01 (N=1 fixé) r = 0.978, p<.001 (2≤N≤10, mode=4, estimé)

26 Notations financières de dettes souveraines 2010 « The Big Three » Country Dagong Moody’s Standard & Poor’s Fitch Ratings China Saudi Arab Russia Brazil India Indonesia Venezuela Argentina Canada Netherlands Germany U.S. U.K. France Belgium Spain Israel Italy Thailand Mexico Romania Iceland Greece Philippine 1 2 5 6 8 9 10 14 3 4 11 13 7 15 12

Pour qui sont les boulets des Trois Grâces? 27 Dagong and « The Big Three » Notations souveraines de 24 pays par Moody’s, Standard & Poor’s, et Fitch Ratings ICC= 0.995 (i.c. 99.9%: [0.983, 0.999]) Comparaison des notations par Dagong (agence chinoise) r2 = 0.789 (r2/ICC = 0.793) Pour qui sont les boulets des Trois Grâces? … Et pour qui celui du Dragon?