La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Analyse discriminante sur données fonctionnelles

Présentations similaires


Présentation au sujet: "Analyse discriminante sur données fonctionnelles"— Transcription de la présentation:

1 Analyse discriminante sur données fonctionnelles
Gilbert Saporta Chaire de Statistique Appliquée & CEDRIC Conservatoire National des Arts et Métiers 292 rue Saint Martin F Paris Cedex 03

2 Plan 1. Introduction 2. Régression MCO sur données fonctionnelles
3. Régression PLS fonctionnelle 4. Méthodes linéaires de discrimination 5. Prédiction anticipée 6. Conclusion et perspectives Travaux réalisés en collaboration avec C.Preda(Univ. Lille2) et D.Costanzo (Univ.Calabria) CNAM, 18 juin 2008

3 1. Introduction Données fonctionnelles: courbes ou trajectoires d’un processus stochastique Xt Réponse Y Y numérique: régression Y catégorielle: classification supervisée, discrimination Intervalle de temps commun [0;T], variables centrées CNAM, 18 juin 2008

4 Régression sur données fonctionnelles
Exemple 1: Y= récolte Xt = température p=  R.A.Fisher (1924) CNAM, 18 juin 2008

5 Données de très grande dimension: infinité non dénombrable (en principe..) de prédicteurs
Combinaison linéaire « Integral regression » Au lieu d’une somme finie CNAM, 18 juin 2008

6 R.A.Fisher « The Influence of Rainfall on the Yield of Wheat at Rothamsted » Philosophical Transactions of the Royal Society, B, 213, (1924) CNAM, 18 juin 2008

7 Discrimination sur données fonctionnelles
Exemple 2: courbes de pétrissage pour biscuits (Danone Vitapole) CNAM, 18 juin 2008

8 Après lissage par B-splines cubiques (Lévéder & al, 2004)
Comment prédire la qualité des biscuits? CNAM, 18 juin 2008

9 Discrimination sur données fonctionnelles
Cas particulier de la régression sur données fonctionnelles pour deux classes Anticipation déterminer t*<T tel que l’analyse sur [0;t*] donne des prédictions semblables à l’analyse sur [0;T] CNAM, 18 juin 2008

10 2. Régression sur données fonctionnelles
Y ; Xt (E(Y)=E(Xt) =0 ) 2.1 Les mco Equations normales ou de Wiener-Hopf: C(t,s)= cov(Xt, Xs)=E(XtXs) CNAM, 18 juin 2008

11 2.2 décomposition de Karhunen-Loeve
facteurs: Composantes principales: Covariance avec une composante principale: CNAM, 18 juin 2008

12 Theorème de Picard:  unique si et seulement si:
Généralement faux ... Surtout quand n est fini car p >n. Ajustement parfait en minimisant: CNAM, 18 juin 2008

13 Même quand  est unique, « L’équation de Wiener-Hopf n’est pas une équation intégrale ordinaire mais un accouplement entre fonction et distribution dont la solution est plus souvent une distribution qu’une fonction » Paul Kree, 1972 Nécessité de contraintes. (cf Green & Silverman 1994, Ramsay & Silverman 1997). CNAM, 18 juin 2008

14 Approximation de rang q:
2.3 Régression sur composantes principales Approximation de rang q: CNAM, 18 juin 2008

15 Résolution numérique:
Equations intégrales non explicites dans le cas général: C(t,s) connu point par point Fonctions en escalier: nombre fini de variables et d’individus: opérateurs matriciels mais de grande taille Approximations par discrétisation du temps CNAM, 18 juin 2008

16 Quelles composantes? Les q premières? Les q plus corrélées? Les composantes principales sont calculées sans tenir compte de la réponse Y CNAM, 18 juin 2008

17 3. Régression PLS fonctionnelle
Utiliser les composantes PLS au lieu des composantes principales Première composante PLS : Puis itération sur les résidus CNAM, 18 juin 2008

18 Approximation de Y par Xt d’ordre q:
Convergence : Mais q doit être fini pour avoir une formule! q déterminé par validation croisée (Preda & Saporta, 2005) CNAM, 18 juin 2008

19 Pas d’équation intégrale Meilleur ajustement par PLS que par ACP:
Première composante PLS facilement interprétable: coefficients du même signe que r(y;xt) Pas d’équation intégrale Meilleur ajustement par PLS que par ACP: (De Jong 1993) CNAM, 18 juin 2008

20 4. Discrimination linéaire
4.1 ADL fonctionnelle ADL : combinaison linéaire maximisant le rapport variance inter/variance intra Pour 2 groupes la FLD de Fisher s’obtient en régressant Y codé sur Xt eg (Preda & Saporta, 2005a) CNAM, 18 juin 2008

21 La régression PLS avec q composantes donne une approximation de β(t) et du score:
CNAM, 18 juin 2008

22 4.3 Mesures de qualité Pour k=2 : courbe ROC et AUC
Pour un seuil s , x est classé en 1 si dT(x)>s Sensibilité ou taux de vrais positifs: P(dT(x)>s/Y=1)=1-β 1- Spécificité ou 1-taux de vrais négatifs: P(dT(x)>s/Y=0)= CNAM, 18 juin 2008

23 Courbe ROC En cas de discrimination parfaite :
courbe confondue avec les côtés du carré Si distribution conditionnelles identiques, courbe confondue avec la diagonale CNAM, 18 juin 2008

24 Courbe ROC invariante pour toute transformation monotone croissante
Surface sous la courbe: mesure de performance permettant de comparer (partiellement) des modèles On tire une obs de G1 et une de G2 AUC estimée par la proportion de paires concordantes nc statistique de Wilcoxon-Mann-Whitney U+W= n1n2+0.5n1(n1+1) AUC=U/n1n2 CNAM, 18 juin 2008

25 4. Prédiction anticipée Chercher t*<T tel que l’analyse sur [0;t*]donne des prédictions semblables à l’analyse sur [0;T] Solution: En augmentant s depuis 0 , chercher la première valeur telle que AUC(s) ne diffère pas significativement de AUC(T) CNAM, 18 juin 2008

26 Test d’égalité via une procédure bootstrap
Rééchantillonnage des données, stratifié pour conserver les proportions des classes A chaque réplication b on calcule AUCb(s) et AUCb(T) Test basé sur les différences (Student ou Wilcoxon pour données appariées) b=AUCb(s)- AUCb(T) CNAM, 18 juin 2008

27 5.Applications 5.1 Données simulées Deux classes équiprobables
W(t) brownien standard CNAM, 18 juin 2008

28 CNAM, 18 juin 2008

29 Avec B=50 CNAM, 18 juin 2008

30 5.2 Courbes de pétrissage Après un temps T= 480 de pétrissage on fabrique des biscuits de qualité Y 115 observations dont 50 « bonnes », 40 «mauvaises » et 25 « ajustables » 241 points de mesure équidistants Lissage avec B-splines cubiques , 16 nœuds CNAM, 18 juin 2008

31 Performances pour Y={bon,mauvais}
100 séparations apprentissage test (60, 30) Taux d’erreur moyen 0.142 avec composantes principales 0.112 avec composantes PLS AUC moyen 0.746 Fonction β(t) CNAM, 18 juin 2008

32 Il est donc possible de réduire de plus de moitié la durée d’étude.
Prédiction anticipée Avec B=50 t*=186 Il est donc possible de réduire de plus de moitié la durée d’étude. CNAM, 18 juin 2008

33 6.Conclusions et perspectives
La régression PLS permet d’effectuer une prédiction linéaire de manière simple et efficace Nécessité de prétraitements pour données bruitées Prédiction anticipée via une procédure simple CNAM, 18 juin 2008

34 En cours: Recherche de prédiction « on-line »: adapter t* pour chaque nouvelle courbe Comparaison avec régression logistique PLS fonctionnelle et autres approches CNAM, 18 juin 2008

35 Références Aguilera A.M., Escabias, M. ,Valderrama M.J. (2006) Using principal components for estimating logistic regression with high-dimensional multicollinear data, Computational Statistics & Data Analysis, 50, Barker M., Rayens W. (2003) Partial least squares for discrimination. J. of Chemometrics 17:166–173 Charles, C., (1977) Régression typologique et reconnaissance des formes. Ph.D., Université Paris IX. D. Costanzo, C. Preda , G. Saporta (2006) Anticipated prediction in discriminant analysis on functional data for binary response . In COMPSTAT2006, p , Physica-Verlag Hennig, C., (2000) Identifiability of models for clusterwise linear regression. J. Classification 17, 273–296. Lévéder C., Abraham C., Cornillon P. A., Matzner-Lober E., Molinari N. (2004) Discrimination de courbes de pétrissage. Chimiometrie 2004, 37–43. Preda C. , Saporta G. (2005a) PLS regression on a stochastic process, Computational Statistics and Data Analysis, 48, Preda C. , Saporta G. (2005b) Clusterwise PLS regression on a stochastic process, Computational Statistics and Data Analysis, 49, Preda C., Saporta G., Lévéder C., (2007) PLS classification of functional data, Computational Statistics, 22(2), Ramsay J.O. , Silverman (1997) Functional data analysis, Springer CNAM, 18 juin 2008


Télécharger ppt "Analyse discriminante sur données fonctionnelles"

Présentations similaires


Annonces Google