La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Package JADE : Analyse en composantes principales (ACI)

Présentations similaires


Présentation au sujet: "Package JADE : Analyse en composantes principales (ACI)"— Transcription de la présentation:

1 Package JADE : Analyse en composantes principales (ACI)
Objectif de l’ACI : Identifier les sources de signal indépendantes qui sont mélangées Mélange des sources ACI

2 ACI : Problème du « Cocktail party »
Source 1 Source 2 Conditions d’application : Au moins autant de capteurs qu’il y a de sources. Au maximum une source qui a un signal dont la distribution est normale. Source 3 Source 4 (Source :

3 ACI : Démonstration Signal mixte 1 Signal mixte 3 Signal mixte 2 Signal mixte 4

4 ACI : Démonstration Signal mixte 1 ACI comp 1 Signal mixte 2
(Source :

5 ACI : Principes statistiques
Signal mixte 1 Signal mixte 2 Signal mixte n {n lignes ; n composants} Sources indépendantes ACI m données Coefficients de mixage {n composants ; m colonnes} X = S A’

6 ACI : Principes statistiques
Même principe que l’ACP, mais diffère par la manière de décomposer la matrice initiale.  L’ACI maximise l’indépendance entre les différents composants. Différents algorithmes existent pour maximiser cette indépendance : Minimization-of-Mutual information (MMI) : maximum entropy non-Gaussianity : kurtosis, negentropy

7 ACI : Application à la biologie
Hypothèse d’application de l’ACI : Bio-process 2 Bio-process 1 ++ - - - Condition biologique Gène Sources Signal mixte Individu 1 {Bio-process ; Bio-process 2 -} {G1 ++ ; G2 + ; G3 - -; G4 - ; G } Individu 2 {Bio-process 1 ++ ; Bio-process 2 - -} {G1 + ; G2 ++ ; G3 -; G4 - - ; G5 - -} Individu n {Bio-process ; Bio-process 2 - -} {G1 +++ ; G2 0 ; G ; G4 0 ; G5 - } Inconnu Observé ACI

8 ACI : Application à la biologie
Différences avec l’ACP : 1°) L’analyse en composantes principales ne fournit aucune hiérarchie entre les composants : Si l’on demande n composants puis (n+1) composants, on ne retrouvera pas exactement les n premiers composants parmi l’analyse qui nous en fournit (n+1). Conséquence : Il est important de savoir combien de composants on doit demander à l’ACI Combien de processus biologiques majeures sont en jeu dans un système biologique placé sous une certaine condition ???

9 ACI : Application à la biologie
Différences avec l’ACP : 2°) Il n’y a pas de contraintes d’orthogonalité entre les différents composants de l’ACI Conséquence : L’ACI peut donner une description plus précise du nuage de points multidimensionnels

10 Exemple sur un jeu de données réelles :
ACP

11 Exemple sur un jeu de données réelles :
ACI Analyse David sur les 200 sondes les plus contributrices de ce composant :

12 Exemple sur un jeu de données réelles :
ACI Analyse David sur les 200 sondes les plus contributrices de ce composant :

13 ACI vs ACP Présentation des données simulées : - microarray avec sondes - 2 X 4 échantillons : {M1_C1 ; F1_C1 ; F2_C1 ; F3_C1} vs {M1_C2 ; F1_C2 ; F2_C2 ; F3_C2} - Simulations de 1000 sondes DE entre les conditions C1 et C2 ( à l’origine, aucune) - Simulations de n sondes DE chez les individus M vs F On va comparer les performances de l’ACP et de l’ACI sur sa capacité à identifier les sondes qui contribuent à la séparation entre {C1;C2} et {M;F}. On va faire varier 2 paramètres : - le # de sondes DE entre M et F (n varie entre 20 et 1000) - l’intensité du différentiel entre M et F (logFC 1 à 9) Pour chacune des combinaisons (n;logFC), on sélectionne l’axe/le composant qui comprend le plus grand nombre de sondes que l’on a simulé différentiel. Pour les 1000 plus contributrices du composant sélectionné pour {C1;C2} (n pour {M;F}), on calcule le % de sondes qui font partie de celles que l’on a simulé.

14 logFC M vs F % sondes simulées parmi les plus contributrices # sondes DE M vs F

15 L’ACI est plus sensible que l’ ACP avec un nombre de sondes différentielles faible :

16 Quelque soit les différentiels appliqués sur {M;F}, l’ACI est stable et 100% exacte sur la comparaison {C1;C2}

17 ACP : quel est l’axe qui sépare C1 et C2 ?

18 ACI : sans ambiguïté

19 Que se passe-t-il quand on mixe sur une certaine proportion de sondes différentielles {C1;C2] et {M;F} ?

20

21

22 (Package de visualisation et d’animation 3D : rgl)

23 ACI : Implémentations sous R
Package FastICA : Le plus populaire – Nécessite de moyenner plusieurs lancements (initialisation au hasard) Package JADE : Reproductible entre 2 lancements (initialisation par ACP) Package PearsonICA Script R RADICAL : (non paramétrique à la différence de FastICA et JADE) #Mise en œuvre avec JADE > dim(tab) [1] > > library(JADE) > aci=JADE(tab,n.comp=6,eps= 1/(100*sqrt(ncol(tab))),maxiter=1000) > names(aci) [1] "A" "W" "S" "Xmu" > dim(aci$S) [1] > dim(aci$A) [1] 8 6

24 ACI : Applications Analyse de données d’electro-encéphalogrammes Analyse d’image Analyse de données biologique haut débit (Bio-marker) Analyse de données NMR, métabolomiques :


Télécharger ppt "Package JADE : Analyse en composantes principales (ACI)"

Présentations similaires


Annonces Google