La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Probabilité a priori Vraisemblance Probabilité a posteriori Facteur de normalisation (performance globale du modèle) Résumé cours précédent 1. Théorème.

Présentations similaires


Présentation au sujet: "Probabilité a priori Vraisemblance Probabilité a posteriori Facteur de normalisation (performance globale du modèle) Résumé cours précédent 1. Théorème."— Transcription de la présentation:

1 Probabilité a priori Vraisemblance Probabilité a posteriori Facteur de normalisation (performance globale du modèle) Résumé cours précédent 1. Théorème de Bayes 2. Méthodes de Monte Carlo: échantillonner la distribution a posteriori ~ (K = ) Probabilité a posteriori = fréquence d´apparition dans l ´échantillon

2 Chick A C C G A G A T Cat Fish Snail Fly Hydra Polyp A G C G A G C T A G G G A G A T A G G G A C A T A G G C A C A T A C G C A C A T A C C A A C A T Man Modèles stochastiques Bayésiens données : (D)hypothèse : (alignement)(phylogénie) modèle : (M) (processus d´évolution par accumulation de mutations)

3 E =-ln L burn in (discarded) sample Monte Carlo Markov chain (MCMC) For any topology T : ~ Chick Cat Fish Snail Fly Hydra Polyp Man posterior consensus

4 Réseaux Bayésiens Example introductif Définition Méthodes de Monte Carlo Problème inverse : apprendre la structure du réseau, à partir de données observées –problème n°1 : apprendre les lois locales –problème n°2 : apprendre la structure globale Application : réseaux de régulation génétique

5 Représenter les dépendances statistiques entre plusieurs variables essence bougies propres démarrage niveau réservoir

6 essence bougies propres démarrage niveau réservoir oui0.98 non0.02 oui0.96 non0.04 e = ouie = non b = oui0.99 / / 1 b = non0.01 / / 1 e = ouie = non plein mi-plein vide

7 Définition un ensemble de variables aléatoires Un réseau Bayésien est une représentation graphique de la distribution de probabilité conjointe Elle est caractérisée par deux éléments : 1. un graphe acyclique orienté (à n sommets) 2. n distributions conditionnelles oùest l´ensemble des parents de

8 Calcul de la distribution conjointe à partir du graphe Indépendances conditionnelles:...

9 Classe d´équivalence : indistinguabilité Théorème (Pearl et Verma, 1991): Deux Graphes acycliques orientés sont équivalents ssi : - ils sont sous-tendus par le même graphe non orienté - ils ont les mêmes v-structures Deux graphes sont équivalents si ils impliquent les mêmes indépendances conditionnelles

10 Classe d´équivalence : indistinguabilité Une classe d´équivalence peut être représentée de manière unique par un graphe acyclique partiellement orienté

11 Echantillonnage de Gibbs (Chaque admet pour valeurs possibles les entiers k=1..K).... Essayer toutes les valeurs possibles pour et recalculer la probabilité conjointe à chaque fois : Tirer une nouvelle valeur pour en fonction de ces probabilités

12 Echantillonnage de Gibbs Appliquer la même procédure à, puis,... jusqu´à... Recommencer un très grand nombre de fois (K=10 000) échantillon : avec distribué suivant la probabilité conjointe Par exemple:

13 Echantillonnage de Gibbs simplification des calculs...

14 Echantillonnage de Gibbs simplification des calculs...

15 Echantillonnage de Gibbs

16 Calcul de probabilités conditionnelles On connait la valeur des variables 26, 22, 16. Calculer alors la probabilité des différentes valeurs possibles pour 8

17 Calcul de probabilités conditionnelles Faire un Gibbs en laissant fixes les variables 26, 22, 16. Mesurer alors la fréquence des différentes valeurs observées en 8 asymptotiquement égales aux probabilités recherchées

18 Problème inverse : Inférer les lois conditionnelles locales Données: structure du réseau (G) + table d´observations (D) Inconnues à estimer: lois de probabilités locales (G)(D)

19 Lois conditionnelles locales pour les réseaux binaires (Chaque admet pour valeurs possibles 0 ou 1) Nombres de paramètres à déterminer: : ensemble des paramètres du réseau

20 Rappel : tirage à pile ou face : probabilité de tirer pile à un tirage donné : données observées (10 piles et 5 faces) Estimation rapide (efficace si beaucoup d´observations) : Inférence Bayésienne (incertitude mieux prise en compte) 0.66 Métropolis sur

21 Estimation rapide des lois conditionnelles locales

22 Inférence Bayésienne des paramètres du réseau Structure du réseau Table d´observations Paramètres du réseau

23 Algorithme de Metropolis 1. proposer modif 2. calculer 3. accepter avec une proba p=Min(1,a) si accepté : si refusé : 4. recommencer à partir de 2.

24 Classificateur Bayésien « naïf » C A1 A2An... Classe Attributs

25 Classificateur Bayésien « naïf » méthode d´apprentissage C A1 A2An... Classe Attributs ? ? Jeu d´apprentissage: A1A2...AnC item1 item2... Application des méthodes mentionnées auparavant

26 Classificateur Bayésien avec corrélations entre attributs C A1A2 An... Classe Attributs A3 Cas particulier: le graphe restreint aux attributs est un arbre.

27 Problème inverse général : inférer la structure du réseau ? Table d´observations Structure du réseau

28 Inférence Bayésienne de la structure du réseau Structure du réseau Table d´observations Paramètres du réseau (calculable analytiquement) Prior sur les réseaux possibles Uniforme : trop flexible Prior pénalisant les réseaux trop riches en liens

29 Inférence Bayésienne de la structure du réseau Structure du réseau Table d´observations Paramètres du réseau Données suffisamment riches pour inférer le réseau avec certitude: rechercher graphe G qui maximise (NP difficile) Sinon : Monte Carlo à travers l´espace des graphes, pour échantillonner la distribution a posteriori (calculable analytiquement)

30 Classe d´équivalence : indistinguabilité Théorème (Pearl et Verma, 1991): Deux Graphes acycliques orientés sont équivalents ssi : - ils sont sous-tendus par le même graphe non orienté - ils ont les mêmes v-structures Deux graphes sont équivalents si ils impliquent les mêmes indépendances conditionnelles

31 Classe d´équivalence : indistinguabilité Une classe d´équivalence peut être représentée de manière unique par un graphe acyclique partiellement orienté

32 Validation de la méthode par simulations

33 Cas réel : projets d´études supérieures SEX : sexe SES : statut socio-économique PE : encouragement parental IQ : quotient intellectuel CP : projets d´études supérieures

34 Application : inférer les réseaux de régulation génétique à partir des puces à ADN

35 Cycle cellulaire division synthèse d´ADN (duplication du génome)

36

37 Application : inférer les réseaux de régulation génétique à partir des puces à ADN Mesure de l´expression de 6177 gènes de la levure de boulanger 76 mesures au total: 6 séries temporelles sur cellules synchronisées Explorer les classes d´équivalence de réseaux de 6178 sommets sommets correspondant aux gènes analysés - 1 sommet supplémentaire : phase du cycle cellulaire (contraint comme racine du graphe) Méthode Monte Carlo Discrétisation des niveaux d´expression de chaque gène -1 : sous-exprimé 0 : normal + 1 : sur-exprimé

38 Estimation rapide des lois conditionnelles locales

39 Relations de Markov

40 Gènes dominants (en amont des autres)

41 Relations de Markov


Télécharger ppt "Probabilité a priori Vraisemblance Probabilité a posteriori Facteur de normalisation (performance globale du modèle) Résumé cours précédent 1. Théorème."

Présentations similaires


Annonces Google