Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
Résumé cours précédent
1. Théorème de Bayes Probabilité a posteriori Probabilité a priori Vraisemblance Facteur de normalisation (performance globale du modèle) 2. Méthodes de Monte Carlo: échantillonner la distribution a posteriori ~ (K = ) Probabilité a posteriori = fréquence d´apparition dans l ´échantillon
2
Modèles stochastiques
Bayésiens Chick A C C G A G A T Man A G C G A G C T Cat A G G G A G A T Fish A G G G A C A T Snail A G G C A C A T Fly A C G C A C A T Hydra A C C A A C A T Polyp A C C A A C A T hypothèse : données : (D) (phylogénie) (alignement) modèle : (M) (processus d´évolution par accumulation de mutations)
3
Monte Carlo Markov chain (MCMC)
E =-ln L For any topology T : burn in (discarded) sample 45 Chick 67 Man 78 Cat Fish ~ 90 Snail Fly 87 Hydra Polyp posterior consensus
4
Réseaux Bayésiens Example introductif Définition
Méthodes de Monte Carlo Problème inverse : apprendre la structure du réseau, à partir de données observées problème n°1 : apprendre les lois locales problème n°2 : apprendre la structure globale Application : réseaux de régulation génétique
5
Représenter les dépendances statistiques entre plusieurs variables
bougies propres essence niveau réservoir démarrage
6
bougies essence propres niveau réservoir démarrage oui 0.98 non 0.02
0.96 non 0.04 bougies propres essence niveau réservoir démarrage e = oui e = non plein 0.39 0.01 mi-plein 0.60 vide 0.98 e = oui e = non b = oui 0.99 / 0.01 0 / 1 b = non 0.01 / 0.99
7
Définition un ensemble de variables aléatoires
Un réseau Bayésien est une représentation graphique de la distribution de probabilité conjointe Elle est caractérisée par deux éléments : 1. un graphe acyclique orienté (à n sommets) 2. n distributions conditionnelles où est l´ensemble des parents de
8
Calcul de la distribution conjointe à partir du graphe
Indépendances conditionnelles: ...
9
Classe d´équivalence : indistinguabilité
Deux graphes sont équivalents si ils impliquent les mêmes indépendances conditionnelles Théorème (Pearl et Verma, 1991): Deux Graphes acycliques orientés sont équivalents ssi : - ils sont sous-tendus par le même graphe non orienté - ils ont les mêmes v-structures
10
Classe d´équivalence : indistinguabilité
Une classe d´équivalence peut être représentée de manière unique par un graphe acyclique partiellement orienté
11
Echantillonnage de Gibbs
(Chaque admet pour valeurs possibles les entiers k=1..K) Essayer toutes les valeurs possibles pour et recalculer la probabilité conjointe à chaque fois : .... Tirer une nouvelle valeur pour en fonction de ces probabilités
12
Echantillonnage de Gibbs
Appliquer la même procédure à , puis , ... jusqu´à ... Recommencer un très grand nombre de fois (K=10 000) échantillon : avec distribué suivant la probabilité conjointe Par exemple:
13
Echantillonnage de Gibbs simplification des calculs
...
14
Echantillonnage de Gibbs simplification des calculs
...
15
Echantillonnage de Gibbs
16
Calcul de probabilités conditionnelles
On connait la valeur des variables 26, 22, 16. Calculer alors la probabilité des différentes valeurs possibles pour 8
17
Calcul de probabilités conditionnelles
Faire un Gibbs en laissant fixes les variables 26, 22, 16. Mesurer alors la fréquence des différentes valeurs observées en 8 asymptotiquement égales aux probabilités recherchées
18
Problème inverse : Inférer les lois conditionnelles locales
Données: structure du réseau (G) + table d´observations (D) (G) (D) Inconnues à estimer: lois de probabilités locales
19
Lois conditionnelles locales pour les réseaux binaires
(Chaque admet pour valeurs possibles 0 ou 1) Nombres de paramètres à déterminer: 1 : ensemble des paramètres du réseau
20
Rappel : tirage à pile ou face
: probabilité de tirer pile à un tirage donné : données observées (10 piles et 5 faces) Estimation rapide (efficace si beaucoup d´observations) : Inférence Bayésienne (incertitude mieux prise en compte) Métropolis sur 0.66
21
Estimation rapide des lois conditionnelles locales
5 12 1 7 2 4 24
22
Inférence Bayésienne des paramètres du réseau
Structure du réseau Table d´observations Paramètres du réseau
23
Algorithme de Metropolis
1. proposer modif 2. calculer 3. accepter avec une proba p=Min(1,a) si accepté : si refusé : 4. recommencer à partir de 2.
24
Classificateur Bayésien « naïf »
An ... Classe Attributs
25
Classificateur Bayésien « naïf » méthode d´apprentissage
An ... Classe ? Attributs ? Jeu d´apprentissage: A1 A2 ... An C item1 item2 Application des méthodes mentionnées auparavant
26
Classificateur Bayésien avec corrélations entre attributs
Classe C A1 A2 A3 ... An Attributs Cas particulier: le graphe restreint aux attributs est un arbre.
27
Problème inverse général : inférer la structure du réseau
Table d´observations ? Structure du réseau
28
Inférence Bayésienne de la structure du réseau
Table d´observations Paramètres du réseau (calculable analytiquement) Prior sur les réseaux possibles Uniforme : trop flexible Prior pénalisant les réseaux trop riches en liens
29
Inférence Bayésienne de la structure du réseau
Table d´observations Paramètres du réseau (calculable analytiquement) Données suffisamment riches pour inférer le réseau avec certitude: rechercher graphe G qui maximise (NP difficile) Sinon : Monte Carlo à travers l´espace des graphes, pour échantillonner la distribution a posteriori
30
Classe d´équivalence : indistinguabilité
Deux graphes sont équivalents si ils impliquent les mêmes indépendances conditionnelles Théorème (Pearl et Verma, 1991): Deux Graphes acycliques orientés sont équivalents ssi : - ils sont sous-tendus par le même graphe non orienté - ils ont les mêmes v-structures
31
Classe d´équivalence : indistinguabilité
Une classe d´équivalence peut être représentée de manière unique par un graphe acyclique partiellement orienté
32
Validation de la méthode par simulations
33
Cas réel : projets d´études supérieures
SEX : sexe SES : statut socio-économique PE : encouragement parental IQ : quotient intellectuel CP : projets d´études supérieures
34
Application : inférer les réseaux de régulation génétique à partir des puces à ADN
35
Cycle cellulaire division synthèse d´ADN (duplication du génome)
37
Application : inférer les réseaux de régulation génétique à partir des puces à ADN
Mesure de l´expression de 6177 gènes de la levure de boulanger 76 mesures au total: 6 séries temporelles sur cellules synchronisées Discrétisation des niveaux d´expression de chaque gène -1 : sous-exprimé 0 : normal +1 : sur-exprimé Explorer les classes d´équivalence de réseaux de 6178 sommets sommets correspondant aux gènes analysés - 1 sommet supplémentaire : phase du cycle cellulaire (contraint comme racine du graphe) Méthode Monte Carlo
38
Estimation rapide des lois conditionnelles locales
5 12 1 7 2 4 24
39
Relations de Markov
40
Gènes dominants (en amont des autres)
41
Relations de Markov
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.