La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Soutenance de thèse Benjamin Parent Directeurs : Bernard Vandenbunder Jean-Pierre Richard 29 octobre 2007 Algorithmes doptimisation et danalyse des problèmes.

Présentations similaires


Présentation au sujet: "Soutenance de thèse Benjamin Parent Directeurs : Bernard Vandenbunder Jean-Pierre Richard 29 octobre 2007 Algorithmes doptimisation et danalyse des problèmes."— Transcription de la présentation:

1 Soutenance de thèse Benjamin Parent Directeurs : Bernard Vandenbunder Jean-Pierre Richard 29 octobre 2007 Algorithmes doptimisation et danalyse des problèmes multidimensionnels non linéaires en Biologie et Biophysique

2 Plan de la présentation 0.Introduction 1.Échantillonnage conformationnelÉchantillonnage conformationnel 2.Modélisation en Biologie systémiqueModélisation en Biologie systémique 3.ConclusionConclusion

3 3/53 Objectifs de la thèse Appliquer les savoir-faire de lAutomatique à des problèmes issus de la Biologie et de la Biochimie dans la cellule, tout repose sur des interactions moléculaires… Étudier les interactions moléculaires À léchelle des molécules individuelles Prédiction dans les cas « simples » Aide à linterprétation des expériences Leur impact à léchelle dun module fonctionnel de la cellule Introduction Modélisation moléculaire Biologie systémique Conclusion

4 4/53 Contexte humain LIFL – ANR GRID (Info Fondamentale) Partie Modélisation Glycobiologie IRI + IBL Enseignements ISEN LAGIS (Automatique, G. Info et Signal) PhLAM (physique non-linéaire) LIFL (calcul formel) (multi- agents) Observatoire de Banyuls – ANR Math Auto Introduction Modélisation moléculaire Biologie systémique Conclusion

5 Plan de la présentation 0.IntroductionIntroduction 1.Échantillonnage conformationnel 2.Modélisation en Biologie systémiqueModélisation en Biologie systémique 3.ConclusionConclusion

6 Échantillonnage conformationnel Problématique et codage Algorithme génétique Hybridations Méta optimisation Parallélisation

7 7/53 Vers une estimation des affinités entre cibles moléculaires (docking) Nécessité de décrire la flexibilité de chaque agent : exercice de prédiction de la géométrie des ligands des sites actifs (10 à 1000 atomes) Introduction Modélisation moléculaire Biologie systémique Conclusion Problématique et codage

8 8/53 Stabilité donnée par les niveaux dénergie E estimée sur la base dun champ de forces Hagler et al. [1974] Boltzmann : Introduction Modélisation moléculaire Biologie systémique Conclusion Problématique et codage Conformations adoptées en solution Minima de la fonction énergie =

9 9/53 Le niveau de représentation dun domaine est aussi fonction de sa largeur (facteur entropique) Introduction Modélisation moléculaire Biologie systémique Conclusion Problématique et codage degré de liberté énergie

10 10/53 La flexibilité des molécules repose essentiellement sur la libre rotation autour des liaisons inter atomiques Introduction Modélisation moléculaire Biologie systémique Conclusion Problématique et codage

11 11/53

12 12/53 Que doit faire lalgorithme ? Explorer lespace des géométries pour identifier les conformations stables Décrire les niveaux de peuplement des minima pertinents Idéal : reconstruire la densité de probabilité sur lespace de phases Comparaisons possibles avec les expériences Introduction Modélisation moléculaire Biologie systémique Conclusion Problématique et codage Algorithme Fichier moléculaire initial Différentes conformations moléculaires

13 13/53 Validation des résultats avec des molécules dont la structure est connue expérimentalement Domaine WW de PIN Filippine Tryp. ZIP mini -turn Cyclo- dextrine Tryp. Cage Introduction Modélisation moléculaire Biologie systémique Conclusion Problématique et codage

14 14/53 Problème mathématique de minimisation de fonction Particularités : Très grandes dimensions (1…200 degrés de liberté) Fortement multimodal (donc non linéaire) Recherche de tous les minima utiles Littérature Molécules de petites tailles Vengadesan [2003] Grandes molécules, modèle simplifié Dynamique moléculaire Roitberg [2007] Introduction Modélisation moléculaire Biologie systémique Conclusion Problématique et codage

15 Échantillonnage conformationnel Problématique et codage Algorithme génétique Hybridations Méta optimisation Parallélisation

16 16/53 Choix dune stratégie : Holland [1975] les algorithmes génétiques (AG) + forte exploration de lespace + population de solutions + concept dhéritage + modularité et adaptabilité – consommateurs de ressources – visitent les régions aberrantes – stochastiques (mauvaise reproductibilité) Algorithme génétiques Introduction Modélisation moléculaire Biologie systémique Conclusion

17 17/53 AG : principes Solutions = « chromosomes » Population de solutions :

18 18/53 AG : principes Évolution : opérateurs de croisement … et de mutation … n … i+1 i … n … i parent1 : parent2 : … n … i+1 i muté : … n i+1 i … … n i … fils1 : fils2 : … n i+1 i … mutant :

19 19/53 AG : principes population intermédiaire... n... n... n... n... n... n... n... n aléatoire... n... n... n... n population initiale triée population finale... n... n... n... n triée niveau de sélection énergies Validation sur des petites molécules organiques Temps de calculs relativement longs

20 Échantillonnage conformationnel Problématique et codage Algorithme génétique Hybridations Méta optimisation Parallélisation

21 21/53 Hybridations Monte Carlo Distributions de probabilité biaisées Mutations Dirigées Recherche taboue Fragmentation Introduction Modélisation moléculaire Biologie systémique Conclusion Algorithmes génétiques Relativement lents Ne tirent pas parti de la physique du problème Hybridation par des heuristiques complémentaires :

22 22/53 Muter un seul codon est très rarement viable idée : muter et autoriser des réarrangements locaux Évolution bloquée dans des minima locaux, Aucune mutation ne peut aider Ajout dun terme de contrainte, Optimisation par Gradient dans le nouveau paysage Relaxation finale vers le minimum local avoisinant Lancé en parallèle Hybridations Introduction Modélisation moléculaire Biologie systémique Conclusion énergie θ1θ1 θ2θ2

23 23/53 Jeux de tests : Par défaut, toutes les stratégies activées Puis, tour à tour, désactivation dune heuristique : Sans mutation dirigée Sans tabou Distributions uniformes Distributions minimisant les tensions locales Trois à quatre tests pour chaque Introduction Modélisation moléculaire Biologie systémique Conclusion Hybridations

24 24/53 Hybridations La solution expérimentale est trouvée parmi dautres solutions Introduction Modélisation moléculaire Biologie systémique Conclusion Défaut Sans mut. dir. Sans tabou Tensions locales Distribution uniforme

25 Problématique et codage Algorithme génétique Hybridations Méta optimisation Parallélisation Échantillonnage conformationnel

26 26/53 Les performances des AG dépendent (fortement) des « hyper paramètres » de contrôle : Méta optimisation Gestion de la population Taille de population Nombre de processus parallèles Taux de migration Gestion de lévolution Taux de croisement Taux de mutation Croisements à un et deux points Gestion de la convergence Fréquence des apocalypses Condition globale darrêt Pression de sélection Élitisme Âge maximal Limite de dissimilitude Introduction Modélisation moléculaire Biologie systémique Conclusion

27 27/53 nouvelle générationgénération temporaire Méta optimisation Pression de sélection Élitisme Âge maximal Limite de dissimilitude Introduction Modélisation moléculaire Biologie systémique Conclusion

28 28/53 p1p1 p2p2 p3p3 p4p4 p5p5 p6p6 pnpn Gestion de la population Taille de population Nombre de processus parallèles Taux de migration Gestion de lévolution Taux de croisement Taux de mutation Croisements à un et deux points A.G. Que faire avec ces paramètres ? Méta optimisation Pression de sélection Élitisme Âge maximal Limite de dissimilitude Gestion de la convergence Fréquence des apocalypses Condition globale darrêt Introduction Modélisation moléculaire Biologie systémique Conclusion

29 29/53 Comment définir une stratégie optimale ? Comment comparer deux exécutions ? Dans un contexte stochastique ? La « meilleure » stratégie dépend-elle de la molécule traitée ? Question ouverte : comment connaître a priori des hyper paramètres satisfaisants ? Méta optimisation Introduction Modélisation moléculaire Biologie systémique Conclusion

30 30/53 Problème doptimisation classique Évaluation de la qualité dun échantillonnage : Abordé par « méta »-algorithme génétique (µ-AG) Introduction Modélisation moléculaire Biologie systémique Conclusion Méta optimisation

31 31/53 Schéma global : AG paramétré Introduction Modélisation moléculaire Biologie systémique Conclusion Méta optimisation

32 32/53 Paramètres optimisés Paramètres aléatoires Énergie libre de lensemble échantillonné Introduction Modélisation moléculaire Biologie systémique Conclusion Méta optimisation

33 33/53 Validations (résumé) : Capacité exploratrice des AG Stratégie de méta optimisation des hyper paramètres Hybridation avec heuristiques complémentaires Parent [2007a] Amélioration des temps de calculs Long pour les tests du méta AG Toujours prohibitif pour les plus grandes molécules Introduction Modélisation moléculaire Biologie systémique Conclusion Méta optimisation

34 Échantillonnage conformationnel Problématique et codage Algorithme génétique Hybridations Méta optimisation Parallélisation

35 35/53 Parallélisation Projet ANR avec léquipe OPAC du LIFL (Pr. Talbi) Grid5000 : environnement multiprocesseur Généralisation des îles : Multiplier les îles pas de sens Indépendance totale bénéfice de larchitecture grille ? Pande [2003] Utilisation des solutions précédemment échantillonnées Introduction Modélisation moléculaire Biologie systémique Conclusion

36 36/53 Parallélisation - Hyper paramètres - Exécutables - Fichier moléculaire - Graines - Liste taboue - meilleures solutions - succès de léchantillonnage Bases de solutions échantillonnées Banque dinsémination clusters récents : graines clusters connus : tabous Bases des jeux dhyper paramètres évalués Arrêt : Nombre de « Missions » max rien de neuf depuis trop de missions µ-AG Récolte et classification des solutions Introduction Modélisation moléculaire Biologie systémique Conclusion tant qu nœud libre, y déployer des îles

37 37/53 Parallélisation Stratégie : surveiller la (re)visite de régions de solutions Classification : par énergies autour des plus stables (paramètre de taille D max ) Panspermie : insémination des planètes par Des « graines » attractrices (régions plus récentes que N intens missions) Des tabous répulsifs (déjà intensifiés) Régler D max et N intens est un problème délicat ! Introduction Modélisation moléculaire Biologie systémique Conclusion

38 38/53 Parallélisation Introduction Modélisation moléculaire Biologie systémique Conclusion Expérimentale Prédite Tryptophan cage

39 39/53 Parallélisation Introduction Modélisation moléculaire Biologie systémique Conclusion Parent [2007b] Expérimentale Prédite Tryptophan zipper

40 40/53 Conclusions et perspectives Acquis : Suite dalgorithmes efficaces et adaptatifs Stratégies dhybridation Premiers déploiements parallèles Vers du docking (résultats non-présentés) : Outil de positionnement relatif de deux molécules Stratégie de criblage Bonachéra [2006] Perspectives : Déploiements massivement parallèles Développement de nouvelles stratégies Meilleure caractérisation des conformations Algorithme de docking Introduction Modélisation moléculaire Biologie systémique Conclusion

41 Plan de la présentation 0.IntroductionIntroduction 1.Échantillonnage conformationnelÉchantillonnage conformationnel 2.Modélisation en Biologie systémique 3.ConclusionConclusion

42 42/53 Problématique La forme des interactions a-t-elle un impact sur les dynamiques ? À léchelle de la cellule : impossible de décrire Lensemble des événements moléculaires Lensembles de acteurs Recours à un modèle : les concentrations Continues Déterministes Dimension finie Introduction Modélisation moléculaire Biologie systémique Conclusion (solutions déquations différentielles ordinaires)

43 43/53 Rythmes circadiens On observe : Des oscillations qui perdurent en conditions déclairement constant, avec période 24h Une compensation en température (robustesse de la période) La possibilité de réinitialiser le système Introduction Modélisation moléculaire Biologie systémique Conclusion

44 44/53 Nakajima [2005] Introduction Modélisation moléculaire Biologie systémique Conclusion Réseaux de régulation ADN gène : ABC protéine : p prot : abc promo teur

45 45/53 Modèle théorique Mise en évidence avec un modèle minimal dun mécanisme oscillant : les profils de dégradation non linéaires Introduction Modélisation moléculaire Biologie systémique Conclusion

46 46/53 But : déstabiliser le système Modèle théorique Introduction Modélisation moléculaire Biologie systémique Conclusion

47 47/53 Modèle théorique Fonction de dégradation quelconque : f Condition sur f pour avoir un point déquilibre ε Condition sur les paramètres pour que ε soit instable entouré dun cycle limite ( en jouant sur les pôles du modèle linéarisé) On montre que f linéaire nest pas suffisante Quil est nécessaire que la dégradation soit saturée Introduction Modélisation moléculaire Biologie systémique Conclusion

48 48/53 Exemple : Michaëlis- Menten f(p)=a.p/(b+p) Beaucoup utilisée Il est possible de remonter aux domaines de paramètres générant des oscillations : Introduction Modélisation moléculaire Biologie systémique Conclusion

49 49/53 Domaine de paramètres Introduction Modélisation moléculaire Biologie systémique Conclusion

50 50/53 Conclusion, perspectives Acquis : mise en évidence dun mécanisme déstabilisant par une approche purement formelle Perspectives : Confronter des valeurs expérimentales avec les domaines trouvés Évaluer la robustesse du système par rapport aux variations de température Autres mécanismes déstabilisants : diffusion ( propagation) Introduction Modélisation moléculaire Biologie systémique Conclusion

51 Plan de la présentation 0.IntroductionIntroduction 1.Échantillonnage conformationnelÉchantillonnage conformationnel 2.Modélisation en Biologie systémiqueModélisation en Biologie systémique 3.Conclusion

52 52/53 Conclusion Dans la description des interactions, il existe un fossé entre les événements moléculaires individuels et la dynamique des modules fonctionnels Le rôle de linterdisciplinaire est primordial Introduction Modélisation moléculaire Biologie systémique Conclusion

53 53/53 Conclusion Articles : Bonachéra F., Parent B., Horvath D. (2006) Journal of Chemical Models Parent B., Kökosy A., Horvath D. (2007) Soft Computing Tantar A.-A., Melab N., Talbi E.-G., Parent B., Horvath D. (2007) Future Generation Computer Systems Hanoulle X., Melchior A., Sibille N., Parent B., Denys A., Wieruszeski J.-M., Horvath D., Allain F., Lippens G., Landrieu I. (2007) Journal of Biological Chemistry Conférences : Parent B., Lippens G., Horvath D. (2006) Gordon Research Conference, Suisse Parent B., Tantar A.-A., Melab N., Talbi E.-G., Horvath D. (2007) Congress on Evolutionary Computation, Singapour Morant P.-E., Vandermoere C., Thommen Q., Parent B., Lemaire F., Corellou F., Schwartz C., Bouget F.-Y., Lefranc M. (2007) Rencontres du Non- Linéaire, Paris Introduction Modélisation moléculaire Biologie systémique Conclusion M m e r c i E m e r c i R m e r c i C m e r c i I


Télécharger ppt "Soutenance de thèse Benjamin Parent Directeurs : Bernard Vandenbunder Jean-Pierre Richard 29 octobre 2007 Algorithmes doptimisation et danalyse des problèmes."

Présentations similaires


Annonces Google