1.

Slides:



Advertisements
Présentations similaires
Soutenance du stage de DEA.
Advertisements

Cladogramme.
Probabilités et statistiques au lycée
GROUPES D'INNOVATION.
Licence de Biologie, LSVT3. Botanique Systématique et Phylogénèse
La microbiologie prévisionnelle
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
Où est né l’homme moderne?
Inférence statistique
1 Séminaire de travail « Indicateur de croissance en France et/ou en zone euro : méthodologie et évaluation » 14 juin 2006 Indicator Models of Real GDP.
Espèce et spéciation : problématique générale
L’analyse de graphique
Phylogénie et distances génétique
3. Analyse et estimation du mouvement dans la vidéo
Colloque Traitement et Analyse de séquences : compte-rendu
Méthodes de comparaison entre séquences multi-échelles végétales
Les démarches de développement
Le remplacement moléculaire
La démarche clinique infirmière
Un nouveau regard sur les données moléculaires
Safae LAQRICHI, Didier Gourc, François Marmier {safae
La perception subjective de la corrélation dans les nuages de points
Réalisation dun travail concret avec des matrices Afficher un objet 3D sur une surface Lui appliqué des transformations Le voir se transformer suivant.
Christelle Scharff IFI 2004
Traitement de données socio-économiques et techniques d’analyse :
Enseignement de spécialité en S
The Unified Neutral Theory of Biodiversity and Biogeography
Détection de co-évolution de gènes Master 2 : Informatique à Finalité Professionnelle et Recherche Unifiée (IFPRU) Parcours Ingénierie de lIntelligence.
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
Baï Flavien Bailly Christophe Baumgarte Audette
Prévisions météorologiques, projections climatiques : que peut- on prévoir et avec quelle fiabilité ? Exercice 2: estimation de la prévisibilité dans le.
Présentation du mémoire
CHAPITRE 19 - La génétique des populations
L’origine de la diversité
La méthodologie expérimentale Fondements et bases d’application
La méthodologie expérimentale Fondements et bases d’application
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Plan Buts principaux Intérêt et pertinence du projet Rappel concernant la phylogénie Travail accompli jusquà maintenant Travail restant à accomplir Difficultés.
Estimation des paramètres génétiques influençant le taux de parasites gastro-intestinaux chez des veaux de race Angus à l’aide d’un modèle de régression.
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Le coefficient multiplicateur Une mesure de l ’évolution dans le temps
Les analyses multivariées
Résolution de problèmes Analyse : « Le programme sinscrit, comme celui de la classe de seconde, dans le cadre de la résolution de problèmes. Les situations.
AIP PRIMECA des Pays de La Loire – 9 novembre 2006
Recherche heuristique dans les bases de données L’algorithme BLAST
Régression linéaire multiple : hypothèses & interprétation
High genomic deleterious mutation rates in hominids Eyre-Walker & P. D. Keightley Letters to Nature, Jan. 99.
Analyses phylogénétiques
Sériation et traitement de données archéologiques
2008/ Plan du cours 1.Introduction –Contenu du cours 2.Logique mathématique –Calcul propositionnel –Calcul des prédicats –Logique floue et aide à.
TIPE Les dames chinoises
Épreuves de mathématique 3e secondaire (FBD)
Bin Hiver 2005 Intégration biosciences/informatique Sylvie Hamel Département d’informatique et de recherche opérationnelle André-Aisenstadt: 3161.
Déterminisme génétique de la sensibilité à la photopériode chez l’orge
TIJARIATE Méthodes Orientées Objets Unified Process (UP) - Groupe A
ANNEE UNIVERSITAIRE :2010/2011
Recherche heuristique dans les bases de données L’algorithme BLAST
« Ecologie et dynamique des populations » Unité de Pathologie Végétale
Régression linéaire (STT-2400)
Évolution de second ordre dans un algorithme évolutionnaire V. Lefort
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Approximation linéaire –Méthode du moindre carré u Exemple.
Comparaison multi-échelle des précipitations du modèle Méso-NH et des données radar Colloque CNFSH – Ecole des Ponts ParisTech – 11/12 juin 2009 A., Gires.
La démarche de classification
Les banques de séquences nucléiques
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
THEME: EFFET DES TRANSFERTS DES FONDS DES MIGRANTS SUR LE TAUX DE CHOMAGE DANS LA ZONE CEMAC Par MVOGO Gregory Paulin Université de Yaoundé –II Soa Cameroun.
Classification évolutive Travaux pratiques et cas de la lignée verte Cours du 10/03/2016 Présentation: Hugo FONTES Conception : Hugo FONTES et Pierre CELLIER.
STATISTIQUE DESCRIPTIVE
Transcription de la présentation:

1

Plan de la présentation Buts principaux Intérêt et pertinence du travail Contextualisation du projet Méthodologie Résultats et discussions Perspectives 2

Buts principaux But biologique: Déterminer si le type de pollinisateurs influence l’évolution des plantes appartenant au complexe d'espèces Codonanthe et Nematanthus But mathématique: Mettre en place un modèle permettant d’estimer, sur la base de données phylogénétiques, les taux d’extinction et de spéciation en utilisant la méthode du maximum de vraisemblance 3

Intérêts et pertinence du projet Compréhension de différents phénomènes évolutifs et des facteurs qui les influencent Utilisation et interprétation des données phylogénétiques Meilleure compréhension de l’origine de la biodiversité 4

Contextualisation du projet -Famille des Gesneriaceae (Eudicot, Asteridées)‏ -Amérique Centrale et Amérique du Sud -Diversité de pollinisateurs -Genre Codonanthe (environ 20 esp.)‏ -Genre Nemantanthus (environ 30 esp.)‏ 5

Contextualisation du projet Variables recherchées: λ = taux de spéciation μ = taux d’extinction Variables connues: t = temps de divergence T = temps de divergence de l’outgroup 6

Contextualisation du projet Séquençages de trois gènes communs à toutes les plantes d’intérêts 2. Alignement de séquences par le programme MUSCLE 7

Contextualisation du projet Estimation du nombre de substitutions par lignées et génération d’un arbre phylogénétique moléculaire Estimation d’un taux de mutation propre à chaque espèce à l’aide d’un modèle d'autocorrélation de l'évolution des taux de mutations → arbre phylogénétique avec datation « relative » 8

Contextualisation du projet Utilisation d’un fossile d’âge connu et assimilé à nos espèces d’intérêts comme référence temporelle → arbre phylogénétique avec datation « absolue » Attention: ces différentes étapes utilisent des modèles et comportent des approximations → les résultats obtenus sont des estimations 9

Méthodologie Création de deux fonctions: Fonction p codant le birth and death process Fonction prob éliminant les valeurs biologiquement aberrantes retournées par p Fonction vrais: cherche quelles valeurs de λ et µ parmi celles calculées par prob permettent d’estimer au mieux les temps observés: prob(a, t1, t2,…, ta-1| l, m, T) = p1(T) x l(a-1) x Πp1(ti) où a=nombre de taxa observés au temps présent 10 10

Méthodologie Définition d’une série de valeurs possibles pour λ et µ. Calcul des vraisemblances correspondantes grâce à vrais. Intégration de ces valeurs de vraisemblance dans une matrice de stockage: x → valeurs de vraisemblance propres aux combinaisons “λ - µ” testées. 11

Méthodologie Représentation graphique et estimation visuelle des valeurs de λ et µ les plus vraisemblables: 12

Méthodologie Algorithme du simplex: animation simplex Dans “R” on intégre cet alogrithme dans une nouvelle fonction baptisée optimum2. Création préalable de la fonction vrais2 qui s’oppose à vrais et qui calcule deux valeurs correspondants à λ et µ  : vrais2<-function(x){ return(-vrais(x[1],x[2],t,T))} 13 13

Méthodologie optimum2<-function(time,T,start) { Fonction finale permettant de calculer les valeurs de λ et µ les plus vraisemblables: optimum2<-function(time,T,start) { vrais2<-function(x){ return(-vrais(x[1],x[2],time,T))} return(optim(start,vrais2,method="L-BFGS-B", lower=c(0,0)))} 14 14

Méthodologie Les limites de la méthode utilisée... La fonction du maximum de vraisemblance: prob(a,t1,t2,…,ta-1|l,m,T) = p1(T) x l(a-1) x Πp1(ti)‏ Notre modèle (vrais2 et optimum2): → Valeurs de vraisemblance: assez précises → Valeurs de λ et µ : biaisées (surtout m) par influence de T sur le modèle 15

Méthodologie Seulement pour une valeur de T intermédiaire (=10 environ) → bonne estimation de λ et µ 16

Méthodologie Pour T petit → µ =0 Aucune exctinction observées. Espèces “jeunes”; faible probabilité qu’elles disparaissent dans un petit intervalle T 17

Méthodologie Exemple: T= 0.1 Maximum de vraisemblance 18

Méthodologie Pour T grand → µ = λ Intervalle de temps plus long → plus de probabilité qu’une espèce disparaisse.

Méthodologie Exemple: T=30 Maximum de vraisemblance pour l=m 20

Méthodologie Visualisation par les histogrammes 21

Méthodologie Donc, le choix du T est fondamental lors des analyses phylogénétiques si nous voulons de bonnes estimations des paramètres recherchés!

Méthodologie Autre biais (étant donné un T intermédiaire): Nombre d'espèces au temps actuel → plus n est grand et plus les estimations sont précises. 23

Résultats On veut tester si le type de pollinisateurs chez les plantes des genres Nematanthus et Codonanthe a un effet sur les valeurs de λ et µ. Extraction des valeurs de t à partir des données phylogénétiques concernant les genres Codonanthe et Nematanthus afin de pouvoir appliquer la fonction optimum2. Création de deux modèles: A. un modèle général groupant toutes les plantes B. un modèle séparant les plantes en fonction du pollinisateur 24

Résultats λ (speciation) = 0.4725805 A. Modèle général regroupant toutes les plantes indépendamment du pollinisateur: λ (speciation) = 0.4725805 μ (extinction) = 0.0000000 log (vraisemblance) = 78.72969 25

Résultats B. Modèle séparant les plantes en fonction du pollinisateur : Espèces pollinisées par des colibris λ (speciation) = 0.4861839 μ (extinction) = 0.0000000 log (vraisemblance) = 34.42339 Espèces pollinisées par des abeilles  λ (speciation) = 0.4722173 μ (extinction) = 0.0000000 log (vraisemblance) = 40.25728 26

Résultats On fait un test du chi2 pour comparer la vraisemblances de ces deux modèles: H0 : Les vraisemblances des deux modèles ne sont pas significativement différentes, et le type de pollinisateurs n’a donc pas d’effet sur les taux de spéciation et d’extinction. H1 : Les vraisemblances des deux modèles sont significativement différentes, le type de pollinisateurs a donc un effet sur les taux de spéciation et d’extinction. 28

Résultats Valeurs de vraisemblance obtenues pour nos deux modèles: log(total) = 78.72969 → H0 log(abeilles) = 40.25728 log(colibris) = 34.42339 Test du chi2: Χ2 = -2*( H0 – H1 ) df = 2 p-value = 0.860397 P-value > 5% → H0 ne peut pas être rejettée. → H1 29

Perspectives Elimination du biais en enlevant T, l'équation devient: prob(t1,t2,…,ta-1|n,l,m,T) = Π [p1(ti)dti / ∫T0 p1(u)du] Cette fonction nous ayant été donnée, nous avons pu établir la comparaison suivante : Fonction sans biais: λ (speciation) = 0.4737472 → Semblable à: 0.4725805 μ (extinction) = 0.0007526793 → Mieux que: 0.0000000 30

Perspectives Enfin: nous avons un ratio λ/µ élevée: λ/µ = 0.4737472/0.0007526793 = 629.4144 En principe, ce ratio est compris entre 2 et 3. Causes: - type de pollinisateurs? → NON - séparations géographiques → création de nouvelles niches écologiques ? - adaptation rapide à des niches écologiques très spécialisées ? - ... Il reste encore beaucoup de pistes à investiguer!

Conclusion Aspect biologique: Nous avons constaté que le type de pollinisateurs n’influence pas les taux de spéciation et d’extinction dans le cas étudié. Aspect mathématique: Nous avons mis en place un modèle et nous avons pu en percevoir les limites. 32

Remerciements Nous tenons à remercier Nicolas Salamin pour la qualité de son encadrement, sa disponibilité et sa patience… Merci de votre attention 33