QTLmap et les données ayant une distribution non gaussienne

Slides:



Advertisements
Présentations similaires
ANOVA à un facteur (Rehailia)
Advertisements

Probabilités et statistiques au lycée
Christèle Robert-Granié et Jean-Louis Foulley* INRA- Station dAmélioration Génétique des Animaux, Toulouse ; *INRA-Station de Génétique Quantitative et.
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Apports de la modélisation
Chapitre 5. Description numérique d’une variable statistique.
Collecte de données F. Kohler.
Comparaison de deux moyennes observées
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
C. Moreno, O. Filangi, H. Gilbert, A. Legarra, P. Le Roy, J.M. Elsen
Tâche 3 Epistasie. En cours Modèle 2 QTL en interaction dans QTLmap Evaluation génomique intra génotype à un marqueur Application : Sensibilité à la Coccidiose.
Les TESTS STATISTIQUES
3. Analyse et estimation du mouvement dans la vidéo
Notions de variable aléatoire et de probabilité d’un événement
Les tests d’hypothèses
Estimation de la survie comparaison des courbes de survie FRT C3.
Analyse de la variance à un facteur
Chapitre VII :Commande par retour d’état
Le modèle de Bayes Christelle Scharff IFI La classification de Bayes Une méthode simple de classification supervisée Basée sur lutilisation du Théorème.
RECONNAISSANCE DE FORMES
M.D., AMT Narbonne Fond diffus, structures et avant-plans Marian Douspis (LATT/OMP) Nabila Aghanim, Mathieu Langer (IAS)
Etude longitudinale d’essais multilocaux: apports du modèle mixte
CORRELATION GENETIQUE ENTRE LES RESULTATS DES TESTS DE TERRAIN DES CHEVAUX SWEDISH WARMBLOOD DE 4 ANS ET LES RESULTATS EN COMPETITION DE DRESSAGE ET DE.
Groupe 1: Classes de même intervalle
Construction de modèles visuels
SELECT {* | Expression [Alias] [,...] } FROM Table [WHERE Condition] [ORDER BY { Expression | Alias } [ ASC | DESC ] [NULLS FIRST | NULLS LAST ] [,...]
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
L’utilisation des bases de données
Faculté de Médecine Lyon-Sud Module Optionnel de préparation à la lecture critique d articles Multiplicité.
Courbes de Bézier.
Les modèles linéaires (Generalized Linear Models, GLM)
Modélisation de la topologie avec le Graphe Génératif Gaussien
Sélection génétique de moutons par croisements. Un gène nommé Fec contrôle le niveau dovulation Il existe un allèle Fec B qui cause une hyperovulation.
Le forage de données ou data mining
Audoin Marion Briot Julien Hanot François
Estimation des paramètres génétiques influençant le taux de parasites gastro-intestinaux chez des veaux de race Angus à l’aide d’un modèle de régression.
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Travaux pratiques Hygiène-Génétique- Biostatistique:
Estimation de la valeur génétique du Pur-Sang Anglais en République Tchèque Franey Anne Frisée Vincent Vanloocke Denis.
TRAITEMENT D’IMAGE SIF-1033.
Estimation des paramètres génétiques :
Travail de génétique 2e DOC Genetic and phenotypic parameters for early growth traits in Emirati goat. S.A Al-Shopery,G.A.Alhadrami,K.Abdulwahab Buisseret.
ORGANIGRAMME-MÉTHODES STATISTIQUES-COMPARAISONS DE MOYENNES
1 Introduction à la théorie des tests. 2 Plan I- choix entre 2 paramètres de tendance centrale Choix entre 2 proportions pour un caractère qualitatif.
SURPOIDS et OBESITE CHEZ LES ENFANTS DE 7 à 9 ANS
Rappels de statistiques descriptives
COURS STATISTIQUE - DESCRIPTIVE DEFINITIONS
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
M2 Sciences des Procédés - Sciences des Aliments
Déterminisme génétique des caractères quantitatifs :
Analyse spectrale Raphaël ARROUAS Etienne OUSS
Statistiques descriptives-Distributions expérimentales à une dimension
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Contraception au cours du parcours de vie
The association between cognitive ability measured at ages and mortality during 30 years of follow-up. A prospective observational study among Swedish.
M.D., PNC, paramètres cosmo 18/01/ Paramètres cosmologiques par Combinaisons Marian Douspis (IAS), Alain Blanchard (LATT) Nabila Aghanim (IAS), Jim.
BIOSTATISTIQUES Définitions.
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
LE CHOIX DE LA FORMULE  Reprise du cours du 09 au 12 décembre (GR 1 à 5, même si redites) o Question : vitesse moyenne du cycliste A sur l’ensemble de.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Transcription de la présentation:

QTLmap et les données ayant une distribution non gaussienne C. Moreno, O. Filangi, H. Gilbert, A. Legarra, P. Le Roy, J.M. Elsen

Introduction Méthodes de détection de QTL peu sensible à la « non normalité » si la distribution pas trop asymétrique et pas trop de données censurées (Kadermindeen et al., 2000; Moreno et al., 2003) MAIS Chaque jeu de données a ces caractèristiques propres  2 modélisations sont disponibles dans QTLmap Données discrètes 0/1 ou 1,2,3,4… Données non normale et/ou censurées

Quels sont les Problèmes Posés par les Données de type non normales? 1) distributions non normale/gaussienne 2)Existence de données censurées infection mort Censure f(y) y 3) Sensibilité de l’appareil de mesure Seuil de mesure

Transmission probability Lx = P S p(hsi½M) P S p(hdij½hsi , M) P S p(tijk ½hsi, hdij, M) f(yijk½tijk, M) Likelihood Parental phases probabilities i hsi Transmission probability at the x location j Penetrance function hdij k tijk 1) Petrance function= Gaussiennne  distribution gaussienne  données non censurées (données censurées manquantes) 1) Petrance function= modèle à seuil  distribution sous jacente gaussienne  données non censurées (données censurées manquantes) 2) Penetrance function= Modèle de Cox distribution semi paramétrique  Prise en compte des données censurées

Modèle à seuil pour les données discrètes f(zi) yi=0 yi=1 zi T Le modèle cherche à déterminer le seuil à utiliser pour obtenir la répartition observée des observation ( 0 et 1 dans l’exemple ci-dessus). Les effets estimés dans QTLmap affecte la valeur de ce seuil. Temps de calcul plus long qu’un modèle gaussien

Forme de la fonction de pénétrance du modèle à seuil

Modèle non paramétrique de Cox AVANTAGE = aucune hypothèse sur la distribution du caractère PROBLEME AVEC l’écriture de la vraisemblance de COX: Modèle de Cox  trie des données par durée de vie Cartographie d’intervalle  trie des données par famille de père-mère APPROXIMATION mais proba de transmission et les proba de phase des parents apparaissent dans le dénominateur de la fonction de pénétrance Temps de calcul très long!!!!

Forme de la fonction de pénétrance du modèle de cox Risque de l’individu ijk Somme des risques des individus encore en vie à tijk

Puissance des 2 Méthodes Gaussien modèle de Cox

Conclusion sur Cox PAS DE CENSURE Modèle Gaussien= Modèle de Cox Si transformation appropriée des données dans les cas testés CENSURE A AGE FIXE Modèle de Cox>> Modèle Gaussien

Comment utiliser QTLMAP lorsque la distribution est non normale et/ou les données sont censurées? Données avec une distribution non normale et/ou censurées Cox prend en compte le classement des individus les uns /autres Conseil d’utilisation: Transformation des données pour normaliser au maximum la distribution (prise en compte des données censurées potentiel surtout si censure à date fixe) Analyse et calcul des seuils avec modèle gaussien sur tout le génome Reanalyse et calcul des seuil des QTL significatifs avec modèle de Cox/à seuil Comparaison des résultats avec les deux approches

Comment indiqué le modèle désiré à QTLMAP? Modèle à seuil pour données discrètes: Indiqué i après le nom du caractère dans le fichier modèle 3 ! Number of traits 1 1 ! Number of  fixed effects and covariates    sexe poids ! Names of the fixed effects and covariates malade i 1 1 0 ! 1st trait, (nature : integer value) model malcor r 0 0 1 ! 2nd trait,(nature : real value) model third r 0 0 0 ! 3nd trait,(nature : real value) model Texte 6: Example 1 of a model file

Comment indiqué le modèle désiré à QTLMAP? Modèle de Cox: Il faut choisir --calcul=7 Si il y a de la censure: indiquer 0 pour les données censurées en 2° colonne après la colonne du caractère dans le fichier performance 44985 2 10,3 5,5 1 0 75,2 1 1 961924 1 10.43 7.8 1 1 77.6 1 1 961925 2 5.34 0.0 0 1 90. 1 1 961926 1 12.34 11.3 1 1 103. 1 1 963187 2 9.45 12.7 1 1 98. 1 1 963188 1 11.10 13.5 1 1 0.0 0 1 963189 2 10.11 10. 1 1 94.8 1 1 963190 1 9.98 14.2 1 1 98.3 1 1 Texte 4: Example of a quantitative trait values file ATTENTION le LD est pas encore disponible avec Cox.