à partir de données géo-référencées zero-inflated

Slides:



Advertisements
Présentations similaires
Un écosystème marin Guillaume DELHUMEAU Sophie POULLAIN IMA 5
Advertisements

Introduction à l’analyse
Soutenance du stage de DEA.
Des modèles statistiques non-linéaires à effets mixtes et leurs extensions pour analyser la réponse de « la » biodiversité à des variables écologiques.
Impact de la FCO sur la mortalité des bovins
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Caractériser les précipitations intenses du MRCC
Classification et prédiction
RECONNAISSANCE DE FORMES
Analyse économique de la dynamique des pêcheries: approche par simulation multi-agents. Olivier Thébaud, Jean-Christophe Soulié 1er Colloque du défi Golfe.
Processus de croissance dans un modèle de dynamique de population structuré en longueur Michel Bertignac et Stéphanie Mahévas Laboratoire RH, Lorient Laboratoire.
Test statistique : principe
Collecte de données F. Kohler.
Inférence statistique
Les TESTS STATISTIQUES
Estimations de biomasse de civelles dAnguille dans lestuaire de lAdour : Saisons 1998/1999 et 1999/2000 Noëlle BRU, Rémy DROUILHET Gérard dAUBIGNY & Catherine.
Récifs artificiels dans un cadre bioeconomique spatial
Les TESTS STATISTIQUES
4 Les Lois discrètes.
Dr DEVILLE Emmanuelle J D V 12/07/2006
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
« Modélisation du cycle du carbone et impact climatique » Équipe de recherche INRP De lacadémie dOrléans-Tours ERTé ACCES Jacques Barrère et Thierry Lhuillier.
Analyse de la variance à un facteur
Coalescence et grandes structures combinatoires
Christelle Scharff IFI 2004
Traitement de données socio-économiques et techniques d’analyse :
Application des algorithmes génétiques
Auto-organisation dans les réseaux ad hoc
« 90% de nos trains arrivent à lheure! ». énoncé exercice : « Le retard sur un trajet train de 6h15 Marseille-Paris est en moyenne: 10mn avec écart type.
Pourquoi les réseaux de neurones de type « perceptron multicouche » conviennent-ils à l’apprentissage Stéphane Canu, INSA de Rouen , PSI André Elisseeff,
Développement d’un modèle de dynamique des populations structuré en longueur – Application au merlu de l’Atlantique Nord-Est Hilaire Drouineau (EMH)‏ Directrice:
Etude longitudinale d’essais multilocaux: apports du modèle mixte
Les défis de la mesure du risque d'un portefeuille global... pour l'optimisation de la politique de placement Par Richard Guay, Ph.D., CFA Premier vice-président,
Détection et isolation de défauts dans les procédés industriels Contrôle Statistique des Procédés Statistical Process Control (SPC)
Mathématiques Les statistiques et probabilités en STI2d/STL
DEA Perception et Traitement de l’Information
Introduction - Modèle Discret – Modèle Continu - Algorithmes - Conclusion
Évolution de la répartition spatiale de la pêche thonière sous Dispositifs de Concentration de Poissons (DCP) Océan Indien ( ) IRD (UR 109) CHMT,
Modeles Lineaires.
Commentaires sur les biais écologiques et les échelles non emboîtées
Didier Bresson DES Cardiologie Jeudi 28 janvier 2010
Emmanuel Chassot et Didier Gascuel
Introduction aux interactions Océan-Atmosphère en Atlantique tropical
Universté de la Manouba
Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles d’affaiblissement par la pluie sur les liaisons Terre-Satellite.
1 Evaluer le risque en situation de changement climatique : mission impossible ? SAMA, 19 Janvier 2007 Eric Parent 1, Jacques Bernier 1 et Vincent Fortin.
Les changements de numéraire dans la tarification d’options
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
MODELE DE COX BIVARIE ET COPULES Colloque jeunes probabilistes et statisticiens Le Mont-Dore, mai 2010 Mohamed ACHIBI LSTA (Paris 6) / Snecma (Villaroche)
1 La détection de gènes impliqués dans les maladies multifactorielles Marie-Pierre Etienne ENGREF Laboratoire GRESE Statistique et Génome.
1 TR: Pour commencer, je vais vous enoncer qq informations generales sur els aér ainsi que leurs origines Modélisation et analyse de l'évolution des aérosols.
Modélisation de la formation de bancs de poissons
ONO Kotaro – AFH Modélisation statistique bayesienne dun modèle de production de biomasse. Application à la pêcherie de poulpe (Octopus vulgaris)
Théorie de l’échantillonnage (STT-6005)
Filtrage de Kalman et aperçu probabiliste
Échantillonnage (STT-2000) Section 2 Tirage de Bernoulli (plan BE). Version: 4 septembre 2003.
Saint-Etienne-des-Grès Deux enquêtes sur un succès d’économie sociale Trois-Rivières, le 26 février 2009.
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Régression linéaire multiple : hypothèses & interprétation
S. AUGUSTINE B. GAGNAIRE C. ADAM-GUILLERMIN S.A.L.M. KOOIJMAN
1 - Programme de Seconde (juin 2009) Statistique et probabilités
On cherche des renseignements sur p.
Niveaux d'eau extrêmes pour le dimensionnement
Probabilités et Statistiques
1 Introduction à la théorie des tests. 2 Plan I- choix entre 2 paramètres de tendance centrale Choix entre 2 proportions pour un caractère qualitatif.
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
SOUTENANCE DE DEUXIEME ANNEE
Théorème de la limite centrale l’inférence statistique
Probabilités et Statistiques Année 2010/2011
Présentation sur l’état d’avancement du projet Poorfish en Mauritanie Barcelona, Aril 2007 Par Brahim Ould Mouhamed Tfeil et Khallahi Brahim.
Transcription de la présentation:

à partir de données géo-référencées zero-inflated Un nouveau modèle statistique pour l’évaluation de l’abondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données de relevés au chalut de fond Sophie Ancelet 1, Marie-Pierre Etienne 1 , Hugues Benoît 2, Eric Parent1 1 AgroParisTech/ENGREF, équipe MORSE, Paris 2 Fisheries and Oceans Canada, Gulf Fisheries Centre, Moncton 8ème Forum Halieumétrique, La Rochelle , 21 Juin 2007 SFds, Angers, Juin 2007

Contexte pêche commerciale massive au chalut et à la senne surexploitation Constat: diminution inquiétantes des ressources halieutiques

Comment dissocier les effets des impacts que l’on peut et ne peut pas contrôler ? Misant sur le fait que plusieurs espèces d’invertébrés marins ont une mobilité restreinte au stage adulte, essayer de dissocier les impacts directs et indirects de la pêche commerciale de la prédation des changements climatiques sur les dynamiques spatio-temporelles.

Les données Tous les mois de septembre depuis 1971 65-200 traits de chalut standards par année Relevés aléatoires stratifiés Trait standard ciblé: 30min à 3.5 nœuds Biomasses en kg/trait pour 14 espèces d’invertébrés épibenthiques.

Un exemple typique de données zero-inflated Strongylocentrotus sp. Impossibilité d’utiliser les lois de probabilité standard Comment analyser et cartographier l’abondance en oursins à partir de telles données? Biomass in kg Histogramme des biomasses en oursins recueillies entre 1999 et 2001

Approche classique: le modèle Delta-Gamma Modèle de mélange à 2 composantes ( two-parts model) k=1,2,.,r Pas de propriété d’additivité Modèle spécifié pour des données préalablement standardisées Sur-estimation ou sous-estimation de la probabilité d’absence

Alternative: utiliser un processus de Poisson composé (la loi des fuites) Dans une strate ….. Nk = Nombre aléatoire de « gisements » collectés sur une surface chalutée Sk Nk | , Sk ~ Poisson(×(Sk/d)) Chaque « gisement » contient une quantité aléatoire inconnue de biomasse Xk,j j=1,…,Nk Sk Xk,j |  ~iid Exp() Si Nk=0, aucun « gisement » ramassé : Si Nk>0, au moins un « gisement » ramassé :

Les avantages du modèle Modèle conceptuel, parcimonieux (2 paramètres  et ) Le modèle permet de traiter directement des données brutes ! La probabilité d’absence décroît avec la distance chalutée P(Yk=0)= P(Nk=0)= exp(-×Sk/d) Propriété d’additivité vérifiée:

Variabilité intra-strate Découpage de l’hétérogénéité spatiale: 38 strates Dans chaque strate i : Les observations sont identiquement distribuées: un jeu de paramètres par strate (i,i) Les observations sont indépendantes : Yi,k ~ Fuite(i,i)

Version 1: Modèle (LOL)*38 Loi des fuites appliquée indépendamment dans chaque strate Faiblesse: mauvaise qualité de l’estimation dans les petites strates

distribution régionale commune Version 2: Modèle R,-LOL Hypothèse: comportement similaire entre toutes les strates Tirer profit de l’information disponible dans toutes les strates du Golfe modélisation de la variabilité entre les strates Relier les strates via une distribution régionale commune distribution régionale commune i ~iid Gamma(a,b) i~iid Gamma(c,d)

Et s’il existait une structure spatiale entre strates voisines? Répartition spatiale des oursins en 1999-2000-2001

Version 3: Modèle IAR-LOL i =  pour tout i=1,2,…,38 Log(i)= m0 + Ψi + εi Bruit résiduel non spatialisé Tendance Variabilité spatialisée Modèle CAR Gaussien Intrinsèque ni= nombre de strates voisines de la strate i

Un modèle hiérarchique à 3 niveaux Priors Inférence Bayésienne: Algorithmes MCMC m0 IAR ε Processus Spatial i= μi Obtention de lois a posteriori pour tous les paramètres et variables latentes Si,k Observations Ni,k Yi,k

Ajustements comparés de 8 modèles Données d’ajustement: Oursins (1999-2000-2001) Critère: Facteurs de Bayes + DIC

Résultats d’inférence: IAR-LOL Difficultés du IAR ? Répartition spatiale des oursins 1999-2000-2001 Moyenne a posteriori des i

Prédictions comparées de 8 modèles Données prédites: oursins 2002 Critère: Posterior Predictive Loss Criterion (PPLC) moyens calculés à partir de 100 échantillons prédictifs de 2000 valeurs

La standardisation de données zero-inflated: une source de biais Distance standard= 0.5 Distance standard= 1.75 Fuite Fuite Delta-Gamma Delta-Gamma Distance standard= 3 Fuite Delta-Gamma

Conclusions & Perspectives Loi des fuites = solution aux problèmes liés à la non-additivité des modèles Delta La prise en compte de la structure spatiale de données d’abondance permet d’améliorer les prédictions Construction d’un modèle hiérarchique spatio-temporel couplant un modèle de dynamique des populations à un modèle géostatistique. en cours. Modelling spatial zero-inflated continuous data with an exponentially compound Poisson process. Environmental and Ecological Statistics S.Ancelet, M.P.Etienne, H.P.Benoît, E.Parent. (Article soumis)