Concepteur de cours: M. BOUKHEROUFA MA A. Université de Tarf INTRODUCTION GENERALE.

Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Base de sondage et Plan de sondage Pres. 5
Corrélation Position du problème Définition covariance (X,Y) r =
Probabilités et statistiques au lycée
L’ECHANTILLONNAGE : QUELQUES PRINCIPES
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Analyse économique de la dynamique des pêcheries: approche par simulation multi-agents. Olivier Thébaud, Jean-Christophe Soulié 1er Colloque du défi Golfe.
Les tests d’hypothèses (I)
Echantillonnage Introduction
Collecte de données F. Kohler.
Inférence statistique
Inférence statistique
Comparaison de plusieurs moyennes observées
Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.
Les TESTS STATISTIQUES
Nombre de sujets nécessaires en recherche clinique
Les TESTS STATISTIQUES
CI 14: L’organisation et le suivi du processus de production.
Échantillonnage-Estimation
Dr DEVILLE Emmanuelle J D V 12/07/2006
Système formel Nous avons introduit : signes de variables (x, y, z, …), de constantes (0, 1), d’opérations (+, ), de relations (=, ) Axiomes : ce sont.
Chapitre VII :Commande par retour d’état
Application à la méthode des
Traitement de données socio-économiques et techniques d’analyse :
Fonction puissance Montage préparé par : André Ross
Groupe 1: Classes de même intervalle
La Démarche Scientifique
Comprendre la variation dans les données: Notions de base
Mesures de répartition de la population Claude Marois 2012.
Validité interne, fiabilité, validité externe
La statistique Définitions et méthodes. La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin den.
L’étude des populations
La régression multiple
Modélisation géométrique de base
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Théorème de la limite centrale l’inférence statistique
Concepts d’échantillonnage statistique. Introduction Échantillon représentatif – Supprime la subjectivité / biais – Une confiance plus grande dans les.
Le chalut – l’échantillonnage pour connaître la composition des captures Shrimp trawler:
STATISTIQUES DESCRIPTIVES
JEAN-MARC FONTAN SOC-1101 COURS 3
Intervalles de confiance pour des proportions L’inférence statistique
GTS813: cours #6 Évaluation d’une mesure (Validité, Répétabilité, Fiabilité, précision) Activité. Études de cas #2: Qui pose la question? La question est-elle.
Chapitre 3: Variables aléatoires réelles continues
TNS et Analyse Spectrale
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Échantillonnage aléatoire simple
Chapitre 4 Variables aléatoires discrètes
Post-optimisation, analyse de sensibilité et paramétrage
JEAN-MARC FONTAN SOC-1101 COURS 4
Études de Marché Dess communication de masse
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 13/08/2015 6:59 PM Bootstrap et permutations.
Échantillonnage (STT-2000)
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Échantillonnage (STT-2000)
MODULE FTH 2007 Diversité génétique
Statistique Descriptive Les Paramètres de Tendance Centrale
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Validation d’une méthode d’analyse
1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.
ECHANTILLONAGE ET ESTIMATION
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Distributions d’échantillonnage pour des proportions
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Introduction aux statistiques Intervalles de confiance
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
STATISTIQUE DESCRIPTIVE
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

Concepteur de cours: M. BOUKHEROUFA MA A. Université de Tarf INTRODUCTION GENERALE

ECHANTILLONNAGE ECHANTILLONNAGE x x x x x x x x x x x x x x x x x x x x xx xx x x x xx x x x x x x x x x x xx x x x x xx x x

x x x x x x x x x x x x x x x x x x x x xx xx x x x xx x x x x x x x x x x xx x x x x xx x x

La notion d’échantillonnage est liée à celle de stratégie, qui doit assurer le meilleur compromis entre: 1. L’objectif de l’étude (hypothèse correctement posée) 2. Les contraintes naturelles (hétérogénéité spatiale, échelles signifiantes …) 3. Les contraintes techniques (temps disponible, fiabilité des mesures …) 4. Les contraintes mathématiques (qualité des données …)

PROBLEMATIQUE DE L’ETUDE (pré modèles) PROBLEMATIQUE DE L’ETUDE (pré modèles) PLANIFICATION DE L’ÉCHANTILLONNAGE (nombre et disposition spatio – temporelle des échantillons, précision des mesures, etc.) PLANIFICATION DE L’ÉCHANTILLONNAGE (nombre et disposition spatio – temporelle des échantillons, précision des mesures, etc.) MODÈLES DE FONCTIONNEMENT Analyse et interprétation des résultats CONCEPTUALISATION (théories,etc.) CONCEPTUALISATION (théories,etc.) MOTIVATIONS ECONOMIQUES (gestion des ressources) MOTIVATIONS ECONOMIQUES (gestion des ressources) Objectifs scientifiques Objectifs de développement Modification du pré modèle

Pourquoi travaille-t-on sur un échantillon ? coût temps impossibilité d’avoir la population entière Tests destructifs

Quand il n’y a pas d’extrapolation/d’incertitude Statistiquement, cela arrive quand nous échantillonnons la population d’intérêt en entier Plan d’échantillonnage : cas où il n’est pas requis Ex: dénombrer tous les oiseaux nicheurs sur la seule île où ils se reproduisent

Surveillance sans extrapolation Centrale électrique cours d’eau surveillance du chlore au point de rejet au point de rejet, au moment où nous prenons les mesures Nous sommes seulement intéressés à connaître les valeurs du chlore provenant de cette centrale électrique en particulier, au point de rejet, au moment où nous prenons les mesures.

Surveillance avec extrapolation  Mais si nous étions intéressés à connaître les teneurs en chlore provenant d’autres centrales électriques? Ou celles dans d’autres tronçons du cours d’eau? Ou à d’autres moments?  Le nombre de sites à surveiller ou leur superficie deviennent rapidement des facteurs prohibitifs en termes de coûts et de temps.  En général, nous devons échantillonner une portion de la superficie qui nous intéresse ou au moment qui nous intéresse, puis extrapoler les résultats à des endroits et à des moments non échantillonnés : c’est-à-dire que nous voulons que les résultats de la surveillance d’une centrale électrique donnée nous informent sur d’autres centrales électriques, qui n’ont pas été échantillonnées. Centrale électrique Centrale électrique Centrale électrique Centrale électrique Centrale électrique Centrale électrique Centrale électrique Centrale électrique cours d’eau Centrale électrique Centrale électrique Centrale électrique Centrale électrique Centrale électrique

Différents types d’échantillonnages : Types non probabilistes: - Choix irrationnel des échantillons, cette procédure est à rejeter -échantillonnage subjectif: les critères sont propres à l’observateur. Bien que cette procédure soit satisfaisante, les observations recueillies ne se prêtent pas à un traitement statistique rigoureux. Types probabilistes: (Stratégie d’échantillonnage) - Échantillonnage systématique - Échantillonnage aléatoire - Échantillonnage stratifié

Stratégies d’échantillonnage Échantillonnage systématique Échantillonnage aléatoire Échantillonnage stratifié

Échantillonnage systématique zone d’intérêt Choisir au hasard un point de départ, qui constituera le coin de la grille

Avantages 1.Bonne couverture spatiale 2.Permet d’éviter l’agglutination des points (de suréchantillonner certaines zones) Désavantages 1.Difficile d’ajouter ou de remplacer des sites 2.Ne permet pas l’échantillonnage proportionnel 3.Pas réellement aléatoire Échantillonnage systématique

Exemple Programme de surveillance de la biodiversité de l’Alberta Échantillonnage systématique

Échantillonnage aléatoire simple : le type d’échantillonnage le plus courant – Définir la zone d’intérêt – Choisir des coordonnées (x,y) aléatoires pour chacun des points d’échantillonnage – Conserver les points d’échantillonnage qui se trouvent dans la zone d’intérêt Les points sont aléatoirement placés dans la zone d’intérêt Échantillonnage aléatoire

zone d’intérêt 16 points aléatoires Échantillonnage aléatoire

Avantages 1.En théorie, on peut extrapoler les résultats et les appliquer à la zone entière 2.Il est facile d’ajouter de nouveaux points Désavantages 1.Les sites peuvent être agglutinés 2.Il n’est pas garanti que la couverture spatiale soit bonne Échantillonnage aléatoire

Un autre type d’échantillonnage consiste à intégrer les strates directement dans le plan d’échantillonnage Échantillonnage aléatoire stratifié : Dans chaque strate, choisir un nombre égal de points placés aléatoirement Échantillonnage stratifié

Zone non homogène (3strates) (zone Hétérogènes)

L’échantillonnage aléatoire simple peut être inadéquat cette strate n’est pas échantillonnée Échantillonnage stratifié

L’échantillonnage systématique peut normalement surmonter cet obstacle Échantillonnage stratifié

5 sites d’échantillonnage par strate meilleure couverture spatiale strate 1 strate 2 strate 3 Échantillonnage stratifié Solution ; Échantillonnage aléatoire simple ou systématique par strate

Avantages 1.L’échantillonnage est équilibré en fonction des principales strates 2.Il est facile d’ajouter de nouveaux points Désavantages 1.Souvent, plus il y a de strates, plus il faut d’échantillons 2.Il n’est pas garanti que c’est la « bonne » strate qui soit utilisée. Échantillonnage stratifié

Mise en garde : Il ne faut stratifier qu’en fonction des variables qui, selon vous, exercent une grande incidence sur les éléments faisant l’objet de votre surveillance salinité altitude température ph Variables Taille de la population Échantillonnage stratifié

5 Petits 5 Petits Grands Grands 500 Moyens 500 Moyens 5 Petits 5 Petits Grands Grands 500 Moyens 500 Moyens 5 Petits 5 Petits Grands Grands 500 Moyens 500 Moyens Possibilité d’étude: 12 points Effectif total de la population = individus Bonne estimation de la population 5 Petits 5 Petits Grands Grands 250 Moyens 250 Moyens 250 Moyens 250 Moyens Sur estimation ou sous estimation de la population Sur estimation ou sous estimation de la population Sur estimation ou sous estimation de la population Limites réelles des strates (le bon descripteur!) Bonnes variables bonnes strates

Exemple d’un échantillonnage en milieu aquatique réseau du cours d’eau L’habitat est linéaire :

Choix des variables Complétude: choix d’un ensemble de variables qui permet de décrire toutes les situations Pertinence: si l’information apportée répond aux objectifs et est conforme au prémodèle Indépendance: absence de redondance entre les variables Validité: dans quelle mesure la variable correspond au concept étudié (ex. hétérogénéité paysagère) Manque à gagner: au détriment de quelle partie de l’étude se fait l’ajout d’une nouvelle variable?

Choix des dispositifs de mesure Fidélité: la multiplication des mesures du même élément dans des conditions semblables fournit des résultats identiques Justesse: absence d’erreur systématique (biais) Sensibilité: pouvoir de résolution = plus petite différence détectable Précision = fidélité + justesse + sensibilité

La distribution spatiale des individus La répartition au hasard La répartition au hasard correspond comme son nom l’indique à une distribution au hasard des individus. Comme la répartition régulière, elle est plutôt rare et se trouve chez les populations qui n’ont aucune tendance au regroupement et qui vivent dans des milieux homogènes. La répartition en agrégats (ou contagieuse) Il y a répartition en agrégats lorsque les individus sont regroupés. C’est la répartition la plus fréquente. Elle peut être due: - Au comportement des adultes qui recherchent le voisinage de leurs semblables. - à des variation dans les caractéristiques du milieu qui amènent les individus à se regrouper dans les zones les plus favorables La répartition régulière ou uniforme On a une répartition régulière ou uniforme lorsque les individus sont situés à égale distance les uns des autres cette répartition est rare car la répartition est souvent perturbée par l’hétérogénéité du milieu. Ce type de répartition ne se rencontre à l’état naturel que lorsqu’il existe une compétition intense entre les individus

Echelle de perception et taille des relevés

En général; L’ échantillon ≠ 1 seul relevé relevé

Un échantillon = plusieurs relevés Pour une meilleure estimation de la population

La plus petite aire sur laquelle la quasi totalité des espèces d’une communauté végétales sont représentées. Au niveau de la surface représentée par l’ Aire minimale, l’écologiste est sûr de relever la majorité des espèces du groupement ou de l’association. 1m / 1 m 2 2m / 4 m 2 4m / 16 m 2 Aire minimale Un relevé L’aire minima varie d’un type de formation à un autre. Ex. Pelouse : 1 à 4 m² Forêt de chêne liège : 100 m² Steppe : 32 m² Désert : 100 m² et plus Surface en m 2 0 Nombre d’espèces Aire minimale

Temps d’écoute (minute) 0 Nombre d’espèces Temps minimal pour les animaux, on parle d’ effort d’échantillonnage Ex: (oiseaux) temps minimal d’écoute I.P.A. (indice ponctuel d’abondance) - mise au point par Ferry et Frochot (1958) - position fixe pendant 20 mn distance minimale de rencontre I.K.A. (indice kilométrique d’abondance) - mise au point par Blondel, Ferry et Frochot (1970) - itinéraire rectiligne (de 500 à 1000 mètres).

Exercice: dessinez la courbe de l’aire minimale 1m / 1 m 2 2m / 4 m 2 4m / 16 m 2

Richesse totale Homogénéité des peuplements Fréquence d’occurrence ou Indice de présence Fréquence relative ou (Abondance relative) Indice de diversité de Shannon Nombre d’apparition AbondanceAbondance BiomasseBiomasse Equirépartition ou Equitabilité Richesse moyenne Paramètres de structure des Paramètres de structure des peuplements

4 espèces 5 3 Richesse totale « S » La richesse totale d’un peuplement est le nombre total d’espèces de ce peuplement. C’est le nombre total d’espèces contactées au cours d’une série de n relevés réalisés dans un milieu. Homogénéité des peuplements « T » Le degré d’homogénéité globale intra-biotope d’un peuplement est mesuré à partir de l’écart de la richesse moyenne par rapport à la richesse totale. Plus cet écart est important et plus le peuplement est hétérogène ; cet hétérogénéité étant surtout conditionnée par le nombre d’espèces rares présentes dans le biotope échantillonné. T=100 s/S. T augmente avec le degrés d’homogénéité du peuplement. Richesse moyenne « s » La richesse moyenne d’un peuplement est la moyenne des richesses par relevé. Ce paramètre n’accorde qu’un faible poids aux espèces rares et n’exprime, par conséquent, que le nombre d’espèces que l’on peut considérer comme représentatives d’un milieu donné. Relevés Peuplement (ici = 6) ((4+5+3)/3 = 4) (T = 100 (4 / 6) = 66,67 %) Paramètres de structure des Paramètres de structure des peuplements

N. A I. P = x 100 ou : N. A : Nombre d’apparition N t N t : Nombre total des relevés Fréquence d’occurrence ou Indice de présence (I.P en %) L’indice de présence exprime le nombre d’apparition d’une espèce sur le nombre total des relevés : Nombre d’apparition (N.A) Il se définit comme étant le nombre de fois qu’on rencontre une espèce dans l’ensembles de la population. N.A = 3= 3 = 2= 2 = 1= 1 = 0= 0 I.P3 / 3 = 1 x 100 = 100 % I.P 2 / 3 = 0,67 x 100 = 67 % 0 / 3 = 0 x 100 = 0 %

Biomasse : poids des organismes vivants exprimé soit en poids frais, soit en poids sec, soit en carbone organique. La biomasse peut être évaluée pour une superficie déterminée, pour une espèce ou un groupe d’organismes déterminé. Ab Pi = x 100 ou : Ab : Abondance de l’espèce i Ab t Ab t : Abondance totale du peuplement. Abondance (Ab) L’Abondance se définit comme étant l’effectif total d’une espèce i (nombre d’individus) Fréquence relative ou (Abondance relative) C’est l’Abondance d’une espèce i par rapport à l’Abondance totale de toutes les espèces du peuplement. Elle est exprimée en pourcentage. Ab = 5= 5 = 2= 2 = 3= 3 F.R2 / 17 = 0,12 x 100 = 12 %

Equirépartition ou Equitabilité (E) : Le calcule de l’équitabilité nous permet de distinguer dans quelle mesure les diversités (H’) se rapproche de la diversité maximale (H max), laquelle correspond à l’équilibre stable compatible avec le milieu. L’indice d’équitabilité est donné par la formule suivante: H’ E = x 100 ou : H’ : diversité de SHANNON H max H max : diversité maximale Cette diversité est encore appelée : diversité intra – biotope ; elle mesure le niveau de complexité du peuplement. Plus les espèces sont nombreuses, plus leur abondances sont voisines et plus la diversité du peuplement est élevée. La diversité maximale H’ max est fonction du nombre total des espèces du peuplement H max = log 2 S ou : S : Nombre total des espèces du peuplement. Indice de diversité de Shannon (H’): L’indice de diversité permet d’exprimer la structure d’un peuplement et le façon dont les individus sont répartis entre diverses espèces. H’ = - ∑ pi log 2 pi ou : pi : la fréquence relative de l’espèce i (proportion de l’espèce i) S i = 1

Milieu de bonne qualité H’H’H’

Amplitude d’habitat « AH » L’amplitude d’habitat d’une espèce est une mesure de la plasticité écologique d’une espèce vis à vis d’un descripteur du milieu. AH est bornée par la valeur -1- lorsque l’espèce n’est présente que dans un seul milieu (auquel cas elle sera qualifiée de spécialiste), à n = nombre total de milieux (auquel cas elle sera qualifiée de généraliste). AH = e H’ avec H’= -  Pi ln Pi. Pi étant la proportion de l’espèce « i » dans le milieu. Ex: Gradient de salinité Espèce spécialiste Espèce généraliste Espèce plutôt spécialiste

Les erreurs Les méthodes d’échantillonnage peuvent être sources d’erreurs. Un certain nombre d’erreurs pourront être éliminées, certaines pourront être réduites, mais d’autres persisteront.

Les erreurs dues aux instruments de mesure Un instrument est fidèle s’il répond exactement de la même façon quand il est placé dans deux situations identiques. Un instrument est valide lorsqu’il mesure vraiment ce qu’il est censé mesurer.

Les erreurs dues à l’organisation Ce sont les erreurs qui se glissent lors de la collecte des données. – Est-ce que les consignes ont été respectée? – Les enquêteurs ont-ils agi de la même façon? Pour éviter ces erreurs il faut utiliser les mêmes instruments, les mêmes conditions.

Les erreurs dues à la méthode d’échantillonnage Il faut toujours vérifier, à la lumière des objectifs de l’étude statistique, que la méthode d’échantillonnage est adaptée. En particulier éviter la surreprésentation de certaines parties de la population.

Les erreurs dues au phénomène de non-réponse Même avec la meilleure méthode d’échantillonnage, il se présente toujours un certain nombre de non-répondants, ce qui peut entacher la représentativité de l’échantillon et amener des conclusions erronées.

L’erreur d’échantillonnage Le fait d’étudier un échantillon plutôt qu’un autre engendre forcément une erreur. Cette erreur appelée erreur d’échantillonnage est inévitable.

Il n’existe pas de recette applicable en toute circonstance. Une bonne stratégie d’échantillonnage représente un compromis optimisé entre une hypothèse bien posée et un ensemble de contraintes