Analyse des semis de point

Slides:



Advertisements
Présentations similaires
Introduction à l’analyse
Advertisements

Comparaison d’une moyenne observée à une moyenne théorique
Présentation des données
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Les tests d’hypothèses (II)
Les tests d’hypothèses (I)
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Echantillonnage Introduction
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Les TESTS STATISTIQUES
Comparaison de plusieurs moyennes Analyse de variance
Nombre de sujets nécessaires en recherche clinique
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Les tests d’hypothèses
Comparaison de plusieurs moyennes Analyse de variance
Régression -corrélation
Statistiques et Probabilités au lycée
Traitement de données socio-économiques et techniques d’analyse :
Tests de comparaison de moyennes
Chapitre 2 Les indices.
RECONNAISSANCE DE FORMES
Nombre de sujets nécessaires en recherche clinique
Howell, Chap. 1 Position générale
Mesures de répartition de la population Claude Marois 2012.
La corrélation et la régression multiple
La corrélation et la régression
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
La corrélation et la régression
Corrélation Principe fondamental d’une analyse de corrélation
Régression linéaire multiple : hypothèses & interprétation
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Méthodes de Biostatistique
Méthodes de Biostatistique
Scénario Quatre hommes entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones cellulaires.
Activité 1 sommaire Vous avez redécouvert ce que l'on appelle le principe 68%-95%-99,7% : Ce principe est valable pour des distributions de fréquences.
Théorème de la limite centrale l’inférence statistique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
M2 Sciences des Procédés - Sciences des Aliments
STATISTIQUES – PROBABILITÉS
Intervalles de confiance pour des proportions L’inférence statistique
Chapitre 3: Variables aléatoires réelles continues
Étude de l’écoulement moyen
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Tests d’ajustement à une distribution théorique
Méthodologie de l’observation
Analyse de données Cours 3 Analyse en composantes principales (ACP)
STATISTIQUES.
Opération et systèmes de décision Faculté des Sciences de l ’administration MQT Probabilités et statistique Les statistiques descriptives.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ECHANTILLONAGE ET ESTIMATION
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Jean Gaudart1 Détection de clusters spatiaux d'évènements Jean Gaudart Labo. Biostatistiques Faculté de Médecine de Marseille.
Chap. III Statistiques inférentielles
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

Analyse des semis de point

Examiner les données spatiales Comment les données sont-elles distribuées dans l’espace? Agglomérées? Dispersées? Aléatoires?

Statistiques spatiales inférentielles Analyse par semis de points: Espacement entre les points individuels Analyse de patron régional: Nature des patrons des points

Analyse par semis de points Ensemble d’outils quantitatifs visant à examiner la relation spatiale entre la localisation de points dans le paysage, tels que représentés par une carte conventionnelle. Deux méthodes sont utilisées: l’analyse par plus proche voisin (nearest neighbor analysis) et l’analyse de quadrats (quadrat analysis). McGrew and Monroe, 2000

Analyse par plus proche voisin La distance de chaque point à son voisin le plus proche est mesurée. La distance moyenne est calculée pour tous les points. On peut comparer les résultats avec la moyenne attendue pour une distribution aléatoire.

Analyse par plus proche voisin La distance au plus proche voisin (NND) est déterminée comme étant le point le plus près avec la distance euclidienne (ligne droite). La distance moyenne est donc calculée comme suit: NND = ∑NND n

Analyse par plus proche voisin L’utilité de la distance moyenne est de permettre la comparaison d’indices calculés à partir de patrons observés aux résultats produits par différentes distributions de points. On peut comparer les résultats avec des valeurs pour des distributions aléatoires, agglomérées ou disperses.

Distribution aléatoire Pour une distribution aléatoire, la distance moyenne des voisins les plus proches est calculée comme suit: NNDR = 1 Densité 2 Densité = # de points / région

Distribution de dispersion maximale Si la distribution est parfaitement uniforme, la moyenne sera calculée comme suit: NNDD = 1.07453 Densité

Distribution agglomérée Quand tous les points sont se situent sur les mêmes coordonnées (c’est-à-dire, quand il y a groupement maximal), la distance moyenne est 0 NNDC =

Problème La distance moyenne est une valeur absolue. Elle est fonction des unités servant à mesurer la distance. La valeur pour une distribution dispersée est fonction de la densité des points. Comment peut-on comparer des données de différentes régions ou études?

Indice standardisé de voisin le plus proche NND NNDR R =

Indice standardisé de voisin le plus proche Un patron de points peut être mesuré pour l’espacement relatif avec une échelle continue: R = 1 Distribution aléatoire R = 0 Distribution agglomérée R > 1 Distribution dispersée

Indice standardisé de voisin le plus proche Calculer la dispersion maximale pour l’indice standardisé de voisin le plus proche: NNDD NNDR R =

Test de Significativité On peut tester si une différence significative existe entre les valeurs observées et des valeurs de plus proche voisin aléatoires

Test de Significativité NND - NNDR σNND Zn = où σNND = 0.26136 n (Densité)

Test de Significativité

L’histogramme de fréquence peut être divisé en différents sections, où chacune contient une certaine proportion des données. Chaque section correspond à un écart-type. σ σ σ σ σ σ

Chaque écart-type correspond à un score Z particulier. σ σ σ σ σ σ

On peut déterminer si un échantillon est significativement différent de la moyenne en calculant le score Z. Si le score Z tombe dans la section de rejet avec un certain niveau de confiance, l’échantillon est significativement different de la moyenne.

La même logique peut être utilisée pour déterminer si un échantillon de points est significativement différent d’un échantillon aléatoire. Par exemple, on peut être certain à 95% qu’un échantillon est différent d’un échantillon aléatoire si le score Z est plus grand que 1.96 ou inférieur à -1.96. Random

Analyse de quadrats

Analyse de quadrats S’intéresse à la fréquence de points apparaissant à certains endroits d’une aire d’étude. Le patron de point dans l’aire d’étude est décrit en analysant la distribution des fréquences de cellules.

Dispersé Aggloméré Aléatoire

Analyse de quadrats Dans l’analyse de quadrats, un indice de ratio variance-moyenne (VMR) standardise le degree de variabilité dans les fréquence des cellules relativement à la moyenne des fréquences: Écart-type pondéré Moyenne pondérée VMR = VAR MEAN

Fréquence moyenne cellulaire où n = nombre de points m = nombre de cellules MEAN = n m

Variance des fréquences cellulaires où fi = fréquence des cellules avec i cas de choléra Xi = nombre de cas de choléra par cellule ∑ fi Xi2 – ((∑ fi Xi )2 / m) m - 1 VAR =

Ratio variance-moyenne (VMR) Si chaque cellule contient le même nombre de points, alors le VMR = 0 Si un patron de point est hautement aggloméré avec la plupart des cellules ne contenant aucun point, le VMR sera très élevé.

Ratio variance-moyenne (VMR) Si le patron de point est parfaitement aléatoire, alors la fréquence moyenne cellulaire sera égale à la variance des fréquences cellulaires, et le VMR = 1.

Test inférentiel de stochasticité Appliqué pour déterminer si une distribution de points est aléatoire. Le test statistique utilise est le khi-carré: X2 = VMR (m – 1)

Test statistique de Khi-Carré L’hypothèse nulle est qu’il n’y a aucune différence entre la distribution observée et la distribution resultant d’un processus aléatoire: c.-à-d. VMR = 1

Test statistique du Khi-Carré Rejet de l’hypothèse nulle lorsque X2 = 1 Si X2 > 1, alors la distribution des points est plus agglomérée; plus la valeur est élevée, plus il y a agglomeration. Si X2 < 1, il y a une distribution dispersée