Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.

Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Probabilités et statistiques au lycée
GESTION DE PORTEFEUILLE chapitre n° 7
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Thomas G. Dietterich Approximate Statistical Tests for Comparing
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Inférence statistique
C1 Bio-statistiques F. KOHLER
Inférence statistique
Comparaison de plusieurs moyennes observées
Les TESTS STATISTIQUES
Les TESTS STATISTIQUES
Échantillonnage-Estimation
4 Les Lois discrètes.
Notions de variable aléatoire et de probabilité d’un événement
Moyenne, écart type et incertitude de mesure.
Système formel Nous avons introduit : signes de variables (x, y, z, …), de constantes (0, 1), d’opérations (+, ), de relations (=, ) Axiomes : ce sont.
Les tests d’hypothèses
Statistique et probabilités au collège
variable aléatoire Discrète
Chapitre VII :Commande par retour d’état
                                        République Algérienne Démocratique et Populaire Ministère de l’Enseignement Supérieur et de la Recherche Scientifique.
Traitement de données socio-économiques et techniques d’analyse :
Tests de comparaison de moyennes
Septième étape : travailler avec des graphes probabilistes
Statistique descriptive, analyse de données
Fonction puissance Montage préparé par : André Ross
Nombre de sujets nécessaires en recherche clinique
Groupe 1: Classes de même intervalle
La segmentation
Howell, Chap. 1 Position générale
Comprendre la variation dans les données: Notions de base
TECHNIQUES QUANTITATIVES APPLIQUEES A LA FINANCE
Chapitre 6 Lois de probabilité.
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Algorithmes probabilistes
Régression linéaire (STT-2400)
Electrostatique- Chap.2 CHAPITRE 2 CHAMP ELECTROSTATIQUE Objectif :
Rappels de statistiques descriptives
Présentation du marché obligataire
Probabilités et Statistiques
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
TD4 : « Lois usuelles de statistiques »
STATISTIQUES – PROBABILITÉS
Intervalles de confiance pour des proportions L’inférence statistique
Probabilités (suite).
Chapitre 3: Variables aléatoires réelles continues
TNS et Analyse Spectrale
Les fonctions de référence
Étude de l’écoulement moyen
Probabilités et Statistiques Année 2009/2010
Principales distributions théoriques
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
CHAPITRE 5. La théorie de l’assurance
Chapitre 4 Variables aléatoires discrètes
Rappel de statistiques
STATISTIQUES DESCRIPTIVES
Séries chronologiques univariées (STT-6615)
Analyse des semis de point
CHAPITRE 2 LES SITUATIONS FONCTIONNELLES
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.
ECHANTILLONAGE ET ESTIMATION
LES POSTULATS DE LA MÉCANIQUE QUANTIQUE
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Introduction aux statistiques Intervalles de confiance
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
STATISTIQUE DESCRIPTIVE
Transcription de la présentation:

Processus ponctuels Caractéristiques et Modèles de répartitions spatiales

Un exemple de répartition spatiale

Objectifs ● Décrire la répartition de points sur un plan, qualitativement et quantitativement ● Construire des modèles aléatoires de répartition d'un ensemble de points dans une surface finie ● Définir une collection de modèles suffisamment riche pour correspondre aux différentes situations

Visualisation des données

Caractéristiques qualitatives ● Abondance ou rareté des points ● Présence notable de groupes de points ou dispersion régulière

Typologie des répartitions

Caractéristiques quantitatives ● Agrégation – On calcule le nombre de voisins de chacun des points dans un cercle de rayon r. On fait varier r. (statistique de Ripley)

Quels modèles? ● Descriptifs ou explicatifs? ● Déterministes ou aléatoires?

Modèles aléatoires de répartition spatiale Processus ponctuels

● On considère que le semis de points observé est le résultat d'un tirage aléatoire selon une certaine loi de probabilité ● Le tirage aléatoire concerne le semis dans son ensemble et non chaque point du semis individuellement ● La construction de la loi de probabilité constitue le modèle

Loi de probabilité diffuse ● Rappel : Loi uniforme sur [0,1] – La probabilité de tirer une valeur particulière X=0,3 est toujours nulle – On définit la loi de probabilité en fixant la probabilité que x appartienne à un sous-intervalle [a,b] P(X  [a,b])=b-a. ● La loi de probabilité du processus ponctuel est diffuse – La probabilité associée à un semis fixé est nulle – On définit la loi de probabilité du processus en fixant la probabilité d'ensembles de semis particuliers analogues des intervalles

Construction de la probabilité ● Ensemble de semis – Pour chaque partition finie en rectangles (B i ) du rectangle A – Pour chaque suite d'entiers (n i ) correspondant aux (B i ) – On définit S l'ensemble des semis comportant n i points dans B i ● Définition de la loi de probabilité – On définit P(S) comme fonction des (B i,n i ). Cette fonction doit être cohérente avec la définition des probabilités – L'ensemble I des semis ayant une infinité de points a une probabilité nulle

Processus ponctuels indépendants ● Processus de Poisson homogène ● Processus de Poisson inhomogène

Processus de Poisson homogène ● Rappel : Loi de Poisson P ( ) définie sur N – Exercice : Montrer que la somme de deux variables de Poisson est une variable de Poisson ● Processus de Poisson homogène d'intensité  – Pour tout rectangle B dans A, le nombre de points dans B suit une loi de Poisson de paramètre  a(B) où a(B) est l'aire de B. – Si B et C sont deux rectangles sans intersection, les nombres de points dans B et C sont deux variables indépendantes

Propriétés ● Si on réunit les semis obtenus à partir de deux processus de Poisson indépendants on obtient un processus de Poisson dont l'intensité est la somme des intensités des deux processus d'origine ● Le processus de Poisson sert de référence aux autres processus, en tant que processus le plus aléatoire : les points du semis apparaissent de façon indépendante les uns des autres, et de façon uniforme sur A.

Simulation ● Le processus de Poisson homogène peut être simulé de la façon suivante – On tire le nombre total N(A) de points du semis suivant une loi de Poisson de paramètre  a(A) – On tire successivement et indépendamment N(A) points suivant une loi de probabilité uniforme sur A ● Exercice : montrer qu'on obtient bien un processus de Poisson correspondant à la définition précédente

Processus de Poisson inhomogène ● Le processus inhomogène est une modification du processus homogène dans lequel les points apparaissent préférentiellement dans certaines zones de A. Soit  (x) une fonction intégrable définie sur A. ● Processus de Poisson inhomogène d'intensité  – Pour tout rectangle B dans A, le nombre de points dans B suit une loi de Poisson de paramètre  (B) où  (B) est l'intégrale de la fonction  sur B. – Si B et C sont deux rectangles sans intersection, les nombres de points dans B et C sont deux variables indépendantes

Propriétés ● Si on réunit les semis obtenus à partir de deux processus de Poisson indépendants on obtient un processus de Poisson dont l'intensité est la somme des intensités des deux processus d'origine ● Le processus de Poisson inhomogéne est tel que les points du semis apparaissent de façon indépendante les uns des autres, mais pas de façon uniforme sur A. On voit apparaître des agrégats de points dans les zones où la fonction d'intensité est grande.

Simulation ● Le processus de Poisson inhomogène peut être simulé de la façon suivante – On tire le nombre total N(A) de points du semis suivant une loi de Poisson de paramètre  (A) – On tire successivement et indépendamment N(A) points suivant une loi de probabilité de densité  (x)/  (A) sur A

Conclusion sur les processus de Poisson ● Ces processus sont à la base de la construction de la plupart des processus ponctuels ● Ils présentent des agrégats (pr. inhomogène) ou pas (pr. homogène) ● La position des agrégats est fixe et dépend de la fonction d'intensité ● Dans ces modèles les individus représentés par les points n'interagissent pas ; ils ignorent la position de leurs voisins

Processus ponctuels dépendants ● Processus de Neymann Scott ● Processus de Cox ● Processus markoviens

Processus de Neyman-Scott ● Le processus de Neyman-Scott est défini en deux étapes indépendantes – On tire un semis selon un processus de Poisson homogène – Autour de chaque point obtenu y i, on tire selon un processus de Poisson inhomogène d'intensité f(x-y i )

Remarques ● Les points centres sont effacés du semis final ● Le deuxième tirage n'est pas nécessairement un processus de Poisson : – on choisit une loi discrète quelconque pour tirer le nombre de points – on tire les points indépendamment selon une loi de distribution identique autour de chacun des centres.

Propriétés ● Les points ne sont plus indépendants, les points issus d'un même centre sont plus rapprochés ● Les agrégats apparaissent naturellement ● Leur position est évidemment aléatoire ● Le processus dans son ensemble est homogène : aucune zone de A ne voit apparaître plus de points en moyenne

Processus de Cox ● Les processus de Cox sont également générés en deux étapes – On tire une fonction  (x) définie sur A par un tirage aléatoire – On tire un Poisson inhomogène d'intensité  (x)

Remarque ● La vraie difficulté consiste en la première étape. ● Exemple – On tire un processus de Poisson sur A et pour chaque point y i obtenu on définit une fonction f(x-y i ) autour du point. On somme toutes les fonctions pour obtenir la fonction g(x). – On effectue un tirage de Poisson inhomogène d'intensité g(x). – On obtient le processus de Neyman-Scott précédent.

Processus markoviens ● Rappel – On considère la loi uniforme sur [0,1] – On choisit une fonction f d'intégrale 1. On définit une nouvelle loi de probabilité par – La fonction f appelée densité de Y par rapport à X introduit une déformation de la loi uniforme. Les intervalle où f est grande ont une probabilité plus forte

Principe ● On veut déformer la loi de probabilité du processus de Poisson homogène pour favoriser les agrégats ● On se fixe une fonction de densité f définie sur un semis S par ●  est une fonction d'interaction entre deux points, elle peut être répulsive ou attractive selon les distances entre les points

Exemples ● Processus de Strauss répulsif –  <1 et R est le rayon d'interaction – Les semis où deux points sont plus proches que R sont plus rares ● Processus hardcore – Les semis où deux points sont plus proches que R sont interdits

Exemples ● Processus hardcore attractif –  >1 et R 1 <R 2 – Les semis où deux points sont plus proches que R 1 sont interdits. – Les semis où deux points sont à distance r telle que R 1 <r<R 2 sont favorisés

Conclusion sur les processus dépendants ● Classes de modèle plus riches, générant des agrégats selon différents principes : – Neyman-Scott : principe de semis – Cox : principe d'environnement aléatoire – Markov : principe de compétition/coopération entre individus

Caractéristiques quantitatives Statistiques définies à partir des données

Abondance/ Rareté Caractérisée par le nombre moyen de points par unité de surface soit globalement (cas homogène) soit localement (cas inhomogène) : choix d’un voisinage ou d’une fonction de lissage

Agrégats Caractérisée par le nombre de voisins de chaque point de l’ensemble Fonction de vide Nombre de voisins

Fonction de vide F(r) est la probabilité d’avoir un point à une distance inférieure à r de l’origine. G(r) est l’espérance pour un point du semis d’avoir un voisin à une distance inférieure à r. J(r) = (1- F(r))/ (1- G(r)) est égale à 1 pour un processus de Poisson homogène 1 si agrégation

Statistique de fonction de vide F(r) est estimé en choisissant une grille fixe de points et en calculant la proportion de points de la grille ayant un point du semis à une distance inférieure à r. G(r) est estimé en comptant la proportion de points du semis ayant un point du semis à une distance inférieure à r.

Statistique de Ripley ● On suppose connue la fonction d'intensité du processus. Pour chaque distance r, on définit la statistique K de Ripley par – La statistique compte le nombre de couples de points à distance inférieure à r

Processus de Poisson homogène ● Dans ce cas, on peut calculer l'espérance de la statistique de Ripley ● L'espérance du nombre de voision à distance r est égale à l'espérance du nombre de point dans un disque de rayon r : il n'y a pas d'effet de la présence du point au centre du cercle ● Pour les représentations graphiques, on définit

Interprétation graphique

Conclusion ● La statistique de Ripley permet de mesurer un écart entre les données issues du modèle de Poisson homogène et les données examinées ● On connaît mal sa distribution pour un r fixé (on peut calculer sa variance) et on sait que les résultats pour différentes valeurs de r sont très dépendantes : difficile de construire un test ● Si le processus est agrégé, elle ne distingue pas entre un effet sur la moyenne de nombre de points (processus inhomogène) ou un effet de dépendance entre les points (Neyman-Scott, Cox, Markov)

Problème de la correction de bords ● Si r est grand par rapport aux dimensions de A

Choix d'une fenêtre plus petite

Cas de deux peuplements