Processus ponctuels Caractéristiques et Modèles de répartitions spatiales
Un exemple de répartition spatiale
Objectifs ● Décrire la répartition de points sur un plan, qualitativement et quantitativement ● Construire des modèles aléatoires de répartition d'un ensemble de points dans une surface finie ● Définir une collection de modèles suffisamment riche pour correspondre aux différentes situations
Visualisation des données
Caractéristiques qualitatives ● Abondance ou rareté des points ● Présence notable de groupes de points ou dispersion régulière
Typologie des répartitions
Caractéristiques quantitatives ● Agrégation – On calcule le nombre de voisins de chacun des points dans un cercle de rayon r. On fait varier r. (statistique de Ripley)
Quels modèles? ● Descriptifs ou explicatifs? ● Déterministes ou aléatoires?
Modèles aléatoires de répartition spatiale Processus ponctuels
● On considère que le semis de points observé est le résultat d'un tirage aléatoire selon une certaine loi de probabilité ● Le tirage aléatoire concerne le semis dans son ensemble et non chaque point du semis individuellement ● La construction de la loi de probabilité constitue le modèle
Loi de probabilité diffuse ● Rappel : Loi uniforme sur [0,1] – La probabilité de tirer une valeur particulière X=0,3 est toujours nulle – On définit la loi de probabilité en fixant la probabilité que x appartienne à un sous-intervalle [a,b] P(X [a,b])=b-a. ● La loi de probabilité du processus ponctuel est diffuse – La probabilité associée à un semis fixé est nulle – On définit la loi de probabilité du processus en fixant la probabilité d'ensembles de semis particuliers analogues des intervalles
Construction de la probabilité ● Ensemble de semis – Pour chaque partition finie en rectangles (B i ) du rectangle A – Pour chaque suite d'entiers (n i ) correspondant aux (B i ) – On définit S l'ensemble des semis comportant n i points dans B i ● Définition de la loi de probabilité – On définit P(S) comme fonction des (B i,n i ). Cette fonction doit être cohérente avec la définition des probabilités – L'ensemble I des semis ayant une infinité de points a une probabilité nulle
Processus ponctuels indépendants ● Processus de Poisson homogène ● Processus de Poisson inhomogène
Processus de Poisson homogène ● Rappel : Loi de Poisson P ( ) définie sur N – Exercice : Montrer que la somme de deux variables de Poisson est une variable de Poisson ● Processus de Poisson homogène d'intensité – Pour tout rectangle B dans A, le nombre de points dans B suit une loi de Poisson de paramètre a(B) où a(B) est l'aire de B. – Si B et C sont deux rectangles sans intersection, les nombres de points dans B et C sont deux variables indépendantes
Propriétés ● Si on réunit les semis obtenus à partir de deux processus de Poisson indépendants on obtient un processus de Poisson dont l'intensité est la somme des intensités des deux processus d'origine ● Le processus de Poisson sert de référence aux autres processus, en tant que processus le plus aléatoire : les points du semis apparaissent de façon indépendante les uns des autres, et de façon uniforme sur A.
Simulation ● Le processus de Poisson homogène peut être simulé de la façon suivante – On tire le nombre total N(A) de points du semis suivant une loi de Poisson de paramètre a(A) – On tire successivement et indépendamment N(A) points suivant une loi de probabilité uniforme sur A ● Exercice : montrer qu'on obtient bien un processus de Poisson correspondant à la définition précédente
Processus de Poisson inhomogène ● Le processus inhomogène est une modification du processus homogène dans lequel les points apparaissent préférentiellement dans certaines zones de A. Soit (x) une fonction intégrable définie sur A. ● Processus de Poisson inhomogène d'intensité – Pour tout rectangle B dans A, le nombre de points dans B suit une loi de Poisson de paramètre (B) où (B) est l'intégrale de la fonction sur B. – Si B et C sont deux rectangles sans intersection, les nombres de points dans B et C sont deux variables indépendantes
Propriétés ● Si on réunit les semis obtenus à partir de deux processus de Poisson indépendants on obtient un processus de Poisson dont l'intensité est la somme des intensités des deux processus d'origine ● Le processus de Poisson inhomogéne est tel que les points du semis apparaissent de façon indépendante les uns des autres, mais pas de façon uniforme sur A. On voit apparaître des agrégats de points dans les zones où la fonction d'intensité est grande.
Simulation ● Le processus de Poisson inhomogène peut être simulé de la façon suivante – On tire le nombre total N(A) de points du semis suivant une loi de Poisson de paramètre (A) – On tire successivement et indépendamment N(A) points suivant une loi de probabilité de densité (x)/ (A) sur A
Conclusion sur les processus de Poisson ● Ces processus sont à la base de la construction de la plupart des processus ponctuels ● Ils présentent des agrégats (pr. inhomogène) ou pas (pr. homogène) ● La position des agrégats est fixe et dépend de la fonction d'intensité ● Dans ces modèles les individus représentés par les points n'interagissent pas ; ils ignorent la position de leurs voisins
Processus ponctuels dépendants ● Processus de Neymann Scott ● Processus de Cox ● Processus markoviens
Processus de Neyman-Scott ● Le processus de Neyman-Scott est défini en deux étapes indépendantes – On tire un semis selon un processus de Poisson homogène – Autour de chaque point obtenu y i, on tire selon un processus de Poisson inhomogène d'intensité f(x-y i )
Remarques ● Les points centres sont effacés du semis final ● Le deuxième tirage n'est pas nécessairement un processus de Poisson : – on choisit une loi discrète quelconque pour tirer le nombre de points – on tire les points indépendamment selon une loi de distribution identique autour de chacun des centres.
Propriétés ● Les points ne sont plus indépendants, les points issus d'un même centre sont plus rapprochés ● Les agrégats apparaissent naturellement ● Leur position est évidemment aléatoire ● Le processus dans son ensemble est homogène : aucune zone de A ne voit apparaître plus de points en moyenne
Processus de Cox ● Les processus de Cox sont également générés en deux étapes – On tire une fonction (x) définie sur A par un tirage aléatoire – On tire un Poisson inhomogène d'intensité (x)
Remarque ● La vraie difficulté consiste en la première étape. ● Exemple – On tire un processus de Poisson sur A et pour chaque point y i obtenu on définit une fonction f(x-y i ) autour du point. On somme toutes les fonctions pour obtenir la fonction g(x). – On effectue un tirage de Poisson inhomogène d'intensité g(x). – On obtient le processus de Neyman-Scott précédent.
Processus markoviens ● Rappel – On considère la loi uniforme sur [0,1] – On choisit une fonction f d'intégrale 1. On définit une nouvelle loi de probabilité par – La fonction f appelée densité de Y par rapport à X introduit une déformation de la loi uniforme. Les intervalle où f est grande ont une probabilité plus forte
Principe ● On veut déformer la loi de probabilité du processus de Poisson homogène pour favoriser les agrégats ● On se fixe une fonction de densité f définie sur un semis S par ● est une fonction d'interaction entre deux points, elle peut être répulsive ou attractive selon les distances entre les points
Exemples ● Processus de Strauss répulsif – <1 et R est le rayon d'interaction – Les semis où deux points sont plus proches que R sont plus rares ● Processus hardcore – Les semis où deux points sont plus proches que R sont interdits
Exemples ● Processus hardcore attractif – >1 et R 1 <R 2 – Les semis où deux points sont plus proches que R 1 sont interdits. – Les semis où deux points sont à distance r telle que R 1 <r<R 2 sont favorisés
Conclusion sur les processus dépendants ● Classes de modèle plus riches, générant des agrégats selon différents principes : – Neyman-Scott : principe de semis – Cox : principe d'environnement aléatoire – Markov : principe de compétition/coopération entre individus
Caractéristiques quantitatives Statistiques définies à partir des données
Abondance/ Rareté Caractérisée par le nombre moyen de points par unité de surface soit globalement (cas homogène) soit localement (cas inhomogène) : choix d’un voisinage ou d’une fonction de lissage
Agrégats Caractérisée par le nombre de voisins de chaque point de l’ensemble Fonction de vide Nombre de voisins
Fonction de vide F(r) est la probabilité d’avoir un point à une distance inférieure à r de l’origine. G(r) est l’espérance pour un point du semis d’avoir un voisin à une distance inférieure à r. J(r) = (1- F(r))/ (1- G(r)) est égale à 1 pour un processus de Poisson homogène 1 si agrégation
Statistique de fonction de vide F(r) est estimé en choisissant une grille fixe de points et en calculant la proportion de points de la grille ayant un point du semis à une distance inférieure à r. G(r) est estimé en comptant la proportion de points du semis ayant un point du semis à une distance inférieure à r.
Statistique de Ripley ● On suppose connue la fonction d'intensité du processus. Pour chaque distance r, on définit la statistique K de Ripley par – La statistique compte le nombre de couples de points à distance inférieure à r
Processus de Poisson homogène ● Dans ce cas, on peut calculer l'espérance de la statistique de Ripley ● L'espérance du nombre de voision à distance r est égale à l'espérance du nombre de point dans un disque de rayon r : il n'y a pas d'effet de la présence du point au centre du cercle ● Pour les représentations graphiques, on définit
Interprétation graphique
Conclusion ● La statistique de Ripley permet de mesurer un écart entre les données issues du modèle de Poisson homogène et les données examinées ● On connaît mal sa distribution pour un r fixé (on peut calculer sa variance) et on sait que les résultats pour différentes valeurs de r sont très dépendantes : difficile de construire un test ● Si le processus est agrégé, elle ne distingue pas entre un effet sur la moyenne de nombre de points (processus inhomogène) ou un effet de dépendance entre les points (Neyman-Scott, Cox, Markov)
Problème de la correction de bords ● Si r est grand par rapport aux dimensions de A
Choix d'une fenêtre plus petite
Cas de deux peuplements