Méthodes statistiques appliquées à la cosmologie Luminy le 20/9/02 André Tilquin (CPPM) m, ,w0,w1 2
Méthodes statistiques appliquées à la cosmologie Introduction: Nature du problème Mathématique et définition Probabilité et 2 Transport des erreurs Interprétation graphique et contour Contraintes externes Minimisation Erreurs systématiques Application à SNAP Le modèle cosmologique Erreur sur les paramètres cosmologiques Dégénérescences et contraintes externes Non linéarité et contour de probabilité Problème en suspend
Problème général(1) Supposons une mesure de N Supernovae à différents redshift et un modèle: Comment trouver la meilleur courbe ? On cherche la courbe qui passe au plus près de chacun des points: Mais les points les mieux mesurés doivent avoir plus de poids
Statistique nécessaire Problème général(2) Le problème ce ramène à: Trouver les valeurs des k tels que 2 soit minimum Déterminer les erreurs sur les k a partir des erreurs sur mi Statistique nécessaire
Probabilité Gaussienne Dans toute la suite nous supposerons que les erreurs de mesure sont Gaussiennes, i.e si l’on répète N fois la même mesure alors la distribution des mesures suit la distribution en probabilité: Avec valeur moyenne: Variance ou erreur:
Cas de N variables (corrélation) Supposons « n » mesures Gaussiennes : Coefficient de corrélation. Déterminant Cas à 2 variables: Si =0 Si =1 V est singulière
Maximum de vraisemblance(=0). Quelle est la courbe la plus vraisemblable ? Réponse : La courbe la plus probable ! La probabilité de la courbe est définie comme le produit des probabilités de chaque point d’être autour de cette courbe: Il faut maximiser L par rapport au k Comme il est plus simple de travailler avec des sommes Il faut minimiser par rapport au k
Quelques propriétés du 2 Probabilité et 2 : Par définition Définition matricielle: Dérivée seconde: La dérivée première du 2 donne le minimum La dérivée seconde du 2 donne l’inverse de la matrice d’erreur indépendante des points de mesures.
Densité de probabilité du 2 Densité de probabilité du 2:Supposons que l’on mesure N fois une variable x. Pour chaque mesure on a : Dans le cas de n degré de liberté i.e n points de mesure On montre que: La valeur moyenne du 2 est n La variance est 2n Donc, la premier test de compatibilité entre des mesures et un modèle est de vérifier que Attention au fait que la variance est 2n
Niveau de confiance On définit le niveau de confiance (ou confidence level) comme la probabilité que toute nouvelle expérience donne un 2 supérieur: 10% des expériences donneront 2>16 Définition de l’écart standard: Le résultat d’une mesure avec une erreur à « s » sigma. n=1, p=68% Pour 2 (ou plus) variables mesurées simultanément un résultat à « s » écart est défini avec le 2, mais les probabilités dépendent du nombre de variables. n=2, p=39% n=2, p=68% Pour plusieurs mesures simultanées on parle plutôt de la probabilité !!!
Propriété du niveau de confiance Densité de probabilité du niveau de confiance h() : N mesures pour les quelles on calcule un 2 En utilisant la loi de conservation des probabilités Si le modèle est correcte, et si les erreurs sont uniquement statistiques et correctement estimées, la densité de probabilité du niveau de confiance doit être plate, i.e les mesures de k se répartissent uniformément entre 0 et 1.
Application au fit des courbes de lumières Supposons que nous ayons N courbes de lumières ajustées avec un template. Mauvais fit Mauvaise SN Mauvais template Bonnes courbes de lumière Critère de sélection: Efficacité = 95% Erreurs trop petites Erreurs trop grandes Mauvais template
Changement de variables Une fois le 2 défini sur les variables mesurées (i.e magnitude), comment trouver les erreurs sur les paramètres physiques, k ? On développe le 2 autour du minimum: =0 Si la transformation m(k) est linéaire, alors: La dérivée seconde du 2 est une matrice symétrique positive Les erreurs sur k sont Gaussiennes
Changement de variables(2) Dans le cas simple: <0> si n Si m(k, l) est linéaire Jacobien L’erreur sur les paramètres physiques se déduit d’une simple projection sur l`espace des k (approximation linéaire) nommée analyse de Fisher Indépendant des points de mesures
Changement de variables (exemple) Supposons que par la méthode précédente on ait déterminé les erreurs sur m et , (pas de corrélation). On voudrait l’erreur sur S=m+ et D=m-: On construit la matrice de covariance On construit le jacobien: On projette: On inverse V:
Interprétation graphique (contour) L’équation: défini une ellipse d’iso-probabilité. 39% 39% -/4 68%
Contraintes externes Problème: En utilisant les SN on cherche à mesurer ( m,) sachant que le CMB a mesuré T=m+=1.010.05. Cette mesure étant indépendante on peut facilement l’inclure dans le 2. Toutes les équations précédentes restent vraies en substituant à: Ainsi que le Jacobien:
Erreur sur le paramètre z SNAP mesure mi et zi avec des erreurs m et z. Le redshift est utilisé comme paramètre et son erreur n’est pas dans le 2. L’erreur sur z conduit à une erreur sur m(m,,zi) L’erreur sur la différence mi-mth est:
Minimisation du 2 On développe le 2 autour de ko: On applique la condition de minimum en k =0 Equation itérative au premier ordre: L’équation au premier ordre est en générale suffisante. Si m(k) est linéaire, la solution est trouvée en une itération
Erreurs systématiques Définition: L’erreur systématique est tous ce qui n’est pas statistique!! Statistique: Si on répète « n » fois la mesure d’une quantité Q avec une erreur statistique Q, la valeur moyenne <Q> tend vers la valeur vraie Q0 avec une erreur Q/n. Systématique:Quelque soit le nombre d’expériences, <Q> serra toujours différente de Q0 à l’erreur systématique près S Traitement: Si l’effet systématique est mesurable, on le corrige, par exemple en calculant <Q-Q> et une erreur Q’2= Q2+ Q2 Sinon, on ajoute les matrices d’erreurs: V’ = Vstat+Vsyst et on utilise le formalisme général. Challenge:Les erreurs systématiques doivent être inférieures aux erreurs statistiques, sinon elles l’emportent quelque soit « n » !!!!
En résumé Le 2 est proportionnel au Log du produit des probabilités (G) La valeur moyenne du 2 est égale au nombre de degré de liberté La dérivée première du 2 donne les paramètres les + probables La dérivée seconde du 2 donne l’inverse de la matrice d’erreur Un changement de variables s’obtient en multipliant à droite et à gauche la matrice de covariance par le Jacobien Les erreurs ainsi calculées sont indépendantes des mesures L’intégrale de la densité de probabilité du 2 de zéro à 2 donne la signification statistique La densité de probabilité du niveau de confiance est constante Les iso-probabilités sont obtenues en résolvant 2 = 2min +s2 Au premier ordre, minimiser le 2 ne nécessite que la connaissance du Jacobien
Application à la mesure des paramètres cosmologiques Le modèle cosmologique général Les Super Novae avec SNAP et les erreurs de mesure Erreurs sur m et et les corrélations Mesure de w0 et inter-corrélations Dégénérescence et contraintes externes Non linéarité et minimum secondaire Ellipsoïde et contour Normalisation et expériences Gedanken
Magnitude of SN in general Univers m = magnitude effective z = redshift (0.→2.) ms= magnitude SN à z=Véga (-3.6) m=densité de matière (0.→1.) X=densité d’énergie noire(0.→1.) w0 = paramètre équation d’état(-1→0.) w1= évolution avec redshift(-1.→1.)
SNAP et les Super Novae Environ 2000 SN Entre z=0 et 1.7 Erreur sur la magnitude=0.01 Erreur intrinsèque=0.1 Erreur sur z =0.001 Paramètres standards:
Le Kosmoshow
SNAP et les mesures de m et de Résultat d’une analyse de Fisher: aucune contrainte externe. Coefficient de corrélation entre mS et La raison de cette corrélation est physique: Aujourd’hui, à z=0 univers dominé par énergie noire m t SNAP+200 Sn proches: Aujourd’hui,z=0 Normalisation sol/espace fondamentale: systématiques…
Mesure du paramètre d’état w0 ×2 ×7 Inter-corrélations Corrélation structurelle X%w0: Ces corrélations expliquent pourquoi les erreurs sont 7
Evolution des erreurs avec w0 (1) X n`a plus de sens p=w0=0 Dégénérescence pour w0~-1/3 X n’est plus contraint par Hubble Inter-corrélations Erreurs Solution: Utiliser des contraintes externes soit sur T soit sur m!
Evolution des erreurs avec w0 (2) Utilisation de contraintes externes: Week lensing: m=0.30±0.05 • CMB: m+X=1.00±0.01
Mesure de l’évolution du paramètre d’état Sans contraintes externes, SNAP ne peut pas tout mesurer!! Comme les erreurs vont en 1/N il faudrait 10000 fois plus de SN Utilisation de contraintes T au % près m a 5% près Suivant ce que l’on veut mesurer on peut utiliser l’une ou l’autre des contraintes.Sauf si la physique est au bon endroit !
Evolution de l’erreur sur X%(w0,w1) SUGRA
Evolution des erreurs, avec contraintes 2%( m)( X)5% 2%(w0)10% 8%(w1)<50%
Non-linéarité Dans hypothèse ou m(k) est linéaire en k alors: Si les erreurs sont Gaussiennes sur mi elles le seront sur les k Le 2(k) est une forme exactement quadratique La matrice de covariance est symétrique et positive Analyse de Fisher ok Dans le cas contraire seul le premier 12 est rigoureusement exacte: Les seules propriétés valides sont: Les paramètres les plus probables sont donnés par L’ erreur à « s » sigma est déterminée par: 12 = 2min +s2
Minimum secondaire et asymétrie Evolution de 12- min2 : Fit complet, flatness au % Analyse de Fisher 2=min2+1 - Minimum secondaire + Erreurs asymétriques Rem: Dans ce cas particulier, si on avait trouvé le minimum secondaire, on se serrait juste trompé sur la valeur centrale, pas sur les bornes:
Contour de probabilité Comme dans le cas précèdent on peut calculer le contour: Soit à partir de 22(k)= min2+1 Ellipsoïde Soit à partir de 12(mth(k))= min2+1 Courbe rigoureuse Question: Que faire des variables que l’on ne regarde pas ? C(m,X)2( m, X,ms,w0,w1)= min2( m, X,ms,w0,w1)+1 Intégration sur les variables sans intérêts: par exemple ms Minimiser en chaque point les variables sans intérêts: Contour moyen ou contour espérer: simulations Contour le plus probable: données réelles On peut vérifier que (2) donne (1) si les points de mesures (mi) sont sur la courbe i.e mi=m(k,zi)
Contours 39% —Fisher —Rigoureux —Fisher —Rigoureux Ms,m,X fit Ms,m,X,w0 fit —Fisher —Rigoureux Ms,m,X,w0w1 fit
Expériences Gedanken Vérification statistique des contours (normalisation): Monte-Carlo Une fois le minimum déterminé (k0) on répète N fois: On tire dans les erreurs et suivant une distribution gaussienne les mi autour de m th(k0,zi). On fait de même pour les contraintes externes. On détermine le nouveau minimum par un fit et on vérifie si le nouveau point et dans ou hors le contour. Ellipse:(30.42)% Contour:(39.6 2)%
Mauvaise normalisation P(ellipse) = (49.51.6)% P(contour)=(54.71.6)% P(ellipse) = (35.71.6)% P(contour)=(36.11.6)%
Investigation Minimum secondaire Non physique m0 Solutions: Statistique Bayesian Re-normalisation des densités de probabilité dans l’espace physique Changement de variable On fit m
Tout ce qui est dans ce cours est dans le KosmoShow CONCLUSIONS(1) La méthode du 2 est très puissante et permet: De calculer et transporter facilement les erreurs De trouver rapidement les valeurs les plus probables De construire des contours de probabilité De tester la validité d’une mesure avec un modèle (sélection) Dans le cas de non linéarité entre les valeurs mesurées et les variables physiques: Les erreurs sur les variables physiques ne sont plus Gaussienne Il est nécessaire de vérifier avec un Monte-Carlo les résultats Dans le cadre de l’expérience SNAP l’analyse du 2 a permis: D’estimer les performances du projet (erreur, contour) De trouver les zones délicates (dégénérescence, corrélation) D’étudier la non-linéarité du modèle physique. Tout ce qui est dans ce cours est dans le KosmoShow
La mesure complémentaire aux SN est la mesure de m avec SNAP CONCLUSIONS(2) Seules, les SN dans SNAP permettrons: De vérifier la chandelle standard SN1a (Systématiques) De mesurer la constante Cosmologique avec une erreur statistique comprise entre 3 et 5%, sans hypothèses. La nature de l’énergie noire (w0) peut être déterminé: A 10% près, dans l’hypothèse d’un Univers plat et w0<-0.4 A mieux que 10% prés, avec une mesure de m au % et quelque soit w0 La quintessence (w1) ne serra accessible que si: L’Univers est plat et m est mesuré à mieux que le % La physique n’est pas au mauvais endroit. La mesure complémentaire aux SN est la mesure de m avec SNAP