Méthodes statistiques appliquées à la cosmologie

Slides:



Advertisements
Présentations similaires
Introduction à la notion de fonction 1. Organisation et gestion de données, fonctions 1.1. Notion de fonction ● Déterminer l'image d'un nombre par une.
Advertisements

Géométrie Différentielle – Cubiques d'Hermite Introduction aux courbes paramétriques et à la géométrie différentielle.
Inter académiques Orléans 2007 Analyse d'activités pouvant donner lieu à développement dans et hors la classe. Durée : 1h30 ● Problématique ● Présentation.
Chapitre 5. Modèles probabilistes continus Variable aléatoire continue et loi de probabilité continue Loi uniforme Loi exponentielle Loi normale Loi normale.
M ENTION E TUDES SUR LE G ENRE A TELIER M ÉTHODES Q UANTITATIVES Cécile FAVRE Maîtresse de Conférences en Informatique Université Lyon 2
Chapitre 1 : Cinématique Objectif cinématique : étudier le mouvement des solides sans s’occuper des causes du mouvement  parle de position, trajectoire,
Cours COMPOSANTES DES VECTEURS Dimitri Zuchowski et Marc-Élie Lapointe.
NF04 - Automne - UTC1 Version 09/2006 (E.L.) Cours 5-a Problèmes scalaires instationnaires d’ordre 1 en temps Domaines d’application Notions de schémas.
Calcul de probabilités
Exploitation de mesures scientifiques.
Application des lois de probabilité -Variable aléatoire discrète-
Outils de Recherche Opérationnelle en Génie MTH 8414
Traitements et interprétation des données gravimétriques
Chapitre 2 : Principe de la dynamique
Thermodynamique statistique biomoléculaire GBM2620
Comprendre la définition de bit par seconde à partir
Métrologie Document de reference : “Incertitude en Science de la Nature” Cours : 360-ESZ-03 “Logiciels appliqués en sciences” La métrologie est la « science.
Reprise du cours ( ) Aujourd’hui :
chapitre 1 Polynômes degré 2
Section 1.1 : Unités du système international (SI)
Analyse temporelle des systèmes asservis
Stratégies de résolution de problèmes (RP) en mathématique
Suivi de réaction chimique par spectroscopie RMN
Couche limite atmosphérique
Etalonnage d’une caméra (on parle aussi de calibrage)
Résumé des tests des circuits FATALIC 1 et 2 menés au LPC
Plans d’expériences: Plans factoriels
Les Plans d’expériences: Plans Factoriels
Reprise du cours ( ) Au menu du jour :
Plans d’expériences: Plans factoriels.
Résolution sur l’impulsion Echelle alpine vs echelle Loi
Couche limite atmosphérique
Méthode Taguchy Analyse de la variance Anavar
Introduction aux statistiques Intervalles de confiance
Méthodologie scientifique
Short distance Exposure (Mask Aligner)
POL1803: Analyse des techniques quantitatives
LOG770 Annexe A Éléments de probabilité
Des mathématiques derrière l’intelligence artificielle
Chapitre 3 : Caractéristiques de tendance centrale
Adaptive Neuro Fuzzy Inference System (ANFIS)
Laboratoire A2SI - Groupe ESIEE
CRITERES DE QUALITE 1) PRECISION 2) RAPIDITE 3) AMORTISSEMENT
A l’aide du triangle pédagogique de Jean Houssaye
Suivi de waypoints par un robot buggy autonome
Statistique descriptive Bivariée
Transformation linéaires
Lois de Probabilité Discrètes
Chapitre 6 Techniques de Fermeture (1)
LE processus d’enquête
Mesures simples & Objet en chute libre
ANALYSE HARMONIQUE 1) Rappels et définitions 2) Lieux de Bode
CARACTERISTIQUES D’INERTIE DES SOLIDES
Présentation 4 : Sondage stratifié
Présentation 9 : Calcul de précision des estimateurs complexes
MATHÉMATIQUES FINANCIÈRES I
Travaux Pratiques de physique
Projection, cosinus et trigonométrie.
La maximisation de la fonction d’utilité
Présentation 6 : Sondage à plusieurs degrés
Programmation Scratch
Calcul de précision dans le cas d’échantillons rotatifs: le cas des statistiques EU-SILC au Luxembourg 10e COLLOQUE FRANCOPHONE SUR LES SONDAGES, Lyon,
Audrey Gervereau, Métis, stage M2
LE TORSEUR STATIQUE 1) Définition 2) Notation 3) Deux cas particuliers
Présentation des nouveaux programmes de mathématiques de première des séries technologiques Jessica Parsis.
Estimation des conditions initiales par inversion
La loi des signes.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
spécialité mathématiques Première
Dérivation – Fonctions cosinus et sinus
Transcription de la présentation:

Méthodes statistiques appliquées à la cosmologie Luminy le 20/9/02 André Tilquin (CPPM) m, ,w0,w1 2

Méthodes statistiques appliquées à la cosmologie Introduction: Nature du problème Mathématique et définition Probabilité et 2 Transport des erreurs Interprétation graphique et contour Contraintes externes Minimisation Erreurs systématiques Application à SNAP Le modèle cosmologique Erreur sur les paramètres cosmologiques Dégénérescences et contraintes externes Non linéarité et contour de probabilité Problème en suspend

Problème général(1) Supposons une mesure de N Supernovae à différents redshift et un modèle: Comment trouver la meilleur courbe ? On cherche la courbe qui passe au plus près de chacun des points: Mais les points les mieux mesurés doivent avoir plus de poids

Statistique nécessaire Problème général(2) Le problème ce ramène à: Trouver les valeurs des k tels que 2 soit minimum Déterminer les erreurs sur les k a partir des erreurs sur mi Statistique nécessaire

Probabilité Gaussienne Dans toute la suite nous supposerons que les erreurs de mesure sont Gaussiennes, i.e si l’on répète N fois la même mesure alors la distribution des mesures suit la distribution en probabilité: Avec valeur moyenne: Variance ou erreur:

Cas de N variables (corrélation) Supposons « n » mesures Gaussiennes : Coefficient de corrélation. Déterminant Cas à 2 variables: Si =0 Si =1 V est singulière

Maximum de vraisemblance(=0). Quelle est la courbe la plus vraisemblable ? Réponse : La courbe la plus probable ! La probabilité de la courbe est définie comme le produit des probabilités de chaque point d’être autour de cette courbe: Il faut maximiser L par rapport au k  Comme il est plus simple de travailler avec des sommes  Il faut minimiser par rapport au k

Quelques propriétés du 2 Probabilité et 2 : Par définition Définition matricielle: Dérivée seconde: La dérivée première du 2 donne le minimum La dérivée seconde du 2 donne l’inverse de la matrice d’erreur indépendante des points de mesures.

Densité de probabilité du 2 Densité de probabilité du 2:Supposons que l’on mesure N fois une variable x. Pour chaque mesure on a : Dans le cas de n degré de liberté i.e n points de mesure On montre que: La valeur moyenne du 2 est n La variance est 2n Donc, la premier test de compatibilité entre des mesures et un modèle est de vérifier que Attention au fait que la variance est 2n

Niveau de confiance On définit le niveau de confiance (ou confidence level) comme la probabilité que toute nouvelle expérience donne un 2 supérieur: 10% des expériences donneront 2>16 Définition de l’écart standard: Le résultat d’une mesure avec une erreur à « s » sigma. n=1, p=68% Pour 2 (ou plus) variables mesurées simultanément un résultat à « s » écart est défini avec le 2, mais les probabilités dépendent du nombre de variables. n=2, p=39% n=2, p=68% Pour plusieurs mesures simultanées on parle plutôt de la probabilité !!!

Propriété du niveau de confiance Densité de probabilité du niveau de confiance h() : N mesures pour les quelles on calcule un 2 En utilisant la loi de conservation des probabilités Si le modèle est correcte, et si les erreurs sont uniquement statistiques et correctement estimées, la densité de probabilité du niveau de confiance doit être plate, i.e les mesures de k se répartissent uniformément entre 0 et 1.

Application au fit des courbes de lumières Supposons que nous ayons N courbes de lumières ajustées avec un template. Mauvais fit Mauvaise SN Mauvais template Bonnes courbes de lumière Critère de sélection: Efficacité = 95% Erreurs trop petites Erreurs trop grandes Mauvais template

Changement de variables Une fois le 2 défini sur les variables mesurées (i.e magnitude), comment trouver les erreurs sur les paramètres physiques, k ? On développe le 2 autour du minimum: =0 Si la transformation m(k) est linéaire, alors: La dérivée seconde du 2 est une matrice symétrique positive Les erreurs sur k sont Gaussiennes

Changement de variables(2) Dans le cas simple: <0> si n Si m(k, l) est linéaire Jacobien L’erreur sur les paramètres physiques se déduit d’une simple projection sur l`espace des k (approximation linéaire) nommée analyse de Fisher Indépendant des points de mesures

Changement de variables (exemple) Supposons que par la méthode précédente on ait déterminé les erreurs sur m et  , (pas de corrélation). On voudrait l’erreur sur S=m+ et D=m-: On construit la matrice de covariance On construit le jacobien: On projette: On inverse V:

Interprétation graphique (contour) L’équation: défini une ellipse d’iso-probabilité. 39% 39%  -/4 68%

Contraintes externes Problème: En utilisant les SN on cherche à mesurer ( m,) sachant que le CMB a mesuré T=m+=1.010.05. Cette mesure étant indépendante on peut facilement l’inclure dans le 2. Toutes les équations précédentes restent vraies en substituant à: Ainsi que le Jacobien:

Erreur sur le paramètre z SNAP mesure mi et zi avec des erreurs m et z. Le redshift est utilisé comme paramètre et son erreur n’est pas dans le 2. L’erreur sur z conduit à une erreur sur m(m,,zi) L’erreur sur la différence mi-mth est:

Minimisation du 2 On développe le 2 autour de ko: On applique la condition de minimum en k =0 Equation itérative au premier ordre: L’équation au premier ordre est en générale suffisante. Si m(k) est linéaire, la solution est trouvée en une itération

Erreurs systématiques Définition: L’erreur systématique est tous ce qui n’est pas statistique!! Statistique: Si on répète « n » fois la mesure d’une quantité Q avec une erreur statistique Q, la valeur moyenne <Q> tend vers la valeur vraie Q0 avec une erreur Q/n. Systématique:Quelque soit le nombre d’expériences, <Q> serra toujours différente de Q0 à l’erreur systématique près S Traitement: Si l’effet systématique est mesurable, on le corrige, par exemple en calculant <Q-Q> et une erreur Q’2= Q2+ Q2 Sinon, on ajoute les matrices d’erreurs: V’ = Vstat+Vsyst et on utilise le formalisme général. Challenge:Les erreurs systématiques doivent être inférieures aux erreurs statistiques, sinon elles l’emportent quelque soit « n » !!!!

En résumé Le 2 est proportionnel au Log du produit des probabilités (G) La valeur moyenne du 2 est égale au nombre de degré de liberté La dérivée première du 2 donne les paramètres les + probables La dérivée seconde du 2 donne l’inverse de la matrice d’erreur Un changement de variables s’obtient en multipliant à droite et à gauche la matrice de covariance par le Jacobien Les erreurs ainsi calculées sont indépendantes des mesures L’intégrale de la densité de probabilité du 2 de zéro à 2 donne la signification statistique La densité de probabilité du niveau de confiance est constante Les iso-probabilités sont obtenues en résolvant 2 = 2min +s2 Au premier ordre, minimiser le 2 ne nécessite que la connaissance du Jacobien

Application à la mesure des paramètres cosmologiques Le modèle cosmologique général Les Super Novae avec SNAP et les erreurs de mesure Erreurs sur m et  et les corrélations Mesure de w0 et inter-corrélations Dégénérescence et contraintes externes Non linéarité et minimum secondaire Ellipsoïde et contour Normalisation et expériences Gedanken

Magnitude of SN in general Univers m = magnitude effective z = redshift (0.→2.) ms= magnitude SN à z=Véga (-3.6) m=densité de matière (0.→1.) X=densité d’énergie noire(0.→1.) w0 = paramètre équation d’état(-1→0.) w1= évolution avec redshift(-1.→1.)

SNAP et les Super Novae Environ 2000 SN Entre z=0 et 1.7 Erreur sur la magnitude=0.01 Erreur intrinsèque=0.1 Erreur sur z =0.001 Paramètres standards:

Le Kosmoshow

SNAP et les mesures de m et de  Résultat d’une analyse de Fisher: aucune contrainte externe. Coefficient de corrélation entre mS et  La raison de cette corrélation est physique: Aujourd’hui, à z=0 univers dominé par énergie noire m  t SNAP+200 Sn proches: Aujourd’hui,z=0 Normalisation sol/espace fondamentale: systématiques…

Mesure du paramètre d’état w0 ×2 ×7 Inter-corrélations Corrélation structurelle X%w0: Ces corrélations expliquent pourquoi les erreurs sont 7

Evolution des erreurs avec w0 (1) X n`a plus de sens p=w0=0 Dégénérescence pour w0~-1/3 X n’est plus contraint par Hubble Inter-corrélations Erreurs  Solution: Utiliser des contraintes externes soit sur T soit sur m!

Evolution des erreurs avec w0 (2) Utilisation de contraintes externes: Week lensing: m=0.30±0.05 • CMB: m+X=1.00±0.01

Mesure de l’évolution du paramètre d’état Sans contraintes externes, SNAP ne peut pas tout mesurer!! Comme les erreurs vont en 1/N il faudrait 10000 fois plus de SN Utilisation de contraintes T au % près m a 5% près Suivant ce que l’on veut mesurer on peut utiliser l’une ou l’autre des contraintes.Sauf si la physique est au bon endroit !

Evolution de l’erreur sur X%(w0,w1) SUGRA

Evolution des erreurs, avec contraintes 2%( m)( X)5% 2%(w0)10% 8%(w1)<50%

Non-linéarité Dans hypothèse ou m(k) est linéaire en k alors: Si les erreurs sont Gaussiennes sur mi elles le seront sur les k Le 2(k) est une forme exactement quadratique La matrice de covariance est symétrique et positive Analyse de Fisher ok Dans le cas contraire seul le premier 12 est rigoureusement exacte: Les seules propriétés valides sont: Les paramètres les plus probables sont donnés par L’ erreur à « s » sigma est déterminée par: 12 = 2min +s2

Minimum secondaire et asymétrie Evolution de 12- min2 : Fit complet, flatness au % Analyse de Fisher 2=min2+1 - Minimum secondaire + Erreurs asymétriques Rem: Dans ce cas particulier, si on avait trouvé le minimum secondaire, on se serrait juste trompé sur la valeur centrale, pas sur les bornes:

Contour de probabilité Comme dans le cas précèdent on peut calculer le contour: Soit à partir de 22(k)= min2+1 Ellipsoïde Soit à partir de 12(mth(k))= min2+1 Courbe rigoureuse Question: Que faire des variables que l’on ne regarde pas ? C(m,X)2( m, X,ms,w0,w1)= min2( m, X,ms,w0,w1)+1 Intégration sur les variables sans intérêts: par exemple ms Minimiser en chaque point les variables sans intérêts: Contour moyen ou contour espérer: simulations Contour le plus probable: données réelles On peut vérifier que (2) donne (1) si les points de mesures (mi) sont sur la courbe i.e mi=m(k,zi)

Contours 39% —Fisher —Rigoureux —Fisher —Rigoureux Ms,m,X fit Ms,m,X,w0 fit —Fisher —Rigoureux Ms,m,X,w0w1 fit

Expériences Gedanken Vérification statistique des contours (normalisation): Monte-Carlo Une fois le minimum déterminé (k0) on répète N fois: On tire dans les erreurs et suivant une distribution gaussienne les mi autour de m th(k0,zi). On fait de même pour les contraintes externes. On détermine le nouveau minimum par un fit et on vérifie si le nouveau point et dans ou hors le contour. Ellipse:(30.42)% Contour:(39.6 2)%

Mauvaise normalisation P(ellipse) = (49.51.6)% P(contour)=(54.71.6)% P(ellipse) = (35.71.6)% P(contour)=(36.11.6)%

Investigation Minimum secondaire Non physique m0 Solutions: Statistique Bayesian Re-normalisation des densités de probabilité dans l’espace physique Changement de variable On fit m

Tout ce qui est dans ce cours est dans le KosmoShow CONCLUSIONS(1) La méthode du 2 est très puissante et permet: De calculer et transporter facilement les erreurs De trouver rapidement les valeurs les plus probables De construire des contours de probabilité De tester la validité d’une mesure avec un modèle (sélection) Dans le cas de non linéarité entre les valeurs mesurées et les variables physiques: Les erreurs sur les variables physiques ne sont plus Gaussienne Il est nécessaire de vérifier avec un Monte-Carlo les résultats Dans le cadre de l’expérience SNAP l’analyse du 2 a permis: D’estimer les performances du projet (erreur, contour) De trouver les zones délicates (dégénérescence, corrélation) D’étudier la non-linéarité du modèle physique. Tout ce qui est dans ce cours est dans le KosmoShow

La mesure complémentaire aux SN est la mesure de m avec SNAP CONCLUSIONS(2) Seules, les SN dans SNAP permettrons: De vérifier la chandelle standard SN1a (Systématiques) De mesurer la constante Cosmologique avec une erreur statistique comprise entre 3 et 5%, sans hypothèses. La nature de l’énergie noire (w0) peut être déterminé: A 10% près, dans l’hypothèse d’un Univers plat et w0<-0.4 A mieux que 10% prés, avec une mesure de m au % et quelque soit w0 La quintessence (w1) ne serra accessible que si: L’Univers est plat et m est mesuré à mieux que le % La physique n’est pas au mauvais endroit. La mesure complémentaire aux SN est la mesure de m avec SNAP