La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Licence 3 – Outils mathématiques & statistiques.

Présentations similaires


Présentation au sujet: "1 Licence 3 – Outils mathématiques & statistiques."— Transcription de la présentation:

1 1 Licence 3 – Outils mathématiques & statistiques

2 2 Série dévènements Le problème Phénomènes aléatoires Tester les tendances Tester luniformité Tester un motif Cyclicité Autocorrélation Méthodes de Fourier Plan

3 Années déruption du volcan Aso durant la période Séries dévènements - Le problème

4 4 Régulier ou pas? Séries dévènements - Le problème

5 5

6 6 Le plus simple : traiter une série de dates! But: rechercher un critère dextrapolation, de compréhension… Géologie Tremblements de terre, éruptions volcaniques, impacts météoritiques, extinctions de masse. Les données sont regardées comme des points dans le temps :très courts face à la période considérée. Données excédant un seuil (threshold). Séries dévènements - Le problème

7 7 Comment faire? La fin du temps est souvent le présent Choix dun seuil suivant des critères précis (i.e. séismes) Si cest aléatoire (random) cest cuit! Sinon : régularité (regularity), tendance (trend), motif (pattern). Importance de la définition du départ et de la fin de la période ciblée. Les évènements ne doivent pas être les limites sinon biais. Séries dévènements - Le problème

8 8 Aléatoire (randomness): loccurrence dun événement naffecte pas la probabilité doccurrence des autres évènements. Indépendance: Pas très respectée en géologie séismes ou éruptions volcaniques relâchent des contraintes ou causent des instabilités. Séries dévènements - Le problème

9 9 10 ans = 10 x 1 an 10 évènements aléatoires Nombre dintervalles ou lon attend k évènements donné par le modèle de Poisson :P(k)xT (vu en L1) n : nombre total dévènements, T : nombre dintervalles = n/T -> Test du 2 Série dévènements - phénomène aléatoire

10 10 H 0 : Les évènements sont distribués aléatoirement dans le temps H 1 : Les évènements sont groupés ou réguliers Avec n évènements, dans T intervalles. (O j ) : nombre dintervalles observés avec j évènements comparés à (E k ) prédits par la distribution de Poisson. Test du chi-2 (vu en L1) E k > 5 d.l = (nombre de classes – 2) ATTENTION : Ce test ne convient pas aux tendances (augmentation ou diminution de la fréquence dans le temps) Série dévènements - phénomène aléatoire

11 11 Un exemple: Dans une série de 45 m de carbonates du Dévonien, des horizons de tufs apparaissent : Position en m: La position est-elle aléatoire? Série dévènements - phénomène aléatoire

12 12 Intervallek Observation kOkOk Distribution de fréquence observée: Série dévènements - phénomène aléatoire

13 13 Nombre dintervalles : T = 15 Nombre dévènements : n = 17 Pour k=0, E 0 = 15 x e -17/15 = kEkEk Série dévènements - phénomène aléatoire

14 14 Test du 2. H 0 : les données viennent dune distribution de Poisson (randomness) H 1 : Les données ne sont pas issues dune distribution de Poisson kOkOk EkEk (O k -E k ) 2 /E k inf Total =0.212 A peu près 5 dans chaque classe : ok = 0.05, dl = 3 (cest le nbre classes) – 1 = 2 2 = 5.99 H 0 nest pas rejeté. Les données peuvent sajuster à la distribution de Poisson ATTENTION : Ce test ne convient pas aux tendances Série dévènements - phénomène aléatoire

15 15 Trend : fréquences croissantes ou décroissantes. Changement de fréquences = changement dans la longueur des intervalles entre les évènements. Graphe ordinal entre le numéro des évènements et lintervalle entre événement. Statistiques non-paramétriques :coefficient de Spearman (vu en L2!). Charles Spearman ( ) Série dévènements – Tester les tendances (trends)

16 16 Echelle de la 1ere variable : ordinale Echelle de la 2eme variable : intervalle r s :coefficient de rang (Spearman) h i : longueur du i ième intervalle. n = nbre dintervalles = nbre dévènements -1. Série dévènements – Tester les tendances (trends)

17 17 Position en m: Intervalles Même jeu de données que tout à lheure Série dévènements – Tester les tendances (trends)

18 18 Série dévènements – Tester les tendances (trends)

19 19 Rang de lobs.Intervalle h i Rang de h i D 2 = (Rang obs-Rang de h i ) D 2 =287.5 Série dévènements – Tester les tendances (trends)

20 20 r s = = 0.05 et n = 16, r s critique = La valeur calculée excède la valeur critique. Il y a une tendance! Série dévènements – Tester les tendances (trends)

21 21 Les évènements uniformément distribués peuvent se retrouver en géologie quand loccurrence dun événement réduit la probabilité dautres évènements dans un futur proche mais laugmente après. Ex: séismes Test de Kolmogorov (K test) : hypothèse nulle duniformité. (vu en L2) Série dévènements – Tester luniformité

22 22 Basé sur un diagramme de cumul de fréquence. On recherche la différence verticale maximale entre le modèle et les data. Tester luniformité

23 23 Test sensible aux tendances et aux clusters (regroupements) Le calcul du K met en jeu la proportion dévènements ayant eu lieu (i/n) et la proportion de temps écoulé (t i /T). n évènements, T temps total. Calcul de (i/n) – (t i /T) et ((i-1)/n) – (t i /T) Plus ces différences sont petites, plus cest uniforme Tester luniformité

24 24 Kolmogorov test H 0 : les évènements sont uniformes ou aléatoires H 1 : les évènements sont regroupés ou avec une tendance K est comparé avec des valeurs critiques issues de tables Un exemple avec toujours les mêmes données… Tester luniformité

25 25 it i /Ti/n(i-1)/nt i /T-i/nt i /T-(i-1)/n /17 0,5/45 Tester luniformité

26 26 K = x = Valeur critique dans la table pour = 0.05 et n = 17 : On rejette lhypothèse nulle. Les évènements ne sont pas uniformes. Ici, plus haute densité en début de série. Tester luniformité

27 27 nAlpha = 0.10Alpha = 0.05Alpha = , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , n>100 1,223/racine(n) 1,358/racine(n) 1,629/racine(n) Formulaire - Table de la loi de Kolmogorov-Smirnov Tester luniformité

28 28 Il y a des distributions non aléatoires qui ne vont pas être détectées avec les méthodes précédentes : patterns. Par exemple phases dactivité (pattern = uniformité + clusters) On considère une succession dintervalles. Calcul dun coefficient de corrélation (de Spearman) entre h et h+1. Si il ny a pas de pattern, r s = 0. Si r s < 0 : intervalles longs puis courts Si r s > 0 : les intervalles successifs sont similaires Tester un motif (pattern)

29 29 H 0 : Pas de relation entre les intervalles successifs H 1 : corrélation entre la longueur des intervalles successifs n = (nbre dévènements) – 2 Tester un motif (pattern)

30 30 hihi R(h i )h i+1 R(h i+1 )(R(h i )- R(h i+1 )) =511 Tester un motif (pattern)

31 31 hihi+1R(hi)R(hi+1) 1,80, ,7 31 2,1 19 4, ,41, ,31,9 58 1,4 96 5, , , ,34, ,51, ,64, ,36, Tester un motif (pattern)

32 32 r s = r s critique pour = 0.05 et n = 15 : Nous ne rejetons pas H 0. Il ny a pas de corrélation évidente entre les intervalles successifs. Les intervalles consécutifs semblent être indépendants. Tester un motif (pattern)

33 33 thihi+1r(Hi)r(hi+1 31,20,9154 4,20,918, ,118,892, ,41,496 16,41,47, ,87,50, ,30,71, ,50,582 27,50, , ,39, ,39,30, ,60,41, ,56 52,56 Tester un motif (pattern)

34 34 Tester un motif (pattern)

35 Décalage de 100h, puis 200h etc… Comparer les valeurs observées en un point avec les valeurs observées en un ou plusieurs points plus tôt (valeurs retardées - lagged values). Notion importante en analyse spatiale Chaque observation est très semblable à sa valeur adjacente (lag = 1); mais aussi à la même observation 24h plus tôt (lag = 24). Séries temporelles – cyclicité. Autocorrélation

36 36 Séries temporelles – cyclicité. Autocorrélation Chronogramme. Levolution des T° a Nottingham Castle

37 Lidée: Trouver le pattern et en tirer avantage. La corrélation entre les données originales et les k- lagged se nomme lautocorrélation dordre k. LAutocorrelation Function (ACF) donne les coefficients de corrélation entre pour les lag consécutifs. Le corrélogramme est la représentation graphique de lACF. Attention si les séries ont une variance instable. Une transformation est nécessaire avant dutiliser lAFC. Séries temporelles – cyclicité. Autocorrélation

38 Attention pour la préparation des données: Les observations doivent être régulièrement espacées dans le temps Toute tendance linéaire doit être éliminée avant lanalyse Règle empirique: au moins 50 valeurs dans la série, le lag ne doit pas excéder n/4. Séries temporelles – cyclicité. Autocorrélation

39 39 Séries temporelles – cyclicité. Autocorrélation Test de significativité du coefficient dautocorrélation. Avec le lag, r s le coefficient dautocorrelation pour ce lag et n le nombre dobservations. Z r suit une loi normale centrée réduite. Les bornes sont et 1.96 à 95% de confiance. H 0 : r s = 0 H 1 : r s 0

40 Superposition de plusieurs signaux Quels sont leurs origines? Variation séculaire Variation annuelle? ICI CEST TRES SIMPLE… MAIS CE NEST PAS TOUJOURS LE CAS Augmentation du CO 2 dans latmosphère en fonction du temps. Séries temporelles – cyclicité. Méthodes de Fourier

41 Prenons un autre exemple: Variation du 18 O dans la carotte GISP-2 du Groenland sur les dernières années Séries temporelles – cyclicité. Méthodes de Fourier

42 Décomposition de la lumière par un prisme Décomposition dun signal temporel par transformée de Fourier Séries temporelles – cyclicité. Méthodes de Fourier Principe de la transformée de Fourier

43 Elimination du bruit par lissage (Smoothing) Données brutes = 1 signal + bruit. Le bruit apparaît sur les hautes fréquences. Il a peu dinfluence sur les données adjacentes et peut être réduit en moyennant une courte série. Utilisation de moyennes arithmétiques pondérées. Questions : 1.Nombre dobservations prises en compte? 2.Valeur des poids? Séries temporelles – cyclicité. Fourier - traitement préalable

44 t i-2 t i-1 titi t i+1 t i Quadratic polynomial smoothing : 5 termes y i =(-3y i y i y i + 12 y i+1 – 3 y i+2 ) / 35 No termestiti t i+1 t i-1 t i+2 t i-2 t i+3 t i-3 t i+4 t i Quadratic polynomial smoothing : 5-9 termes Séries temporelles – cyclicité. Traitement préalable

45 Séries temporelles – cyclicité. Fourier - traitement préalable

46 Les tendances doivent être éliminées avant traitement par transformée de Fourier. Si il y a un trend linéaire y = a + bt On doit travailler sur le résidu: i = y i – bt i - a Séries temporelles – cyclicité. Fourier - traitement préalable

47 Décomposition dune série temporelle en une suite de sinusoïdes (amplitude, phase et fréquence). Voyons le plus simple Ajoutons lamplitude Comment changer la fréquence? Et la phase? Séries temporelles – cyclicité. Fourier - Mathématiques

48 Donc pour une fréquence spécifique on a: Comme on a également : On tire En posant: On tire Séries temporelles – cyclicité. Fourier - Mathématiques

49 Finalement on somme toutes ces sinusoïdes!! Toutes les fonctions, à condition quelles soient continues, et quil ny ait quune valeur de Y pour chaque valeur de X, peuvent être écrites sous la forme: Relation de Fourier Séries temporelles – cyclicité. Fourier - Mathématiques

50

51 Lamplitude pour une fréquence donnée : En général on définit plutôt la puissance ou la variance: Séries temporelles – cyclicité. Fourier - Mathématiques

52 Calcul très complexe alors tout à lordinateur! Algorithme FFT (Fast Fourier Transform) mais quelques contraintes : 1.Les données doivent être également espacées dans le temps 2.Le nombre de données doit être 2 n avec n entier. 3.Il ne doit pas y avoir de trend 4.Les fréquences entières sont calculées 5.En conséquence de 4. Les cycles doivent être complets. Séries temporelles – cyclicité. Fourier - Mathématiques

53 Problème en géologie dans la définition du temps Sédiments : 1 varve = 1 an Croissance sur les coquilles : rythmes lunaires, années, jours… Si le taux de sédimentation est constant, alors le temps est assimilable à une distance. Quoi quil en soit, attention à la corruption du temps! Séries temporelles – cyclicité. Fourier - Mathématiques

54 Les résultats sont exprimés sous forme de puissance (power spectrum) Séries temporelles – cyclicité. Fourier - Mathématiques

55

56 Simulation: par exemple: avec 1 = fréque n ce de la fondamentale (en Hz) fois 2, s(t) = sin( 1 t) *sin(3* 1 t) + 0.5*sin(5* 1 t) *sin(7* 1 t) + 0.5*sin(9* 1 t) *sin(11* 1 t) *sin(13* 1 t) Séries temporelles – cyclicité. Fourier - Mathématiques

57 Si T temps total et présence dun pic à k, la période peut être calculée avec T/k. Contrainte: La fréquence maximale est déterminée par le nombre dobservations /2. Fréquence de Nyquist. Problème: laliasing! La variance de tous les signaux dont la fréquence est supérieure à la fréquence de Nyquist seront ajoutées aux variances des plus basses fréquences dans le périodigramme!!! Solution: on filtre les hautes fréquences. Séries temporelles – cyclicité. Fourier - Mathématiques

58 Filtres : Séries temporelles – cyclicité. Fourier - Filtres

59 Bruit blanc : La puissance est uniformément distribuée sur le spectre Séries temporelles – cyclicité. Fourier – Le bruit

60 Bruit rose: Cest un bruit dit "1/f noise. Perte de 3dB a chaque octave. Cest le bruit le plus fréquent dans la nature. Séries temporelles – cyclicité. Fourier – Le bruit

61 Bruit bleu: gain de 3dB a chaque octave. Séries temporelles – cyclicité. Fourier – Le bruit

62 Séries temporelles – cyclicité. Fourier « glissant »

63 Les données réelles sont bruitées (noisy) -> pics mineurs (spikes) Question : signal ou bruit? Réponse : g-test, White noise test. H 0 : Puissance à f due à un phénomène Aléatoire H 1 : Une cyclicité existe à cette fréquence Valeur critique: p= niveau de signification ( =0.05) m=(nombre dobservations)/2 Variation totale Séries temporelles – cyclicité. Tests de significativité

64 Lignes de croissance sur des nautiles du Silurien Puissance=1,28 k=12 (freq max) Variance totale: 9,9 n=128 m=n/2=64 On ne rejette pas H 0. Conclusion: Ce pic peut résulter dun phénomène aléatoire Séries temporelles – cyclicité. Tests de significativité

65 White-noise test Puissance uniformément distribuée le long du spectre? Basé sur le KS test Puissance cumulée vs. fréquence. Hypothèses: H 0 : bruit blanc H 1 : ce nest pas un bruit blanc Séries temporelles – cyclicité. Tests de significativité

66 Proportion de puissance cumulée à la fréquence k. Si bruit blanc, ce qui est attendu Séries temporelles – cyclicité. Tests de significativité

67 Avec a=0.05, les intervalles de confiance sont: et Si g k sort de lintervalle, il y a 95% de chances pour que les données ne résultent pas dun processus type bruit blanc Séries temporelles – cyclicité. Tests de significativité

68 Séries temporelles – cyclicité. Exemples

69 Excentricité de lorbite terrestre (100,000 ans) Précession de laxe de la Terre (26,000 ans) Angle dinclinaison sur laxe (40,000 ans) Séries temporelles – cyclicité. Exemples

70

71

72

73

74

75 Fréquence d'échantillonnage et bande passante: Pour définir numériquement un son de fréquence F, il faut appliquer une fréquence d'échantillonnage Fs telle que: Fs>2F.La valeur du taux d'échantillonnage pour un cd, par exemple n'est pas arbitraire, elle découle en réalité du théorème de Shannon/Nyquist, qui stipule que pour numériser fidèlement une valeur ayant une fréquence donnée, il faut numériser au double de cette fréquence. Or l'oreille humaine n'arrive pas à distinguer des sons dont la fréquence dépasse Hz, ainsi il faut numériser à Hz soit 44 kHz. Différent taux d'échantillonnage : - 44 kHz : qualité cd - 22 kHz : qualité radio - 8 kHz : qualité téléphone Séries temporelles – cyclicité. Exemples

76 R= 2n-1 (Où n est le nombre de bits).Ainsi les formats utilisés sont: 8 et 16 bits en micro-informatique et minidisque Sony 16 bits en audio amateur (CD et DAT) 16, 18, 20 et 24 bits en audio professionnelle Codage sur 8 bits : 256 valeurs possibles codage sur 16 bits: valeurs possibles Quelle est la signification pratique de la résolution ? Plus on enregistre un son avec une résolution élevée, plus on va pouvoir en enregistrer les infimes détails. La précision maximale obtenue est celle du plus petit échantillon. Analyse de Fourier – Principe du CD


Télécharger ppt "1 Licence 3 – Outils mathématiques & statistiques."

Présentations similaires


Annonces Google