Analyse statistique et spectrale de la température, salinité et turbidité du système MAREL Dhouha Kbaier1, Pascal Lazure2 et Ingrid Puillat2 1: IFREMER Brest/REM/RDT 2: IFREMER Brest/ODE/Dyneco Présenté par Dhouha Kbaier le Jeudi 12 Juin 2014 Email: dhouha.kbaier@ifremer.fr
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Plan I- Introduction aux séries temporelles II- Autour de la non-stationnarité III- Analyse spectrale IV- Conclusion et perspectives Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 2
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 I- Introduction Objectifs de mes travaux de recherche: Méthodes d’analyse de séries temporelles d’observation du milieu marin Qu’appelle-t-on série temporelle? collection de données obtenue de manière séquentielle au cours du temps 2 variables associées: variable quantitative + variable « temps » Pourquoi analyse-t-on les séries temporelles? Prévoir Relier les variables Déterminer la causalité Repérer les tendances et cycles Quelques caractéristiques des séries temporelles: Non stationnaires Phénomènes saisonniers Changement de la fréquence d’échantillonnage Données manquantes (NaN) Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 3 3
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Séries temporelles considérées Contexte: MAREL Carnot pour le suivi de l’état de l’environnement côtier Séries temporelles étudiées: Salinité, turbidité et température, le niveau de la mer Données brutes telles que transmises par la station de mesure Durée: 5 ans - du 1er Janvier 2005 au 31 Décembre 2009 Pas d’échantillonnage: 20 minutes Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 4
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Température, salinité et turbidité du système MAREL: quelques statistiques Le coefficient d’asymétrie de Fisher (skewness): moment centré d’ordre 3 normalisé par le cube de l’écart-type nombre sans dimension comparer des distributions même si leurs échelles diffèrent skewness négatif étalement est à gauche Mode > Médiane > Moyenne (Panofsky and Brier, 1968) Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 5
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 II- Autour de la non-stationnarité Le fait qu'un processus soit stationnaire ou pas conditionne le choix de la modélisation que l'on doit adopter La fonction d’auto-corrélation d’un processus stationnaire vérifie: Analyse préliminaire des séries temporelles: Analyse du graphe: Non stationnarité en moyenne et en variance Saisonnalité (par ex. marée et rotation de la terre) Analyse du corrélogramme: Fonction d'auto-corrélation: pas paire Coefficient d’auto-corrélation d’ordre 1 (empirique): très élevé Autocorrélogramme: décroit lentement Densité spectrale: pic à l’origine Pour gagner de la place: Non stationnarité en moyenne et en variance Saisonnalité (marée, rotation de la terre par ex.) Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 6
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Corrélogrammes: résultats à partir du logiciel EVIEWS Corrélogramme salinité Corrélogramme niveau de la mer Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 7
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Corrélogrammes: résultats à partir du logiciel EVIEWS Corrélogramme turbidité Turbidité intégrée au 1er ordre Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 8
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Test (augmenté) de Dickey-Fuller Modèle Tester (marche aléatoire pure, processus Difference Stationary) contre (AR(1) stationnaire) Processus AR(p) Test de Dickey et Fuller augmenté (ADF) Tests ADF dans trois modèles : Trend Stationary (TS) AutoRegressive with a Drift (ARD) AutoRegressive p: nombre de retards correction paramétrique de l’auto-corrélation Choix de p? Ng and Perron: Minimiser SBC (Schwartz Bayesian information criterion) ou AIC (Akaike information criterion) Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 9
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Tests ADF pour les séries temporelles de température, salinité et turbidité du système MAREL Test ADF pour la série temporelle de salinité: Exemple pour le choix de p: série temporelle de température Fonction MATLAB adftest() E V I E W S Conclusion: série temporelle de salinité non-stationnaire de type TS et ARD Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 10
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Rappel du plan I- Introduction aux séries temporelles II- Autour de la non-stationnarité III- Analyse spectrale IV- Conclusion et perspectives Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 11
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Analyse harmonique Chercher l’amplitude et la phase de certaines fréquences connues (utilisées pour le calcul du potentiel générateur de la marée astronomique) Niveau de la mer: • Pas de données manquantes • Prédiction variance du signal de départ : 99.7 % Salinité: • Apports d'eaux douces, cycle saisonnier avec une plus grande variabilité • 12.5 % de données manquantes • Prédiction variance du signal de départ : 12.5 % Turbidité: • Marée, partie biologique (plancton au printemps), des effets hautes fréquences liées aux tempêtes, cycle des courants de marée (remise en suspension et advection) • 13 % de données manquantes • Prédiction variance du signal de départ : 8.3 % Température: • ~12.5 % de données manquantes • Prédiction variance du signal de départ : 95 % ! Filtrage pour éliminer les basses fréquences (cycles saisonniers) Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 12 12
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Analyse harmonique Série de température après filtrage: Filtre de Butterworth: ordre 5, passe bande entre 1h et 3 jours mettre en évidence les effets de la marée Prédiction variance du signal de départ : 25.6 % Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 13 13
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Analyse spectrale Estimation du spectre = estimer la transformée de Fourier de la fonction d'auto-corrélation à partir d’un nombre fini de données bruitées Périodogramme modifié Fenêtre rectangulaire remplacée par une fenêtre générale Compromis entre résolution spectrale et fuite de spectre Périodogramme avec fft calcul plus rapide Périodogramme de Welch Ensemble de périodogrammes modifiés qui sont moyennés Périodogramme de Lomb-Scargle Adapté au cas des échantillons irréguliers Évaluer les données de la série temporelle seulement aux instants qui ont été réellement mesurés Pas besoin d’interpolation pour le périodogramme de Lomb-Scargle Brett Shoelson a publié un algorithme MATLAB pour calculer le périodogramme Lomb-Scargle Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 14
Différents spectres pour la série temporelle de turbidité Périodogramme modifié (fenêtre de Hamming) Périodogramme avec fft Onde 2*M2 M4 Onde M2: 12h42 1.9324 cpj Périodogramme de Welch Périodogramme de Lomb-Scargle Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 15
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Périodogramme de Lomb-Scargle Onde M2: 12h42 1.9324 cycle/jour Onde K1: 23h93 1.0029 cpj Onde S2: 12h Onde M4: 6h21 3.8347 cpj Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 16
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Quelle limite pour le Lomb-Scargle ? Analyse de la série temporelle de salinité sur l’année 2005: 26280 échantillons: 3 mesures par heure*24 heures*365 jours Données manquantes dans les données brutes: 18.76 % réellement 21348 échantillons Supprimer aléatoirement d’autres données et estimer le périodogramme par la méthode du Lomb-Scargle: Supprimer une semaine de mesure: 1.92 % au total: 20.68 % de données manquantes Supprimer un mois de mesure: 8.22 % au total: ~27 % de données manquantes Supprimer 3 mois de mesure: 24.65 % au total: ~43.42 % de données manquantes Supprimer 6 mois de mesure: 49.31 % au total: ~68 % de données manquantes Supprimer 90 % … Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 17
Quelle limite pour le Lomb-Scargle ? Supprimer 3 mois de mesure au total: ~43.42 % NaN Basses fréquences (cycles saisonniers) Exemples: 0.0027398 cpj 364.9901 jours (1 an) 0.0054797 cpj 182.4917 jours (6 mois) 0.0678 cpj 14.7469 jours (cycles vive-eaux morte-eaux) Onde M2: 12h42 1.9324 cycle/jour Onde M4: 6h21 3.8347 cpj Onde K1: 23h93 Onde S2: 12h Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 18
Quelle limite pour le Lomb-Scargle ? Supprimer 6 mois au total: ~68 % NaN Onde M2: 12h42 1.9324 cpj Onde S2: 12h ? Onde K1 Onde M4: 6h21 3.8347 cpj Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 19
Quelle limite pour le Lomb-Scargle ? Supprimer 90 % des données On a juste 8% des données Onde M2: 12h42 1.9324 cpj Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 20
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Avec les chiffres: tester les limites pour le Lomb-Scargle Série temporelle de salinité sur l’année 2005: L’algorithme de Lomb-Scargle détecte 131 fréquences significatives Supprimer aléatoirement d’autres données: Supprimer une semaine de données 98 fréquences significatives détectées Supprimer un mois de données 88 fréquences significatives détectées Supprimer 3 mois de données 79 fréquences significatives détectées Supprimer 6 mois de données 45 fréquences significatives détectées Supprimer 90 % … 13 fréquences significatives seulement f = [ 0.0027433 0.0096015 0.02126 0.026061 0.032233 0.038406 0.041835 0.044578 0.048007 0.078183 0.19683 1.9285 1.932 ] On ne détecte plus des fréquences basses importantes, ni même les hautes fréquences ayant des amplitudes importantes comme l’onde S2. Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 21
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Conclusion Contexte: La station MAREL Carnot richesse de données Notre étude: Séries temporelles de salinité, turbidité et température et niveau de mer Non-stationnarité: ,EVIEWS : Différents corrélogrammes décroissance très lente de la fonction d’auto-corrélation séries non stationnaires Décroissance rapide vers zéro du corrélogramme du niveau de la mer série plutôt stationnaire Tests ADF: programme MATLAB, fonction MATLAB adftest() de Econometrics Toolbox et le logiciel EVIEWS mêmes résultats Déterminer le type de non-stationnarité pour pouvoir la traiter correctement Analyse harmonique: À part sur les niveaux de la mer, elle n’est pas pertinente Analyse spectrale: Différents périodogrammes Périodogramme lomb-Scargle adapté aux séries temporelles avec des données manquantes et capable de distinguer des fréquences très proches Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 22 22
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Quelques perspectives Filtrage Filtre de Butterworth Filtre de Demerliac Filtre les hautes fréquences Ne fonctionne qu’avec des données horaires Utilisé par le Service Hydrographique et Océanographique de la Marine (SHOM) pour calculer le niveau moyen journalier Méthodes d’interpolation Méthodes avancées d’analyse spectrale EMD Ondelettes Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 23 23
Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 Merci pour votre attention! Colloque MAREL 2014, Boulogne-sur-mer, 12 et 13 juin 2014 24