Présentation de l'organisme d'accueil Projet de fin d’études en vue de l’obtention du MASTER 2 IMSA • Classification des séries temporelles Application à la modélisation de la consommation d’eau Elaboré par: Ons FARHAT Société d’accueil: La Société des Eaux de Marseille Sous la direction de: Mr Mohamed BOUTAHAR (FSM) Mr Denys POMMERET (FSM) Mr François FILLIAS (SEM) Année Universitaire 2014-2015
Présentation de l'organisme d'accueil Sommaire Le Plan Présentation de l’organisme d’accueil Cadre du stage Problématique Objectifs et missions Résultats et discussion Conclusion et perspectives 2 2
Présentation de l’organisme d’accueil ■Nom: Société des Eaux de Marseille (SEM) ■Date de création: 1er mars 1943 ■Activités: Gestion de l’eau et de l’assainissement Gestion des déchets Propreté et confort urbain ■Chiffre d’affaires: 400 958 euros en 2010 ■Position dans le secteur: 4ème place dans le secteur de l’eau
Cadre du stage ■ Objectif en 2015: Mettre en place un observatoire de l’eau ■ Collaboration avec l’institut de Mathématiques de Marseille ■ Ce grand projet comporte un volet statistique Le stage s’inscrit dans cette perspective d’analyse statistique des données de consommation
Présentation de l'organisme d'accueil Problématique ■ Les plus grandes villes d'Europe ont vu leurs consommations d’eau stagner depuis les années 90. ■ Peux d’études se sont intéressées au cas de la ville de Marseille. Comment pourra-t-on décrire les tendances des consommations à Marseille et à 14 autres communes de Marseille Provence Métropole? Est-ce qu’il y a une différence entre les niveaux de consommation à l’échelle inter-communale? Comment peut-on avoir une connaissance plus approfondie sur la nature des consommateurs? 5 5
Présentation de l'organisme d'accueil Objectifs et missions ■ Décrire les tendances des consommations totale et spécifique ■ Effectuer une analyse de variance sur la consommation spécifique ■Classification pour la réduction du nombre d’individus 6 6
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion Présentation des données: ■ Données traitées: Données annuelles de consommation classées selon les catégories de facturation 101 et 103 ■ Périmètre d’étude: Marseille et 14 autres communes de Marseille Provence Métropole ■ Echelle temporaire: de 1999 jusqu’à 2013 7 7
Résultats et discussion Présentation de l'organisme d'accueil Tendances des consommations Résultats et discussion Tendance de la consommation totale des catégories de facturation 101 et 103: 8 8
Résultats et discussion Tendances des consommations ■ La consommation est à la baisse avec taux annuel moyen de -0,7% . ■ 80 000 000 m3 consommés en 1999 contre 71 000 000 m3 consommés en 2013 ■ Deux pics enregistrés: 2003/2004 ► la canicule 2009 ► la sécheresse
Résultats et discussion Tendances des consommations Tendance des consommations spécifiques des catégories de facturation 101 et 103:
Résultats et discussions Tendances des consommations ■ La consommation spécifique est le ratio de la consommation totale sur le nombre d’habitants ■ La consommation est à la baisse avec taux annuel moyen de -1,24% ■ 86 m3 par an et par habitant consommés en 1999 contre 70 m3 par an et par habitant consommés en 2013 ■ Deux pics enregistrés: 2003 ► la canicule 2009 ► la sécheresse
Résultats et discussion AnOVa à un facteur
Résultats et discussion AnOVa à un facteur ■ Si on applique l’AnOVa sur les données brutes, on constate une violation des hypothèses de validation du modèle. ► test de Shapiro-Wilk de normalité : p-value = 2,365 e-15 < 5% ► rejet de l’hypothèse de normalité des résidus ► test de Bartlett d’homogénéité des variances: p-value < 2,2 e-15 <5 % ► rejet de l’hypothèse d’homoscédasticité des résidus SOLUTION? La transformation des données en utilisant la transformée de BoxCox en choisissant le paramètre λ qui maximise une fonction de log de vraisemblance afin de rendre les données le plus proche de la distribution normale, réduire l’hétéroscédasicité et s’assurer de l’indépendance.
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion AnOVa à un facteur 14 14
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion AnOVa à un facteur ■ Validation du modèle 15 15
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion AnOVa à un facteur ■ La p-valeur associée au facteur « commune » est significativement inférieure à 5%. ■ On pourra donc conclure à un effet facteur « commune » sur les consommations spécifiques. ■ Malheureusement, l’AnOVa ne permet pas de savoir quel groupe diverge. 16 16
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion Classification des consommateurs ■ Classification des consommateurs afin de réduire le grand nombre d’individus ■ La consommation de chaque individu sera considérée comme une série temporelle ■ Choisir un échantillon aléatoire simple de 9000 individus ■ Précéder la classification d’une analyse en composantes principales 17 17
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion Classification des consommateurs Les deux premiers axes principaux résument à peu près 95% de l’inertie totale. Les points sont proches du bord du cercle, leurs propriétés sont mises en évidence par le cercle de corrélation. 18 18
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion Classification des consommateurs 19 19
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion Classification des consommateurs ■ 4 classes ■ La classes peuvent être décrites par: ► Les variables ► Les individus ► Les axes factoriels en examinant la v-test, $dist et $para générés par R 20 20
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion Classification des consommateurs ■ La moyenne sur l’échantillon est de 466 m3 par an et par individu sur tout l’échantillon ■ La classe 1, composée d’un seul individu ayant une consommation moyenne de 242 159 m3 par an. Cet individu a une la plus grande coordonnée sur l’axe factoriel 1 et la plus faible coordonnée sur l’axe factoriel 2 de tout l’échantillon. Sa consommation est la suivante: 21 21
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion ■ La classe 2 est composée des individus ayant des consommations inférieures à la moyenne. La moyenne au sein de la classe est de 315 m3 par an. ■ Les individus de la classe 2 ont les coordonnées les plus faibles sur l’axe factoriel 1. ■ L’individu le plus proche du centre de gravité de la classe 2 est caractérisé par une consommation moyenne de 83 m3 par. Sa consommation est modélisée par la série temporelle suivante: 22 22
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion ■ La classe 3 est composée de « gros consommateurs ». La moyenne au sein de la classe est de 16 100 m3 par an. ■ Elle est « caractérisée » par l’individu de consommation annuelle moyenne de 140 m3 par an. ■ Sa consommation de 1999 à 2013 est présentée par la série temporelle suivante: 23 23
Résultats et discussion Présentation de l'organisme d'accueil Résultats et discussion ■ La classe 4 est composée des « plus gros consommateurs ». La moyenne au sein de la classe est de 55 000 m3 par an. ■ L’individu le plus proche du centre de gravité de la classe a une consommation moyenne de 130 m3 par an. ■ Sa consommation est modélisée par la série temporelle suivante: 24 24
Conclusion et perspectives Présentation de l'organisme d'accueil Conclusion et perspectives ■ Les consommations générales et spécifiques présentent une tendance à la baisse malgré une augmentation de la population. ■ Elles diffèrent , en moyenne, selon les communes et l’examen a montré une sensibilité vis-à-vis des conditions climatiques. ► Evaluer l’effet du facteur climatologique sur les consommations. ■ Améliorer la qualité des prévisions en adoptant des modélisations spécifiques aux séries temporelles ■ La classe 1 composée d’un seul individu: S’agit-il d’un point aberrant ou d’une valeur extrême à étudier ? 25 25
Présentation de l'organisme d'accueil Merci de votre attention 26 26