Les réseaux de neurones artificiels (RNA) Un outil efficace pour appréhender le caractère saisonnier des débits dans un bassin versant ?
Dilemme de la modélisation hydrologique Tend vers la prédiction Prédiction basée sur des séries hydrologiques Le DÉBAT : Ces séries sont-elles chaotiques ? Si OUI, problème majeur Recours à l’APPROCHE NEURONALE
Qu’est-ce qu’un RNA ? 1 1 1 Réseau 1 Stimulus Réponse 1 1 1 1 Ce qu’on veut faire : Étudier le comportement intelligent du RN, qui émerge de la structure et du comportement des éléments de base (les neurones)
Architecture d’un RNA Coulibaly et al., 1999
Les RNA sont… Nouvel outil d’approximation des systèmes complexes Efficaces lorsque les systèmes sont non linéaires
Les RNA sont-ils… ? Capables de capter et de reproduire la variabilité et les effets de saisonnalité qui existent dans certaines séries hydrologiques ? Site d’étude : Bassin versant de l’Hermine (0,05 km²) Variabilité inter-saisonnière très forte Variabilité intra-saisonnière également forte
CONSTRUIRE LE RNA LES ÉTAPES
Rassembler les données Données enregistrées quotidiennement Choisir la variable cible et les variables de forçage Variable cible Le débit moyen Q au jour t Variables prédictives Au jour t-n, avec n = 1, 2, 3 ou 5 Équation symbolique :
Choisir la structure du RNA Perceptron multicouches 1 couche d’entrée, 1 couche cachée, 1 couche de sortie Algorithme d’apprentissage : Rétro-propagation Fonction d’activation Couche d’entrée Couche cachée : tanh Couche cachée Couche de sortie : linéaire
Séparer l’ensemble de données initial Effet de saisonnalité Données enregistrées à l’année longue Données enregistrées sur chaque saison (PR, ET, AU) Phases ou étapes de travail Sous-fichier d’apprentissage Sous-fichier de validation Sous-fichier de test Effet de la taille des sous-fichiers Permutation
Entraîner le RNA Couche d’entrée : 4 variables + 1 neurone de biais Couche de sortie : 1 variable Couche cachée : On teste 3 options différentes Même nombre de neurones que la couche d’entrée 75 % de la couche d’entrée √(neurones d’entrée ∙ neurones de sortie)
Évaluer les résultats
INTERPRÉTER LES RÉSULTATS
Points communs des simulations Concernant les sous-fichiers : Les meilleurs résultats sont toujours ceux de l’apprentissage Performance moins bonne des phases de test et de validation Concernant les variables prédictives : Gradient des résultats en fonction de la valeur de n Plus la valeur de n est grande, plus le RNA a du mal à prédire Qt
Résultats selon la période de l’année modélisée Architecture de base : RNA (5, 5, 1) Résultats assez surprenants Efficience des données annuelles > Efficience des données saisonnières Meilleurs résultats saisonniers : Printemps Résultats les plus décevants : Été et automne
Débits réels et simulés par le RNA pour le fichier ANSE1-1
Autres résultats pour le fichier ANSE1-1
Débits réels et simulés par le RNA pour les fichier PR-1 et ET-1 Fichier ET-1
Expliquer la contre-performance du RNA pour l’été et l’automne Hypothèse 1 : Conditions d’humidité antécédentes
Expliquer la contre-performance du RNA pour l’été et l’automne Hypothèse 2 : Taille de l’ensemble de données initial Taille des fichiers de données annuelles : 1462 échantillons Taille des fichiers de données saisonnières : 368 ou 372 échantillons
Expliquer la contre-performance du RNA pour l’été et l’automne En l’absence de données de conditions d’humidité antécédentes à fournir en « input » au RNA, comment s’assurer que ledit RNA identifie et distingue les conditions sèches et les conditions humides par lui-même pour fournir des résultats corrects ? Résultats saisonniers sont mauvais Le RNA ne fait pas la distinction Résultats annuels satisfaisants Le RNA fait la distinction Hypothèse 3 : Apprentissage non supervisé nécessitant beaucoup de données
ENTREES ENTREES superviseur réseau sortie désirée sortie obtenue erreur ENTREES réseau sortie obtenue ENTREES
Permutation des sous-ensembles de données Meilleurs résultats : Grand nombre d’échantillons affectés aux phases d’apprentissage et de validation Fichier ANSE1-1 Apprentissage sur 731 échantillons (366 de l’année 1996 humide et 365 de l’année 1997 sèche) Validation sur 365 échantillons de l’année 2002 sèche Test sur 366 échantillons de l’année 2004 humide Efficience assez bonne Fichier ANSE2-1 Validation sur 731 échantillons (366 de l’année 1996 humide et 365 de l’année 1997 sèche) Efficience meilleure que ANSE1-1 Fichier ANSE3-1 Apprentissage sur une année humide seulement Validation sur une année sèche uniquement Efficience moins bonne, surtout pour la phase de test
Rôle du nombre de neurones dans la couche cachée Pas de différence significative entre : RNA (5, 5, 1) RNA (5, 4, 1) RNA (5, 2, 1)
Conclusion Bon potentiel des RNA en hydrologie L’application d’un RNA sur de grands ensembles de données non dépourvues de leurs tendances ou de leurs fluctuations saisonnières semble efficace Maier et Dandy (2000) : There is a tendancy among users to throw a problem blindly at a neural network in the hope that it will formulate an acceptable solution…
Questions ?