Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Outils danalyse statistiques « programmation par lexemple » S. Canu, laboratoire PSI, INSA de Rouen équipe « systèmes dinformation pour lenvironnement » psichaud.insa-rouen.fr/~scanu
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Plan de Route – traitement de données environnementales – risque statistique – études de cas – nez électronique – capteur logiciel – prévision de charge entrante – modélisation de lécrouissage – programmation à base dexemples – exemples dapplications potentielles prévision de rupture prévision des « bouchons »
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Système dinformation pour lenvironnement
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Système dinformation pour lenvironnement Nature des phénomènes beaucoup de données disponibles dépendances complexes : non linéaires, bruités les événements intéressants sont rares
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Système dinformation pour lenvironnement Nature des phénomènes beaucoup de données disponibles dépendances complexes : non linéaires, bruités les événements intéressants sont rares Problèmes à résoudre validation de données prévision à court terme évaluation de la situation décision.
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Système dinformation pour lenvironnement Nature des phénomènes beaucoup de données disponibles dépendances complexes : non linéaires, bruités les événements intéressants sont rares Solution programmation à base dexemple précision de la prévision domaine de validité Problèmes à résoudre validation de données prévision à court terme évaluation de la situation décision.
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Risque statistique * * Exemple : comment calculer une intégrale ? ab f(x) c Cest la méthode de Monté Carlo * * * * * * * * * * * * * * * * * * * * * *
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Risque statistique Définition : Précision dun estimateur (risque associé à un estimateur) Le cas quadratique : - Biais - Variance * * Exemple : comment calculer une intégrale ? ab f(x) c Cest la méthode de Monté Carlo * * * * * * * * * * * * * * * * * * * * * *
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Risque statistique Définition : Précision dun estimateur (risque associé à un estimateur) Le cas quadratique : - Biais - Variance Risque = moyenne des erreurs * * Exemple : comment calculer une intégrale ? ab f(x) c Cest la méthode de Monté Carlo * * * * * * * * * * * * * * * * * * * * * *
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Risque statistique Définition : Précision dun estimateur (risque associé à un estimateur) Le cas quadratique : - Biais - Variance Risque = moyenne des erreurs Risque = erreur systématique + aléa * * Exemple : comment calculer une intégrale ? ab f(x) c Cest la méthode de Monté Carlo * * * * * * * * * * * * * * * * * * * * * *
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Statistiques pour le calcul Monté Carlo relaxation, recuit simulé... résolution dun système linéaire n 3 : méthodes itératives plus rapides mais « aléatoires » Modélisation : utilisation dexemples La modélisation statistique de phénomènes déterministes peut savérer utile
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Quelques applications
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Nez électronique Objectifs – remplacer un capteur coûteux par 6 capteurs « bon marché » – détecter certaines situation critiques Données disponibles – 280 points de mesures – 12 variables mesurées (pentes et conductance des capteurs) a priori – phénomènes « réguliers » – coût « absolu » méthode – S.V.M. (un genre de réseau de neurones) – sélection des variables pertinentes par analyse discriminante – définition des zones dambiguïté – définition dun domaine de validité du domaine Résultats
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Nez électronique inconnus Ambigus Classe 1 Classe 2 Classe 3 Régle de décision dans le plan de lAFD
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Capteur logiciel Objectifs – valider les données dun capteur physique de NH 4 – remplacer ce capteur pour la détection Données disponibles – 4 années, toutes les heures – 24 variables mesurées (pH, température, conductance, turbidité,…) – beaucoup de données manquantes a priori – phénomènes « réguliers » – coût quadratique méthode – réseau de neurones – sélection des variables pertinentes – prévision de lerreur de prédiction par un autre réseau de neurones – définition dun domaine de validité du domaine Résultats
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Capteur logiciel
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Prévision de la charge entrante Objectifs – prévoir quand et quelle quantité de polluant va arriver à. la station dépuration Données disponibles – 12 années, toutes les heures – 24 variables mesurées : pluie, charge entrante, température a priori – phénomènes « réguliers » – coût quadratique méthode – prévision de la pluie par un réseau de neurones – prévision de la charge par un second réseau de neurones – structurer les réseaux de neurones à priori – définition dun domaine de validité du domaine
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Écrouissage Objectif – prévoir le comportement de lalliage en fonction des forces Données disponibles – simulations logiciel dans un premier temps – données réelles ensuite a priori – phénomènes temporels à mémoire – coût quadratique méthode – réseau de neurones récurrents (bouclés) – approche incrémentale Résultats
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Écrouissage f(t) : la force appliquée au cours du temps e(t) : lallongement constaté au cours du temps Déformations - plastiques - élastiques Écrouissage - isotrope - cinématique
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Écrouissage f(t) : la force appliquée au cours du temps e(t) : lallongement constaté au cours du temps Déformations - plastiques - élastiques Écrouissage - isotrope - cinématique Pour une même valeur du couple (F,D) le futur est imprédictible Il faut connaître le passé du système
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Écrouissage : le modèle « statistique » x e(t) = e(t-1) + D (f(t)-f(t-1)) z -1 e sp sm f(t) f(t-1) a+b a-b -a Plastique/Elastique 1 Monte/Descend On cherche à « écrire » un programme, qui à partir dune suite de « forces » calcule la réponse de la pièce
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Écrouissage
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Écrouissage : résultats mesure modèle
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Écrouissage : résultats
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Apprendre : des entrées : X, et des sorties : Y But : trouver une dépendance : r(X) Utilisation : pour un X donné : prévoir Y Connaissance : données : (X i,Y i ), i=1,n cout : C (x,r(x),y ) a priori sur la structure du modèle Difficultés : Généralisation données limitées remplir les trous Tâches génériques : Discrimination, Régression, Prévision à un pas de temps, Identification
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Modules logiciels Apprendre : des entrées : X, et des sorties : Y But : trouver une dépendance : r(X) Utilisation : pour un X donné : prévoir Y Connaissance : données : (X i,Y i ), i=1,n cout : C (x,r(x),y ) a priori sur la structure du modèle Difficultés : Généralisation données limitées remplir les trous Tâches génériques : Discrimination, Régression, Prévision à un pas de temps, Identification
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Modèle « boite noire » y = r(X) Y = F(X, ) Prévision ^ erreur X Entrées Observables Entrées Non Observables Système Réel CRITERE
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques cout
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques cout
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques a prioricout
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques a prioricout
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques a prioricout
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques a prioricout
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Aspects fondamentaux Poser le problème les enjeux théoriques de l'apprentissage Explorer une solution possible la régularisation Développer de nouvelles approches nouveaux algorithmes Étude d'un problème fondamental sélectionner les variables explicatives pertinentes
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Perspectives Huile +gaz +eau Bouchons
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Prévoir la taille des bouchons Algorithme de prévision Une forme x historique, taille, profil et points bas de la canalisation température, débit y « date » darrivé et taille du prochain bouchon
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 y « date » darrivé et taille du prochain bouchon Prévoir la taille des bouchons Algorithme de prévision Une forme x historique, taille, profil et points bas de la canalisation température, débit A : Algorithme dapprentissage Ensemble dapprentissage (échantillon) 1
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Prévoir la taille des bouchons Algorithme de prévision Une forme x historique, taille, profil et points bas de la canalisation température, débit A : Algorithme dapprentissage Ensemble dapprentissage (échantillon) 2 1 y « date » darrivé et taille du prochain bouchon
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Prévoir la taille des bouchons Algorithme de prévision Une forme x historique, taille, profil et points bas de la canalisation température, débit A : Algorithme dapprentissage Ensemble dapprentissage (échantillon) A priori sur la nature de la solution y « date » darrivé et taille du prochain bouchon
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Conclusion Cest un outil dont il ne faut pas se priver Les méthodes statistiques peuvent dans certains cas apporter des solution originales à des problèmes « difficiles » il faut disposer de données on fait de la programmation à partir de données la notion de « coût » est fondamentale il faut disposer dune bonne méthodologie il était une fois un concours de prévision...