Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Outils danalyse statistiques « programmation par lexemple » S. Canu,

Slides:



Advertisements
Présentations similaires
Non linéarités liées à la thermique
Advertisements

STATISTIQUE INFERENTIELLE L ’ESTIMATION
Présentation de la société, des logiciels et des services
Relational Learning as a Search in a Critical Region Lou Fedon 9 Mars 2006.
Introduction aux couplages thermomécaniques
Une méthode de spatialisation du vent moyen et des rafales par régression multiple puis krigeage des résidus Action DCLIM/DEC P.Lassègues, J.M.Veysseire,
1 Séminaire de travail « Indicateur de croissance en France et/ou en zone euro : méthodologie et évaluation » 14 juin 2006 Indicator Models of Real GDP.
LES RESEAUX DE NEURONES
1 Vers la découverte de nouvelles modalités sensori-motrices. Encadrants : Pierre Bessière Anne Spalanzani Pierre Dangauthier DEA I.V.R. 24 Juin 2003 Sélection.
Visualisation d’information interactive 5 : Graphes
HORAIRES HEBDOMADAIRES PROPOSES Spécialité Gestion 3 heures en classe entière 2 heures en demi - groupe Soit 5 heures - élève Spécialité Communication.
"Recherche de scénarios redoutés à partir d'un modèle réseau de Petri"
El-Djillali TALBI Doctorant systèmes industriels
Modélisation des systèmes non linéaires par des SIFs
Probabilités et statistique en TS
Application à la méthode des
Prévisions des ventes :
DEA instrumentation et commande
Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble
Vers un indicateur de la qualité des cours d’ eau…
Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble
Un neurone élémentaire
Modélisation de déclenchement d’avalanche par réseaux de neurones
Initiation au calcul des structures dans le domaine plastique Elasto - plasticité en petite transformation Cours.
Application des algorithmes génétiques
Marketing Engineering
Les Systèmes Multi-Agents pour la Gestion de Production
Pourquoi les réseaux de neurones de type « perceptron multicouche » conviennent-ils à l’apprentissage Stéphane Canu, INSA de Rouen , PSI André Elisseeff,
RÉSOLUTION DE PROBLÈMES
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Méthode des k plus proches voisins
DEA Perception et Traitement de l’Information
DEA Perception et Traitement de l’Information
DataLab® Toute la connaissance client en quelques minutes
Interprétation de séquences dimages pour des applications MédiaSpace Alberto AVANZI François BREMOND Monique THONNAT Projet ORION INRIA de Sophia Antipolis.
Les réseaux de neurones
Universté de la Manouba
Révisions - IA Généralité: problèmes de lIA Recherche Logique Traitement de lincertitude Apprentissage Langue naturelle.
Cast3M et la mécanique de la rupture
Le forage de données ou data mining
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Des épreuves pratiques aux TP Des exemples en probabilités
Filtrage de Kalman et aperçu probabiliste
Techniques de prévision quantitatives
Probabilités et Statistiques
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Ministère de l’Enseignement Supérieur et de la Recherche Scientifique
La régression simple Michel Tenenhaus
Apport du Data Mining pour prédire la facture de patients hospitalisés
Une méthode de prévision à un pas de temps Application à la prévision de la qualité de l’air S. Canu, Ph. Leray, A. Rakotomamonjy laboratoire PSI, équipe.
Présentation du marché obligataire
Réseaux de neurones artificiels « programmation par l’exemple »
S. Canu, laboratoire PSI, INSA de Rouen
Réseaux de neurones artificiels « le neurone formel »
Notions de coûts et prise de décision
TNS et Analyse Spectrale
Le chaos pourquoi ? Permet de modéliser un type de mouvement récent qui n’est ni uniforme, ni accéléré. Des dynamiques chaotiques ont été mises en évidence.
Décision incertaine et logistique : Grille typologique
Knowledge discovery in Databases (KDD)
( ) Collège de Maisonneuve
Méthode des moindres carrés (1)
Principes d'économétrie
STATISTIQUES.
Analyse des données. Plan Lien entre les statistiques et l’analyse des données Propagation des erreurs Ajustement de fonctions.
Présentation du système
Modélisation des Actions Mécaniques Première sti2d
1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.
ECHANTILLONAGE ET ESTIMATION
Bienvenue au cours MAT-350 Probabilités et statistiques.
Les réseaux de neurones pour l’apprentissage ESSEC, le 28 Juin 2002 Réseaux de neurones artificiels « programmation par l’exemple » S. Canu, laboratoire.
Transcription de la présentation:

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Outils danalyse statistiques « programmation par lexemple » S. Canu, laboratoire PSI, INSA de Rouen équipe « systèmes dinformation pour lenvironnement » psichaud.insa-rouen.fr/~scanu

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Plan de Route – traitement de données environnementales – risque statistique – études de cas – nez électronique – capteur logiciel – prévision de charge entrante – modélisation de lécrouissage – programmation à base dexemples – exemples dapplications potentielles prévision de rupture prévision des « bouchons »

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Système dinformation pour lenvironnement

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Système dinformation pour lenvironnement Nature des phénomènes beaucoup de données disponibles dépendances complexes : non linéaires, bruités les événements intéressants sont rares

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Système dinformation pour lenvironnement Nature des phénomènes beaucoup de données disponibles dépendances complexes : non linéaires, bruités les événements intéressants sont rares Problèmes à résoudre validation de données prévision à court terme évaluation de la situation décision.

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Système dinformation pour lenvironnement Nature des phénomènes beaucoup de données disponibles dépendances complexes : non linéaires, bruités les événements intéressants sont rares Solution programmation à base dexemple précision de la prévision domaine de validité Problèmes à résoudre validation de données prévision à court terme évaluation de la situation décision.

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Risque statistique * * Exemple : comment calculer une intégrale ? ab f(x) c Cest la méthode de Monté Carlo * * * * * * * * * * * * * * * * * * * * * *

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Risque statistique Définition : Précision dun estimateur (risque associé à un estimateur) Le cas quadratique : - Biais - Variance * * Exemple : comment calculer une intégrale ? ab f(x) c Cest la méthode de Monté Carlo * * * * * * * * * * * * * * * * * * * * * *

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Risque statistique Définition : Précision dun estimateur (risque associé à un estimateur) Le cas quadratique : - Biais - Variance Risque = moyenne des erreurs * * Exemple : comment calculer une intégrale ? ab f(x) c Cest la méthode de Monté Carlo * * * * * * * * * * * * * * * * * * * * * *

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Risque statistique Définition : Précision dun estimateur (risque associé à un estimateur) Le cas quadratique : - Biais - Variance Risque = moyenne des erreurs Risque = erreur systématique + aléa * * Exemple : comment calculer une intégrale ? ab f(x) c Cest la méthode de Monté Carlo * * * * * * * * * * * * * * * * * * * * * *

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Statistiques pour le calcul Monté Carlo relaxation, recuit simulé... résolution dun système linéaire n 3 : méthodes itératives plus rapides mais « aléatoires » Modélisation : utilisation dexemples La modélisation statistique de phénomènes déterministes peut savérer utile

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Quelques applications

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Nez électronique Objectifs – remplacer un capteur coûteux par 6 capteurs « bon marché » – détecter certaines situation critiques Données disponibles – 280 points de mesures – 12 variables mesurées (pentes et conductance des capteurs) a priori – phénomènes « réguliers » – coût « absolu » méthode – S.V.M. (un genre de réseau de neurones) – sélection des variables pertinentes par analyse discriminante – définition des zones dambiguïté – définition dun domaine de validité du domaine Résultats

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Nez électronique inconnus Ambigus Classe 1 Classe 2 Classe 3 Régle de décision dans le plan de lAFD

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Capteur logiciel Objectifs – valider les données dun capteur physique de NH 4 – remplacer ce capteur pour la détection Données disponibles – 4 années, toutes les heures – 24 variables mesurées (pH, température, conductance, turbidité,…) – beaucoup de données manquantes a priori – phénomènes « réguliers » – coût quadratique méthode – réseau de neurones – sélection des variables pertinentes – prévision de lerreur de prédiction par un autre réseau de neurones – définition dun domaine de validité du domaine Résultats

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Capteur logiciel

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Prévision de la charge entrante Objectifs – prévoir quand et quelle quantité de polluant va arriver à. la station dépuration Données disponibles – 12 années, toutes les heures – 24 variables mesurées : pluie, charge entrante, température a priori – phénomènes « réguliers » – coût quadratique méthode – prévision de la pluie par un réseau de neurones – prévision de la charge par un second réseau de neurones – structurer les réseaux de neurones à priori – définition dun domaine de validité du domaine

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Écrouissage Objectif – prévoir le comportement de lalliage en fonction des forces Données disponibles – simulations logiciel dans un premier temps – données réelles ensuite a priori – phénomènes temporels à mémoire – coût quadratique méthode – réseau de neurones récurrents (bouclés) – approche incrémentale Résultats

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Écrouissage f(t) : la force appliquée au cours du temps e(t) : lallongement constaté au cours du temps Déformations - plastiques - élastiques Écrouissage - isotrope - cinématique

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Écrouissage f(t) : la force appliquée au cours du temps e(t) : lallongement constaté au cours du temps Déformations - plastiques - élastiques Écrouissage - isotrope - cinématique Pour une même valeur du couple (F,D) le futur est imprédictible Il faut connaître le passé du système

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Écrouissage : le modèle « statistique » x e(t) = e(t-1) + D (f(t)-f(t-1)) z -1 e sp sm f(t) f(t-1) a+b a-b -a Plastique/Elastique 1 Monte/Descend On cherche à « écrire » un programme, qui à partir dune suite de « forces » calcule la réponse de la pièce

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Écrouissage

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Écrouissage : résultats mesure modèle

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Écrouissage : résultats

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Apprendre : des entrées : X, et des sorties : Y But : trouver une dépendance : r(X) Utilisation : pour un X donné : prévoir Y Connaissance : données : (X i,Y i ), i=1,n cout : C (x,r(x),y ) a priori sur la structure du modèle Difficultés : Généralisation données limitées remplir les trous Tâches génériques : Discrimination, Régression, Prévision à un pas de temps, Identification

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Modules logiciels Apprendre : des entrées : X, et des sorties : Y But : trouver une dépendance : r(X) Utilisation : pour un X donné : prévoir Y Connaissance : données : (X i,Y i ), i=1,n cout : C (x,r(x),y ) a priori sur la structure du modèle Difficultés : Généralisation données limitées remplir les trous Tâches génériques : Discrimination, Régression, Prévision à un pas de temps, Identification

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Modèle « boite noire » y = r(X) Y = F(X, ) Prévision ^ erreur X Entrées Observables Entrées Non Observables Système Réel CRITERE

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques cout

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques cout

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques a prioricout

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques a prioricout

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques a prioricout

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Programmation à base dexemples Exemples : (formes x, étiquettes y, confiance) A lgorithme programme Pas de modèle : – si on veut pourvoir tout apprendre, il faut contrôler la complexité Représentation des incertitudes : – fusion dinformations incertaines Méthodologie et applications : – domaine de validité, intervalle de confiance, heuristiques a prioricout

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Aspects fondamentaux Poser le problème les enjeux théoriques de l'apprentissage Explorer une solution possible la régularisation Développer de nouvelles approches nouveaux algorithmes Étude d'un problème fondamental sélectionner les variables explicatives pertinentes

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Perspectives Huile +gaz +eau Bouchons

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Prévoir la taille des bouchons Algorithme de prévision Une forme x historique, taille, profil et points bas de la canalisation température, débit y « date » darrivé et taille du prochain bouchon

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 y « date » darrivé et taille du prochain bouchon Prévoir la taille des bouchons Algorithme de prévision Une forme x historique, taille, profil et points bas de la canalisation température, débit A : Algorithme dapprentissage Ensemble dapprentissage (échantillon) 1

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Prévoir la taille des bouchons Algorithme de prévision Une forme x historique, taille, profil et points bas de la canalisation température, débit A : Algorithme dapprentissage Ensemble dapprentissage (échantillon) 2 1 y « date » darrivé et taille du prochain bouchon

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Prévoir la taille des bouchons Algorithme de prévision Une forme x historique, taille, profil et points bas de la canalisation température, débit A : Algorithme dapprentissage Ensemble dapprentissage (échantillon) A priori sur la nature de la solution y « date » darrivé et taille du prochain bouchon

Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000Conclusion Cest un outil dont il ne faut pas se priver Les méthodes statistiques peuvent dans certains cas apporter des solution originales à des problèmes « difficiles » il faut disposer de données on fait de la programmation à partir de données la notion de « coût » est fondamentale il faut disposer dune bonne méthodologie il était une fois un concours de prévision...