Un neurone élémentaire

Slides:

Advertisements

Présentations similaires

L’échantillonnage & Ses Fluctuations

Advertisements

STATISTIQUE INFERENTIELLE L ’ESTIMATION

Algorithmes et structures de données avancés

But de la lecture critique

Les tests d’hypothèses (I)

Problème de 8 dames: Sachant que dans un jeu des échecs, une dame peut pendre toute pièce se trouvant sur la colonne ou sur la ligne ou sur les diagonales.

Inférence statistique

C1 Bio-statistiques F. KOHLER

Inférence statistique

Comparaison d'une distribution observée à une distribution théorique

Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.

Les TESTS STATISTIQUES

Tests de comparaison de pourcentages

Les TESTS STATISTIQUES

variable aléatoire Discrète

Améliorer les performances du chiffrage à flot SYND

S.T.S. S.I.O. 1ère année La gestion de projets

Régression linéaire (STT-2400) Section 3 Tests dhypothèses et lhypothèse linéaire générale Version: 26 janvier 2007.

Évolution à taux constant

Systèmes d’équations du premier degré à deux variables

Systèmes d’équations du premier degré à deux variables

RÉSOLUTION DE PROBLÈMES

Concepts avancés en mathématiques et informatique appliquées

Fonction puissance Montage préparé par : André Ross

Régression linéaire simple

Systèmes d’équations linéaires

Comprendre la variation

Comprendre la variation dans les données: Notions de base

Systèmes d’équations du premier degré à deux variables

Corrélation et régression linéaire simple

Les réseaux de neurones

Représentation des systèmes dynamiques dans l’espace d’état

Représentation des systèmes dynamiques dans l’espace d’état

Prévisions météorologiques, projections climatiques : que peut- on prévoir et avec quelle fiabilité ? Exercice 2: estimation de la prévisibilité dans le.

Prévisions météorologiques, projections climatiques : que peut- on prévoir et avec quelle fiabilité ? Exercice 2: estimation de la prévisibilité dans le.

La corrélation et la régression multiple

La corrélation et la régression

Les modèles linéaires (Generalized Linear Models, GLM)

Systèmes semi-linéaires

Quelques fonctions de base

RECONNAISSANCE DE FORMES

Calcul des groupes d'homologie d’objets discrets

La régression multiple

La droite dans R3 Montage préparé par : André Ross

Régression linéaire (STT-2400)

Programmation linéaire en nombres entiers : les méthodes de troncature

Modélisation géométrique de base

l’algorithme du simplexe

ASI 3 Méthodes numériques pour l’ingénieur

Présentation de la méthode des Eléments Finis

Rappels de statistiques descriptives

Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.

Programmation linéaire en nombres entiers

Micro-intro aux stats.

Les réseaux de neurones à réservoir en traitement d’images

Institut de sciences et technologies Département d’informatique

Probabilités et Statistiques Année 2010/2011

Les réseaux de neurones à réservoir en traitement d’images

Méthode des moindres carrés (1)

20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.

Post-optimisation, analyse de sensibilité et paramétrage

Interpolation et Approximation

Régression linéaire (STT-2400)

1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.

ECHANTILLONAGE ET ESTIMATION

Introduction aux statistiques Intervalles de confiance

Coltier Yves Division des prix 14/05/2014 Les remplacements de type EC Les modèles hédoniques.

Bienvenue au cours MAT-350 Probabilités et statistiques.

Transcription de la présentation:

Un neurone élémentaire Fauconnier Cécile Informatique de Gestion Université de Liège

Introduction Un réseau de neurones est un outil d'analyse statistique Définitions: Un neurone est une fonction algébrique non linéaire, paramétrée, à valeurs bornées Un réseau de neurones est un ensemble fini de neurones, c’est-à-dire un ensemble fini de fonctions algébriques non linéaires, paramétrées, à valeurs bornées.

Un neurone poids f sortie entrées

Mise en oeuvre Mise en œuvre d'un réseau de neurones: Définition de la structure du réseau Détermination des paramètres qui définissent le réseau Phase de validation

Plan de l'exposé Problème posé et définitions conceptuelles Résolution pratique du problème et résultats

Le problème Données: Questionnaires éventuellement mal remplis et décisions pour chaque questionnaire Problème: extraire la prise de décision à l’aide de ces questionnaires pour pouvoir traiter tous les questionnaires de même type qui pourraient être remplis

Représentation Abstraction du problème g' A X D g

Les données D: matrice de bits n X c nb de questionnaires X nb de bits par questionnaire A chaque ligne de D correspond le bit donné par la valeur de g. Ces bits forment un vecteur colonne de bits, à n lignes: le vecteur R

Un neurone Un neurone réalise une fonction non linéaire bornée appelée fonction d’activation y=f(e1,…eJ,w1,…,wJ) où les ej sont les variables et les wj les paramètres Sortie du neurone: Les poids wj renforcent les liaisons, les annulent ou les diminuent.

Fonction d’activation Choix: la fonction signe

Résolution du problème Résoudre le problème posé à l’aide d’un neurone dont la structure est définie, c’est déterminer les paramètres wj qui définissent ce neurone de telle manière que les valeurs de ce neurone approchent au mieux les valeurs de la fonction g de départ pour les différents questionnaires donnés.  Phase d’apprentissage

Résolution du problème Lorsque les paramètres wj seront déterminés, la fonction g’ cherchée sera définie par

Défaut du neurone Soit di un questionnaire caractérisé par les bits e1,…,ec. Le défaut pour ce questionnaire est donné par

Défaut d’un neurone Défaut du neurone

Apprentissage Définition: Procédure qui consiste à estimer les paramètres des neurones du réseau, afin que celui-ci remplisse au mieux la tâche qui lui est affectée.

Méthode d’ajustement Choix de la méthode : Calcul Poids aléatoires w1,…,wc Calcul du défaut Changement de poids On garde les poids Si le défaut a diminué

Valeur de la méthode d’ajustement Le concept d’apprentissage n’est intéressant que si le réseau possède la capacité de généralisation. Deux méthodes: Ensemble d’apprentissage restreint afin d’avoir des exemples de vérification Comparaison au modèle aléatoire théorique

Elaboration pratique Problème concret: 11 notes sur 20 pour 99 étudiants Grade obtenu pour chaque étudiant Question: un étudiant donné a-t-il une distinction ou non?

Transformation des données Notes ramenées sur 15 Notes codées sur 4 bits Grade1 bit : présence d’une distinction  1 absence d’une distinction  -1 pas de décision 0  Au total, 45 bits par étudiant

Phase d’ajustement Procédé : Modification d’un poids à la fois tant que le défaut diminue D, R, Poids aléatoires w1,…,wc w1,…wc modifiés Modification de 2 poids à la fois tant que le défaut diminue Modification de 3 poids à la fois tant que le défaut diminue

Résultats Valeur du neurone pour un étudiant i donné Erreur initiale: 226 Erreur après modification de 1 poids à la fois : 56 Erreur après modification de 2 poids à la fois : 44 Erreur après modification de 3 poids à la fois : 36

Influence des poids initiaux aléatoires Grande influence des poids initiaux. Défaut compris entre 20 et 56 Moyenne: 33.5 Ecart-type : 8.1

Validité de la méthode Deux méthodes: Ensemble d’apprentissage restreint afin d’avoir des exemples de vérification Comparaison au modèle aléatoire théorique

Méthode 1 On enlève un étudiant de l’ensemble d’apprentissage. On effectue l’ajustement On compare la valeur du neurone pour l’étudiant retiré et la valeur réel  On réalise ces différentes étapes pour chaque étudiant de l’ensemble de départ et on peut constater le pourcentage d’erreur obtenu …34%

Déduction La méthode n’est pas sans faille Hypothèse: Influence des poids initiaux aléatoires Résolution : Effectuer différents apprentissages pour ne pas être soumis aux choix initiaux …28% (5 ajustements)

Méthode 2 Comparaison au cas théorique aléatoire Cas aléatoire Matrice aléatoire D de bits (-1,0,1) (dim 99 x 45) Apprentissage

Résultats Erreur initiale: 184 Erreur après modification de 1 poids à la fois: 106 Erreur après modification de 2 poids à la fois: 80 Erreur après modification de 3 poids à la fois: 60

Résultats (suite) Erreur jamais inférieur à 50 Moyenne:65.5 Ecart-type: 8.3

Construction d’un intervalle de confiance Test d’hypothèse: l’erreur obtenue reflète-t-elle le cas aléatoire? n : nombre de questionnaires c : nombre de questions par questionnaire D: matrice aléatoire de bits (dim. n x (c+1))  apprentissage, erreur finale

Test (suite) X: v.a. définie par le défaut obtenu à partir d’une matrice donnée Moyenne : m Ecart-type: σ  Grand nombre de réalisations

Test (suite) Thm central-limite Intervalle de confiance unilatéral de la moyenne de la variable X, au niveau de confiance 1-α:

Neurones concurrents Solution apportée à l’influence des valeurs initiales des poids : mettre des neurones en concurrence 40 ajustements + vote majoritaire  Taux d’erreur: 23.23%

Autres tests sur les données Variance des tests: Un étudiant est ajourné ou non Un étudiant obtient une satisfaction ou non Un étudiant obtient une grande distinction ou non Un étudiant obtient une plus grande distinction ou non

Résultats finaux Les pourcentages d’erreur sont équivalents peut importe le test considéré. Les grades de différents étudiants sont mal prédits. Certains sont difficiles à placer dans une classe ou l’autre

Conclusion Citons notamment que l'absence de justification pour le choix des paramètres et de la structure du réseau nous a conduit à travailler par essais et erreurs. Ceci ne remet pas en cause la validité de nos résultats mais nous ne pouvons affirmer avoir obtenu le plus haut degré de précision. Nous avons, dans cette étude empirique, mis en œuvre une technique relative aux réseaux de neurones. Seules quelques pistes ont été exploitées et nous n'excluons pas qu'il soit possible d'obtenir de meilleurs résultats. De plus, le caractère singulier et ponctuel de l'étude empirique ne nous autorise pas à tirer des conclusions générales.