Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux Evaluer la fiabilité d’un demandeur de crédit à partir de ses revenus, du nombre de personnes à charge, des encours de crédits qu’il détient Affecter un objet à sa famille d’appartenance à partir de ses caractéristiques physiques Pour la Reconnaissance optique de caractères. L'analyse discriminante est utilisée pour reconnaître un caractère imprimé à partir d'informations simples, comme la présence ou non de symétrie, le nombre d'extrémités…
Permet d’étudier la différence entre 2 ou plusieurs groupes en tenant compte de multiples variables simultanément. Le but d’une analyse discriminante est d’étudier les relations entre une variable qualitative et un ensemble de variables explicatives quantitatives. Aide à analyser les différences entre les groupes et/ou donne les moyens pour assigner (classifier) les cas dans le groupe lui ressemblant le plus
Déterminer les variables explicatives les plus discriminantes vis à vis des classes déterminées. Déterminer à quel groupe appartient un individu à partir de ses caractéristiques. Mais surtout à valider une classification ou à faire un choix entre plusieurs classifications pour savoir laquelle est la plus pertinente. (L’analyse discriminante intervient donc à postériori d’une classification).
Analyse discriminante: un terme large, englobant plusieurs activités statistiques très reliées Le chercheur ne les utilise pas toutes à la fois, il en sélectionne quelques unes Plus fréquemment: celles pour interpréter les différences entre les groupes et celles pour classer les cas dans des groupes Ex: Wilks’ Lambda, Canonical Discriminant Function Coefficient, Eigenvalue, etc.
Les données correspondent à 150 fleurs d'Iris, décrites par 4 variables quantitatives. Trois différentes espèces font partie de cette étude : setosa, versicolor et virginica. Tester si les quatre variables descriptives permettent d'identifier les espèces, puis de visualiser les données sur un graphique afin de vérifier que les trois espèces sont bien distinguées.
Une analyse discriminante se déroule en 3 étapes : 1. On vérifie l’existence de différences entre les groupes. 2. On valide l’étude. 3. On vérifie le pouvoir discriminant des axes. 4. On juge la qualité de la représentation du modèle. La 3ème étape peut être passée dans la plupart des cas.
Ce tableau fournit les moyennes des différentes variables explicatives pour les différentes classes de la variable dépendante
On vérifie s’il existe bien des différences entre les groupes grâce à trois indicateurs : la moyenne ou la variance, le test du F et le Lambda de Wilks. Ils s’interprètent de la façon suivante :
On estime la validité d’une analyse discriminante à partir de indicateurs : Le test de Box. La corrélation globale. Le Lambda de Wilks.
Le M doit être le plus élevé possible. La significativité du test de F doit tendre vers 0. S’il est supérieur à 0,05, l’analyse n’est pas valide.
Plus la valeur du Lambda de Wilks (deuxième colonne) est faible, plus le modèle est bon. On observe également sa significativité : plus elle est tend vers 0, meileur, plus le modèle est bon. Plus la valeur du Lambda de Wilks (deuxième colonne) est faible, plus le modèle est bon. On observe également sa significativité : plus elle est tend vers 0, meileur, plus le modèle est bon.
vérifier sur un graphique à deux ou trois dimensions si les groupes auxquels appartiennent les observations sont bien distincts ; identifier quelles sont les caractéristiques des groupes sur la base de variables explicatives ; prédire le groupe d’appartenance pour un individu.