Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.

Slides:



Advertisements
Présentations similaires
Analyse d’items Ensemble de procédés statistiques dont le but est d ’évaluer la qualité d’un instrument de mesure et des items qui le composent. Ensemble.
Advertisements

Classification et prédiction
Classification et prédiction
Université de Ouagadougou
C1 Bio-statistiques F. KOHLER
Les TESTS STATISTIQUES
Les TESTS STATISTIQUES
Dr DEVILLE Emmanuelle J D V 12/07/2006
Statistique et probabilités au collège
La démarche clinique infirmière
Modélisation des systèmes non linéaires par des SIFs
Traitement de données socio-économiques et techniques d’analyse :
Séminaire dAnalyses comparatives et enquête sociologique Séances 8 et 9 Lanalyse des résultats.
Les principaux résumés de la statistique
La Régression Multiple
Structure de causalité bivariée
Chap 4 Les bases de données et le modèle relationnel
Régression linéaire simple
Construction de modèles visuels
Howell, Chap. 1 Position générale
Comprendre la variation dans les données: Notions de base
Méthodes de prévision (STT-3220)
ELEMENTS DE COURS 1. LERIDON H., TOULEMON L. (1997) – Démographie. Approche Statistiques et dynamique des populations. Paris, Economica. 2. FALISSARD.
Séminaire d’Analyses comparatives et enquête sociologique
La corrélation et la régression multiple
La régression logistique
La corrélation et la régression
Le comportement des coûts Chapitre 3
Structure discriminante (analyse discriminante)
Objectifs Chapitre 8: Mesure en psychologie
Les analyses multivariées
Objectifs Chapitre 2: variables
Interprétation automatique
Information et Système d’Information
La régression multiple
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Régression linéaire multiple : hypothèses & interprétation
Méthodes de Biostatistique
Initiation à la Méthodologie de Recherche
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Lien entre deux variables
Projet pour un festival des sciences Entrez le titre du projet ici Votre nom Nom de votre professeur Votre école.
Micro-intro aux stats.
M2 Sciences des Procédés - Sciences des Aliments
DESIGN MULTIMÉDIA Initiation aux bases de La scénarisation multimédia
La taxonomie Bloom Un résumé
Sériation et traitement de données archéologiques
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
- Exemple de détermination de tolérance de localisation
ATELIERS STATISTIQUES
Statistique Descriptive Les Paramètres de Tendance Centrale
CONSTRUCTION DE TABLEAUX CROISES SUR LE LOGICIEL MODALISA MET4 – Avril 2005.
Distribution à deux variables
Claude Matricon ("le marketing du réel") propose une classification qui permet de distinguer les 4 différents marchés dont dépend l'entreprise :  marché.
Modélisation du signal de télédétection
CHAPITRE 2 LES SITUATIONS FONCTIONNELLES
Analyse de données avec R
Les normes spirométriques chez les adultes Malagasy MaSpiroGroup.
M. YAMANAKA – Cours de mathématiques. Classe de 4ème.
Bienvenue!  Professeur : Dr. David Beaudoin.  Disponibilité : Mardi 15h30-17h local  Disponibilité d’Antoine Gautier: Mardi et Jeudi à compter.
Examen psychologique de l‘adulte et du sujet âgé Examen psychologique de l‘adulte et du sujet âgé UPJV Département de Psychologie Cours du 6 novembre 2013.
Mesures de description des valeurs des variables
ETUDES PRONOSTIQUES Pr Ganry.
INDICATEURS DE PERFORMANCE - I ls permettent de savoir si le but et les objectifs du projet sont atteints ; - ils renseignent sur la réalisation de l’objectif.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Introduction à l’analyse multidimensionnelle Master BOE LATLI Adrien
Chapitre 12 Des modeles corrélationnelles. A la fin de ce chapitre on sera capable de:  definir le but et l’utilisation des modeles correlationnelles.
Découvrir le sens des critères d’évaluation…  Analyser des tâches complexes pour faire émerger des critères d’évaluation de la compétence à Résoudre des.
Des variables et des données. Dans le domaine de la statistique le mot variable signifie une idée différente de celle dans l’algèbre ou les fonctions.
Transcription de la présentation:

Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux Evaluer la fiabilité d’un demandeur de crédit à partir de ses revenus, du nombre de personnes à charge, des encours de crédits qu’il détient Affecter un objet à sa famille d’appartenance à partir de ses caractéristiques physiques Pour la Reconnaissance optique de caractères. L'analyse discriminante est utilisée pour reconnaître un caractère imprimé à partir d'informations simples, comme la présence ou non de symétrie, le nombre d'extrémités…

Permet d’étudier la différence entre 2 ou plusieurs groupes en tenant compte de multiples variables simultanément. Le but d’une analyse discriminante est d’étudier les relations entre une variable qualitative et un ensemble de variables explicatives quantitatives. Aide à analyser les différences entre les groupes et/ou donne les moyens pour assigner (classifier) les cas dans le groupe lui ressemblant le plus

Déterminer les variables explicatives les plus discriminantes vis à vis des classes déterminées. Déterminer à quel groupe appartient un individu à partir de ses caractéristiques. Mais surtout à valider une classification ou à faire un choix entre plusieurs classifications pour savoir laquelle est la plus pertinente. (L’analyse discriminante intervient donc à postériori d’une classification).

Analyse discriminante: un terme large, englobant plusieurs activités statistiques très reliées Le chercheur ne les utilise pas toutes à la fois, il en sélectionne quelques unes Plus fréquemment: celles pour interpréter les différences entre les groupes et celles pour classer les cas dans des groupes Ex: Wilks’ Lambda, Canonical Discriminant Function Coefficient, Eigenvalue, etc.

Les données correspondent à 150 fleurs d'Iris, décrites par 4 variables quantitatives. Trois différentes espèces font partie de cette étude : setosa, versicolor et virginica. Tester si les quatre variables descriptives permettent d'identifier les espèces, puis de visualiser les données sur un graphique afin de vérifier que les trois espèces sont bien distinguées.

Une analyse discriminante se déroule en 3 étapes : 1. On vérifie l’existence de différences entre les groupes. 2. On valide l’étude. 3. On vérifie le pouvoir discriminant des axes. 4. On juge la qualité de la représentation du modèle. La 3ème étape peut être passée dans la plupart des cas.

Ce tableau fournit les moyennes des différentes variables explicatives pour les différentes classes de la variable dépendante

On vérifie s’il existe bien des différences entre les groupes grâce à trois indicateurs : la moyenne ou la variance, le test du F et le Lambda de Wilks. Ils s’interprètent de la façon suivante :

On estime la validité d’une analyse discriminante à partir de indicateurs : Le test de Box. La corrélation globale. Le Lambda de Wilks.

Le M doit être le plus élevé possible. La significativité du test de F doit tendre vers 0. S’il est supérieur à 0,05, l’analyse n’est pas valide.

Plus la valeur du Lambda de Wilks (deuxième colonne) est faible, plus le modèle est bon. On observe également sa significativité : plus elle est tend vers 0, meileur, plus le modèle est bon. Plus la valeur du Lambda de Wilks (deuxième colonne) est faible, plus le modèle est bon. On observe également sa significativité : plus elle est tend vers 0, meileur, plus le modèle est bon.

vérifier sur un graphique à deux ou trois dimensions si les groupes auxquels appartiennent les observations sont bien distincts ; identifier quelles sont les caractéristiques des groupes sur la base de variables explicatives ; prédire le groupe d’appartenance pour un individu.