sur la « philosophie » des tests et des modèles en statistiques

Slides:



Advertisements
Présentations similaires
GDR MoMaS, Marseille, 14/11/2003 Études des incertitudes liées aux stockages des déchets nucléaires Anca Badea, Olivier Gipouloux.
Advertisements

Outils Statistiques Damien Van Gysel CHU de Nice
Atelier 1 Le problème du surpoids sur géogébra. Etude de la prévalence du surpoids: (document Ressources pour la classe de terminale) Situation: On souhaite.
Chapitre 4: Variation dans le temps  Les données : audience totale en milliers (tableau 4.1, p. 47, extrait) o Origine : enquête sur les habitudes d’écoute.
Réalisé par : Sébastien Lachance MATHS 3 E SECONDAIRE FONCTIONS polynomiales.
Utilisation du logiciel EduStat © Analyse classique d’items L’examen du rapport.
PERFORMANCES D’TEST DE DEPISTAGE Dr S.AMAROUCHE Maître assistante Epidémiologie Université 3 Constantine SEMEP CHU Constantine.
1. Le modèle IS - LM  Point de départ : article de J. Hicks « Mister Keynes and the classics » (Econometrica – avril 1937)  Interrogation sur la pertinence.
Corrélation et régression linéaire simple
Chapitre 4: Variation dans le temps
Outils de Recherche Opérationnelle en Génie MTH 8414
Tableau à double entrée
PIB en valeur et en volume
Analyse, Classification,Indexation des Données ACID
Valeurs de toutes les différences observables sous H0
Comparaison de deux pourcentages.
Chapitre 4: Variation dans le temps
Cours d’Econométrie de la Finance (STA202 – IV 3-4)
Cours d’Econométrie de la Finance (STA202 – IV 4-5)
Représentation de l’information en binaire:
4°) Intervalle de fluctuation :
LES MODELES MACROECONOMIQUES DE LA SYNTHESE
Une grande partie des données que nous serons amenés cette année à étudier sera exprimée en unités monétaires. Or, nous le savons, il existe un phénomène.
Microéconomie I.
Analyse en Composantes Principales A.C.P. M. Rehailia Laboratoire de Mathématiques de l’Université de Saint Etienne (LaMUSE).
Rapports et proportions
Coefficient de corrélation linéaire
La Conclusion.
Un premier succès dans la simplification de la tâche « même-différent » Vincent LeBlanc, Denis Cousineau QUIBB, École de Psychologie, Université d’Ottawa.
Les plans de mélange Les plans d’expérience : Présentée par :
Projet de recherche L’homéostasie du corps humains
et discussion de l'article 2
Technologies de l’intelligence d’affaires Séance 11
La droite de régression
Objectifs du chapitre 5: Plans corrélationnels
Technologies de l’intelligence d’affaires Séance 12
Révision et preparation à l’examen
Exploitation de mesures scientifiques.
Risque d’erreur de 1ère espèce : α
4.3 Estimation d’une proportion
4.4 Tests D’hypothèses sur une moyenne
4.2 Estimation d’une moyenne
Introduction aux statistiques Intervalles de confiance
corrélations alternatives
ACP Analyse en Composantes Principales
Calculs des incertitudes Lundi 30 Avril 2018 Master de Management de la Qualité, de la Sécurité et de l’Environnement.
I Définition : Elle est définie ...
Apports de la statistique spatialisée
CHAPTER 2: Apprentissage supervisé
4°) Intervalle de fluctuation :
sur la philosophie des tests et des modèles en statistiques
2.4 La loi de vitesse d’une réaction chimique
Test 2.
Comment analyser en fonction du genre et du sexe?
LES MODELES MACROECONOMIQUES DE LA SYNTHESE
On lance 100 fois de suite une pièce de monnaie.
Centre d’études et de recherches sur les qualifications
Position, dispersion, forme
Chapitre 1 Formulation d’un programme linéaire (PL) Georges Abboudeh BUST 347.
Les erreurs de mesure Projet d’Appui au renforcement des capacités
La démarche scientifique
Programme d’appui à la gestion publique et aux statistiques
PROGRAMMATION SCIENTIFIQUE EN C
Utiliser le modèle log-linéaire pour mettre au jour la structure du lien entre les deux variables d’un tableau de contingence : un exemple d’application.
Les méthodes quantitatives en éducation
Statistiques, licence Cinquième séance 18/06/2019.
Impact Evaluation 4 Peace March 2014, Lisbon, Portugal 1 Echantillonage pour une Evaluation d’Impact Latin America and the Caribbean’s Citizen Security.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
TD Comment les économistes, les sociologues et les politistes travaillent-ils et raisonnent-ils ? M. Osenda.
Outils de Recherche Opérationnelle en Génie MTH 8414
Transcription de la présentation:

sur la « philosophie » des tests et des modèles en statistiques I. Remarques sur la « philosophie » des tests et des modèles en statistiques

1. Tests statistiques compléments

Le dilemme statistique Les tests peuvent se concevoir de deux manières, dont aucune n’est satisfaisante pour les sciences humaines : Un test est une méthode de décision. C’est la vision économique des statistiques telles qu’elles sont enseignées par exemple à l’ENSAE, école de l’INSEE. Un test est une méthode de démonstration risquée. C’est la vision implicite utilisée par les chercheurs en sciences humaines. Il faudrait alors découvrir « la logique » sous-tendue par cette approche. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Le dilemme statistique De toute évidence, ça n’est pas la logique classique… Ni la logique floue, car le « risque » n’est pas la bonne mesure, et en particulier ça n’est pas la probabilité d’avoir tort, que ce soit a priori ou a posteriori. La puissance intervient fortement dans le caractère plus ou moins convaincant d’un test. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Compléments sur le risque et la probabilité d’erreur

Université de Metz | Licence de psychologie On aimerait que le risque soit une mesure du risque de se tromper. Soit a priori, soit a posteriori. Mais voyons ce qui se passe. conclu vérité H0 H1 1- a a b 1-b mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Université de Metz | Licence de psychologie a priori En général, on maîtrise a, mais non b. Or, ce dernier vaut, selon le cas (inconnu), entre 0 (cas très favorable où H1 empêche de « conclure » H0 et 1- a (cas très peu favorable où on est très proche de H0). Si la vérité correspond à H0, la probabilité de se tromper est a. Si la vérité correspond à H1, elle est de 1-a. En tout état de cause, si le risque est de 1%, on ne peut rien dire de plus que : mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Université de Metz | Licence de psychologie a posteriori Mais ce qui serait encore mieux serait une interprétation en terme de probabilité a posteriori. Autrement dit : en proportion de choses conclues qui soient vraies. Si nous ne concluons pas H0 par prudence, ET si toutes les variables sont indépendantes, le pourcentage de résultats faux est de 100% Si nous concluons H0 quand un test échoue, et si les effets sont minuscules, le nombre de résultats faux de la forme hypothèse nulle est de 99% en supposant un risque de 1%… Dans les deux cas, le nombre d’erreurs est énorme. Et nous ne pouvons rien faire… mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

À propos de la validité des modèles

Modèles mathématiques Un modèle mathématique est une construction mathématique, qui doit coller à la vérité. Une vision simplifiée du monde. Un modèle est bon s’il est prédictif. Un bon modèle n’est pas nécessairement explicatif. (ex : acupuncture) Une trop grande confiance dans le caractère « réel » des modèles amène à des confusions qui peuvent se révéler graves. Certaines méthodes sont des modèles construits sur des a priori implicites forts (anova, ACP,…). Il sont douteux d’un certain point de vue. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Université de Metz | Licence de psychologie Exemples La mécanique quantique ne prouve pas que le hasard existe. L’acupuncture efficace ne prouve rien sur les lignes d’énergie vitale. De grandes réussites de la psychanalyse ne prouveraient pas ses fondements. La théorie des « humeurs » donnait parfois de bons résultats. L’intelligence avec facteur g ou bi-factorielle sont également défendables. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Université de Metz | Licence de psychologie Exemples: ANOVA Dans le cas de l’anova croisée, nous concluons que les deux VI sont en interaction si les courbes des effets simples ne sont pas parallèles. Cela revient à considérer que l’absence d’interaction se traduit par le caractère additif des effets absolus (pour les médicaments: +2°+1° donne +3°). Donc que les effets sont eux-même additifs (+1°, +10 de QI, -2 de stress, etc.) Si les effets sont multiplicatif, tout ce qu’on raconte est faux (il faut alors utiliser autre chose que l’anova): voilà pourquoi comprendre les principes de l’anova est important… mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Quelques questions traitées par ordinateur (avec SPSS) II. Exemples Quelques questions traitées par ordinateur (avec SPSS)

1. Need for cognition Cacioppo, J. T., & Petty, R. E. (1982). The need for cognition. Journal of Personality and Social Psychology, 42, 116-131.

Université de Metz | Licence de psychologie Position du problème On mesure par une grandeur NFC (need for cognition) le plaisir que les sujets éprouvent à apprendre de nouvelles choses. On mesure par une grandeur, numérique également, la tendance des sujets à éviter d’avoir à résoudre des problèmes logiques. On notera cette grandeur CA (cognitive avoidance). On imagine que CA et NFC doivent être liée négativement. D’un autre côté, on peut rechercher de nouvelles connaissance sans aimer chercher à résoudre des problèmes. Alors ? CA et NFC sont-elles liées ? Nous sommes typiquement dans le cas où une régression linéaire paraît raisonnable. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

On a considéré CA comme la VD, mais cela est arbitraire. Le diagramme de dispersion n’est pas très convaincant si l’on souhaite conclure à un lien… On a considéré CA comme la VD, mais cela est arbitraire. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

le signe est conforme à nos prédictions coefficient r r(x,x)=1 le signe est conforme à nos prédictions L’échantillon est de taille 91 Le coefficient qui nous intéresse n’est pas significatif mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Université de Metz | Licence de psychologie Le désir de cognition explique 1,3% des variations observées d’évitement (CA) Si l’on corrige le coefficient r² qui n’est pas une bon estimateur du « vrai » r², on trouve 0,2%… NFC explique seulement 0,2% des variations de CA. Si on utilise l’équation de régression pour estimer CA connaissant NFC, l’erreur à laquelle on peut s’attendre est de 23 points. valeur absolue de r mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Université de Metz | Licence de psychologie Au fond, ANOVA et régression sont similaires. On raisonne en termes de variations dans les deux cas. F semble proche de 1… La régression (estimation de CA) explique 635 de variations (SC), sur un total de 48984 taille de l’échantillon 91. Il y a deux coefficients dans la régression F n’est pas significatif (bilatéral). Cette signification est celle de r. On ne peut pas conclure à un lien linéaire. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

L’équation de régression est CA=24+0,09NFC La constante est significativement non nulle (donc la moyenne de CA n’est pas nulle). Le coefficient directeur ne l’est pas (lien non significatif) On retrouve r, qui est égale à a si les variables sont standardisées Erreur à laquelle on peut s’attendre sur les deux coefficients. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Liens entre les valeurs D,A et S d’après nos observations 2. DASS Liens entre les valeurs D,A et S d’après nos observations

matrice de diagrammes de dispersion En abscisse D (colonne); en ordonnée A (ligne). S en fonction de D Tout semble lié positivement… mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Université de Metz | Licence de psychologie Matrice de corrélation. Les variables sont liées deux à deux positivement et significativement. La corrélation la plus forte est observée entre D et S (0,64). mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

On veut savoir maintenant s’il y aurait un lien entre A et S même si D n’intervenait pas (corrélation partielle) mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Université de Metz | Licence de psychologie La corrélation est toujours positive (0,34) et, quoique plus faible, toujours significative. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

La voiture rend agressif 3. En route La voiture rend agressif

Université de Metz | Licence de psychologie Position du problème On étudie l’agressivité au volant d’automobilistes. Les automobilistes sont observés en situation de conduite en ville, et on mesure par un score A l’agressivité de chaque sujet. On souhaite étudier les variations de A en fonction de la fluidité de la circulation, et de la consommation de café. On utilise deux facteurs inter-sujets dans un plan croisé. Le facteur « fluidité » a trois valeurs possibles (0: bouchon; 1: ralentissement; 2: circulation fluide). Le facteur « café » n’a que deux modalité (sans/avec), selon que le sujet a consommé ou non du café avant l’expérience. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Les variances pourraient poser problème… L’effet simple de la fluidité pour café=avec est net. L’autre effet simple moins. On voit l’effet principal du café en comparant l’altitude des courbes Il semble que la fluidité n’ait pas le même effet sur l’agressivité selon café… mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

L’hypothèse d’égalité des variances est raisonnable. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Croisement des facteurs facteur de correction Croisement des facteurs Total Total plus facteur de correction. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

III. Complément Méthodes avancées

Université de Metz | Licence de psychologie La question On voudrait savoir si la probabilité de dire « non » dans la tâche de simulation de hasard dépend du score d’humeur dépressive DASS_D. Le problème est que la VD est dichotomique, alors que la VI est numérique. D’autre part, on ne cherche pas vraiment une estimation de la réponse OUINON en fonction de DASS_D, mais plutôt une estimation de la probabilité d’obtenir NON en fonction de DASS_D. Logiquement, on devrait avoir une courbe « en S »… mais comment déterminer la meilleure courbe en S sur le même principe que la régression? Réponse: par la régression logistique. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

58 réponses « non » étaient prédictibles par le score D. La prédiction de réponse fournit par la régression logistique est correcte dans 70% des cas. 58 réponses « non » étaient prédictibles par le score D. Et 6 ne l’étaient pas. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

D a un effet significatif sur la réponse à la question OUINON La réponse n’est pas uniforme: la constante (probabilité générale) n’est pas 0,5. L’équation qui permet de déterminer la probabilité (estimée) de la réponse NON en fonction de D est de la forme log(p/(1-p))=0,05.D-1,3 Où p est la probabilité cherchée. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie

Université de Metz | Licence de psychologie Les taux les plus élevés pour D correspondent à des probabilités de presque 70% de Non. C’est avec un score de dépression de 23 que l’on est le plus susceptible de répondre uniformément. mercredi 21 novembre 2018 Université de Metz | Licence de psychologie