La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

D.Gile statistiques 1 CONCEPTS FONDAMENTAUX EN STATISTIQUES POUR LES ETUDIANTS DANS LES SCIENCES HUMAINES : UNE SENSIBILISATION

Présentations similaires


Présentation au sujet: "D.Gile statistiques 1 CONCEPTS FONDAMENTAUX EN STATISTIQUES POUR LES ETUDIANTS DANS LES SCIENCES HUMAINES : UNE SENSIBILISATION"— Transcription de la présentation:

1 D.Gile statistiques 1 CONCEPTS FONDAMENTAUX EN STATISTIQUES POUR LES ETUDIANTS DANS LES SCIENCES HUMAINES : UNE SENSIBILISATION

2 D.Gile statistiques2 QUANTIFIER ? (1) Dans le LAP des sciences humaines, on peut distinguer deux démarches : - Une démarche philosophico-créatrice où lessentiel du travail se situe dans la réflexion et la création conceptuelle et où la « réalité » nest quun point de départ - Une démarche interprétative, majoritaire, où lessentiel du travail se situe dans linterprétation de la réalité Dans celle-ci, les chercheurs interprètent beaucoup sur la base de faits. Or, daprès les conventions du LAP, ces faits sont en général lobjet daffirmations avec des exemples et des contre- exemples illustratifs

3 D.Gile statistiques3 QUANTIFIER ? (2) Dans lESP, les conventions exigent que de telles affirmations soient justifiées par des arguments (factuels et conceptuels) solides. Même dans le LAP, au moins deux dimensions quantitatives sont pertinentes : - Lintensité, ampleur ou autre caractéristique de la « force » des phénomènes évoqués - La fréquence doccurrence de ces phénomènes : surviennent-ils suffisamment souvent pour pouvoir caractériser une « population » ? Une connaissance minimum des statistiques paraît donc intéressante, ne serait-ce quau niveau conceptuel.

4 D.Gile statistiques4 QUE SONT LES STATISTIQUES ? AU SENS DISCIPLINAIRE (PAR OPPOSITION AU SENS « DONNEES »): UN ENSEMBLE DOUTILS ET DE METHODES MATHEMATIQUES POUR QUANTIFIER DES OBJETS ET PHENOMENES A DES FINS ANALYTIQUES

5 D.Gile statistiques5 STATISTIQUES DESCRIPTIVES ET STATISTIQUES INFERENTIELLES DESCRIPTIVES - POUR DECRIRE DE MANIERE SYNTHETIQUE DES TENDANCES SUSCEPTIBLES DEXISTER SOUS UNE ABONDANCE DE CHIFFRES - POUR CARACTERISER DES RELATIONS ENTRE DES VARIABLES INFERENTIELLES POUR FAIRE DES INFERENCES SUR DES POPULATIONS A PARTIR DECHANTILLONS

6 D.Gile statistiques6 LES UNITES ETUDIEES UNITES PERSONNES, OBJETS, PROCESSUS, CHOIX, ACTIONS… TOUT CE QUI PEUT ETRE ENUMERE « POPULATIONS » ENSEMBLE DES UNITES QUI NOUS INTERESSENT ECHANTILLONS SOUS-ENSEMBLE DE LA POPULATION QUI REPRESENTE CELLE-CI

7 D.Gile statistiques7 VARIABLES LES UNITES ONT DES CARACTERISTIQUES QUALITATIVE OU QUANTITATIVES QUI INTERESSENT LES STATISTICIENS ELLES DEVIENNENT DES VARIABLES POIDS, TAILLE, NOTES A UN EXAMEN, PRIX, DUREE DE VIE DUN PRODUIT, QUALITE DE LA VIE DUNE PERSONNE, AMELIORATION DE LETAT DE SANTE DUNE PERSONNE SOUVENT LA QUANTIFICATION DOIT ETRE CREEE (ECHELLES DE LICKERT)

8 D.Gile statistiques8 DISTRIBUTION LA DISTRIBUTION DUNE VARIABLE EST LA REPARTITION DES VALEURS QUELLE PREND AU SEIN DE LA POPULATION NOMBRE OCCURRENCES NOTES

9 D.Gile statistiques9 STATISTIQUES DESCRIPTIVES: TENDANCES CENTRALES Si les données sont nombreuses et variables On peut souhaiter chercher une éventuelle TENDANCE CENTRALE Qui caractérise leur orientation

10 D.Gile statistiques10 TENDANCES CENTRALES - MOYENNE MOYENNE Attention : - Peut être sensible aux valeurs aberrantes 10, 9, 10, 9, 9, 10, 19 10,8 (9,5) (n=7) Cet effet dépend de la taille de la population 10, 9, 10, 9, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 9, 10, 10, 9, 19 9,95 (9,5) (n=21) - NA PAS TOUJOURS UN « SENS » Deux évaluateurs: 9, ?

11 D.Gile statistiques11 TENDANCES CENTRALES - MEDIANE Divise la population en deux parties égales : la moitié est en dessous de la médiane, et la moitié au-dessus 10, 9, 10, 9, 9, 9, 10, 19 9, 9, 9, 9, 10, 10, 10, 19 9,5 Pas affectée par les valeurs aberrantes Mais peut être éloignée de la moyenne 8, 8, 8, 8, 9, 16, 16, 16 8,5 (11,21)

12 D.Gile statistiques12 TENDANCES CENTRALES - MODE Indique la valeur la plus fréquente (ou les valeurs les plus fréquentes) Peut être intéressant pour distributions qualitatives : Poulet, poulet, poulet, poisson, boeuf, boeuf, poulet Paris, Rome, Rome, Londres, Lisbonne, Paris, Paris

13 D.Gile statistiques13 DISPERSION (1) Si 9, 9, 9, 10, 11, 11, 10, 12, 10, 11, 12, 11, 11, 10 La valeur centrale MOYENNE caractérise bien la population Mais si 2, 1, 10, 12, 19, 18 10,3 ??? Une autre caractéristique importante de la distribution de cette population est sa DISPERSION

14 D.Gile statistiques14 DISPERSION (2) Il existe plusieurs mesures de dispersion La plus utilisée est lECART-TYPE Standard deviation Approximativement la moyenne de lécart entre les valeurs individuelles et la moyenne Lécart-type a des propriétés intéressantes pour les tests statistiques

15 D.Gile statistiques15 RESUMÉ SUR LA CARACTERISATION DES DISTRIBUTIONS DE VARIABLES Une distribution à valeurs quantitatives se caractérise utilement par Sa moyenne Son écart-type Si on en connaît le type Distribution normale, distribution de Poisson etc., Sa moyenne et son écart-type peuvent suffire pour la caractériser avec beaucoup de précision

16 D.Gile statistiques16 STATISTIQUES DESCRIPTIVES - CORRLATIONS CORRELATIONS : Mesure de LASSOCIATION CONSTATEE Entre deux variables A NE PAS CONFONDRE AVEC LA CAUSALITE CORRELATION POSITIVE CORRELATION NEGATIVE COEFFICIENTS DE CORRELATION -1 à +1

17 D.Gile statistiques17

18 D.Gile statistiques18 REGRESSION LINEAIRE RECHERCHE DUNE DROITE QUI CORRESPOND LE MIEUX AUX DONNEES MESUREES Y = AX + B PERMET DE FAIRE DES EXTRAPOLATIONS, DONC DES PREVISIONS REGRESSION LINEAIRE MULTIPLE RECHERCHE DUNE FONCTION LINEAIRE DE PLUSIEURS VARIABLES QUI CORRESPOND LE MIEUX AUX DONNEES MESUREES

19 D.Gile statistiques19 STATISTIQUES INFERENTIELLES Ont une très grande importance Dans les sciences et la technologie Elles permettent détudier des échantillons Puis den tirer des conclusions Sur la population toute entière (Expériences scientifiques, processus industriels, contrôles de qualité, élections, évolution biologique, phénomènes atmosphériques…)

20 D.Gile statistiques20 STATISTIQUES INFERENTIELLES METHODES MATHEMATIQUES FONDEES SUR LA THEORIE DES PROBABILITES CALCULENT DES PROBABILITES SUR LA BASE DES TYPES DE DISTRIBUTION DES TENDANCES CENTRALES DE LA VARIABILITE CONSTATEES SUR DES ECHANTILLONS

21 D.Gile statistiques21 TESTS STATISTIQUES (1) UTILISES SURTOUT POUR AIDER A DECIDER : - SI LA DISTRIBUTION DE DEUX POPULATIONS EST LA MEME C.A.D. SI UNE CONDITION OU UN TRAITEMENT ONT PROBABLEMENT UN EFFET OU NON - SI UNE CORRELATION CONSTATEE SUR UN ECHANTILLON EST SUSCEPTIBLE DETRE CONSTATEE SUR LA POPULATION TOUTE ENTIERE

22 D.Gile statistiques22 TESTS STATISTIQUES (2) LES TESTS SE PRESENTENT SOUS LA FORME DUN ELEMENT DE REPONSE A LA QUESTION SUIVANTE : LA DIFFERENCE CONSTATEE SUR LES ECHANTILLONS EST-ELLE DUE AU HASARD (H 0 ) OU A UNE DIFFERENCE « REELLE » ENTRE LES POPULATIONS CONCERNEES (H 1 ) ? LA REPONSE EST PROBABILISTE. LA PROBABILITE DUNE « FAUX POSITIF » (ON DECIDE QUE LA DIFFERENCE EST REELLE ALORS QUELLE EST DUE AU HASARD) EST INDIQUEE PAR p ou α

23 D.Gile statistiques23 TESTS STATISTIQUES (3) Le test statistique calcule une valeur en fonction (notamment) des moyennes et écarts-types dans les échantillons. Si la valeur en question se trouve dans une certaine fourchette, on dit que la différence est « significative » à un certain niveau de p, par exemple 0,05 (avec une probabilité de 5 % de se tromper en disant que la différence est significative). Si la valeur en question se trouve ailleurs, on dit que la différence nest pas significative, Ce qui veut dire quon ne peut pas dire sur la base de léchantillon que les populations sont différentes avec une probabilité de 5% de se tromper.

24 D.Gile statistiques24 TESTS STATISTIQUES (4) Une différence significative est relative. Elle peut être significative à 5% mais pas à 1% Ce qui change, cest le risque de faux positif que lon est disposé à accepter. Une différence non significative ne veut pas dire quil ny a pas de différence entre les populations que les échantillons représentent. Elle veut simplement dire que les données recueillies sur léchantillon ne permettent pas de trancher, ne serait-ce quavec une probabilité donnée de se tromper.

25 D.Gile statistiques25 TESTS STATISTIQUES (5) Parfois, la chose est due à une trop forte variabilité dans les échantillons, qui pourrait être réduite avec des échantillons de plus grande taille. On ne peut pas préjuger pour autant des résultats avec des échantillons plus grands. SELECTION DES TESTS STATISTIQUES Il existe de nombreux tests statistiques, parmi lesquels il faut sélectionner le mieux adapté à la situation en fonction de différents facteurs.

26 D.Gile statistiques26 EXEMPLE DUTILISATION DES TESTS STATISTIQUES Qualité trad: travailleurs formés (TF) et autodidactes (TA) Echantillon de TF échantillon de TA. Traduction dun texte, évaluation de qualité de leur travail. Comparaison qualité des deux échantillons avec le test statistique approprié. On trouve différence significative à p< 0,05 Quest-ce que cela veut dire ? Quest-ce que cela veut dire ? On trouve que cette différence nest pas significative à p<0,01, quest-ce que cela veut dire ? Et si on trouve que la différence nest significative ni à 0,05, ni à 0,01 ?

27 D.Gile statistiques27 TESTS STATISTIQUES SUPPL (1) TESTS PARAMETRIQUES : SI DISTRIBUTION NORMALE DE LA VARIABLE, ET PERMET DESTIMER LES PARAMETRES DE LA DISTRIBUTION TESTS NON PARAMETRIQUES : SI ON NE PEUT PAS POSER UNE DISTRIBUTION NORMALE (ANALYSE DE VARIANCE) ANOVA (ANALYSE DE VARIANCE) QUAND IL Y A PLUS DE DEUX CONDITIONS

28 D.Gile statistiques28 TESTS STATISTIQUES SUPPLEMENT (2) TEST t DE STUDENT TEST Z TEST CHI DEUX TEST EXACT DE FISHER TEST DE WILCOXON TEST DE MANN-WHITNEY TEST DE KRUSKALL-WALLIS ANALYSE DE VARIANCE A UN FACTEUR ANALYSE DE VARIANCE A DEUX FACTEURS ….

29 D.Gile statistiques29 ECHANTILLONNAGE CARACTERISTIQUE PRINCIPALE RECHERCHEE DANS UN ECHANTILLON : SA REPRESENTATIVITE PAR RAPPORT A LA POPULATION - ERREUR DECHANTILLONNAGE - BIAIS ECHANTILLONNAGE ALEATOIRE PERMET DELIMINER LES BIAIS AGRANDIR LA TAILLE DE LECHANTILLON PERMET DE REDUIRE LERREUR DECHANTILLONNAGE - ECHANTILLONNAGE STRATIFIE - ECHANTILLONNAGES NON ALEATOIRES

30 D.Gile statistiques30 CONCLUSIONS ET CONSEILS AUX ETUDIANTS (1) DANS VOTRE PROPRE TRAVAIL - LES STATISTIQUES SONT UN OUTIL DAIDE A LA DECISION. ELLES PEUVENT ETRE UTILES, MAIS LEUR MANIEMENT NEST NI INDISPENSABLE, NI SANS RISQUE - PREFERER UNE UTILISATION SIMPLE QUAND VOUS LE POUVEZ - SINON, SASSURER DU CONCOURS DUN STATISTICIEN. SURTOUT NE PAS SE LANCER DANS DES STATISTIQUES INFERENTIELLES SEUL SOUS PRETEXTE QUIL EXISTE DES LOGICIELS QUI VOUS EXPLIQUENT « TOUT »

31 D.Gile statistiques31 CONCLUSIONS ET CONSEILS AUX ETUDIANTS (2) - SI VOUS FAITES APPEL A UN STATISTICIEN, LE FAIRE DES LA CONCEPTION DE VOTRE ETUDE, PAS APRES COUP, POUR NE PAS VOUS RETROUVER AVEC DES DONNEES DIFFICILES A ANALYSER - NE PAS OUBLIER LIMPORTANCE DUN ECHANTILLON REPRESENTATIF SI VOS ECHANTILLONS NE LE SONT PAS, VOUS NE POUVEZ PAS GENERALISER VOS RESULTATS A LA POPULATION

32 D.Gile statistiques32 CONCLUSIONS ET CONSEILS AUX ETUDIANTS (3) DANS LA LECTURE CRITIQUE - VERIFIER LES CARACTERISTIQUES DE LECHANTILLON, LA PRESENCE DUN BIAIS EVENTUEL ET LA GENERALISABILITÉ - NE PAS ACCEPTER LA CONCLUSION DUN AUTEUR SUR LEXISTENCE DUNE DIFFERENCE SIL A VERIFIÉ STATISTIQUEMENT ET NA PAS TROUVÉ DE DIFFERENCE SIGNIFICATIVE - NE PAS ACCEPTER LIDEE QUE LES DIFFERENCES NE SONT PAS SIGNIFICATIVES « PARCE QUE LECHANTILLON EST TROP PETIT ».


Télécharger ppt "D.Gile statistiques 1 CONCEPTS FONDAMENTAUX EN STATISTIQUES POUR LES ETUDIANTS DANS LES SCIENCES HUMAINES : UNE SENSIBILISATION"

Présentations similaires


Annonces Google