 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
Présentation des données
Statistique descriptive
Chapitre 5. Description numérique d’une variable statistique.
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Inférence statistique
Comparaison de plusieurs moyennes observées
Licence 3ème année de sociologie Semestre 1
Statistique et probabilités au collège
Psychologie, Première année, Questionnaire.
INF L14 Initiation aux statistiques
Les traitements croisés
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Tests de comparaison de moyennes
Les liens entre les variables et les tests d’hypothèse
Les principaux résumés de la statistique
Statistique descriptive, analyse de données
Régression linéaire simple
Groupe 1: Classes de même intervalle
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Howell, Chap. 1 Position générale
Comprendre la variation dans les données: Notions de base
La corrélation et la régression
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Statistique Descriptive Analyse des données
Rappels de statistiques descriptives
COURS STATISTIQUE - DESCRIPTIVE DEFINITIONS
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Analyse statistique de base
STATISTIQUE DESCRIPTIVE ÉLÉMENTAIRE
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
STATISTIQUES – PROBABILITÉS
ANALYSE D’UN ÉCHANTILLON PORTANT SUR UNE VARIABLE STATISTIQUE
Seconde partie Cours de seconde
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Introduction à une analyse statistique de données
Statistiques descriptives-Distributions expérimentales à une dimension
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Problème Autre formulation :
Méthodologie de l’observation
PARAMETRES STATISTIQUES
Chapitre 4 Variables aléatoires discrètes
STATISTIQUES DESCRIPTIVES
Le Distribution Normale
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Statistique Descriptive Les Paramètres de Tendance Centrale
Seconde 8 Chapitre 4: Les statistiques
CHAPITRE 2 LES SITUATIONS FONCTIONNELLES
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
Mesures de description des valeurs des variables
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Les mesures de tendance centrale
Introduction aux statistiques Intervalles de confiance
Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
STATISTIQUE DESCRIPTIVE
Transcription de la présentation:

 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs

2 types de statistiques: descriptivesinférentielles Décrire – résumer Corréler – comparer - inférer

 Différents outils:  Questionnaires  Entretiens  Grilles d’observation  …/…  Différents types de représentations pour résumer l’information  Tableaux  Graphiques  indicateurs

Quelque soit la méthode de recherche utilisée l’apprenti chercheur s’appuie sur des statistiques descriptives et /ou inférentielles. Il recueille des données brutes grâce aux outils qu’il a choisi. Trois types d’étapes vont suivre :  mettre de l’ordre organiser les données  faire une description synthétique et précise  proposer des hypothèses liens entre les variables

TERMINOLOGIES

Population échantillon individu

 Étude qui porte sur 250 élèves de 3 ième d’un collège de la ville Élèves de 3ième 250 élèves d’un collège Élève x du collège

LES VARIABLES

Variables qualitatives (s’expriment en modalités) Variables quantitatives (s’expriment en valeurs numériques) nominalesordinales discrètescontinues La modalité est un nom (sexe, profession) Il existe une infinité de valeurs (valeurs comprises dans un intervalle) Valeurs dénombrables (nombre de filles dans la classe) La modalité contient un ordre (satisfaction)

 Valeurs qualitatives

 Valeurs quantitatives continues

 Variables quantitatives discrètes:

 Avant de choisir une représentation graphique, l’apprenti chercheur doit réfléchir à l’opportunité de choisir tel ou tel graphique par rapport à ce qu’il souhaite:  Mettre en évidence une progression courbes, polygnes de fréquence  Représenter la situation d’une variable secteur  Mettre un titre au graphique et le dater  Mettre des légendes en précisant les données mises en abscisse et ordonnée  Ne pas charger le graphique de couleurs cela le rend illisible

EFFECTIF ET FRÉQUENCE

 Effectif total: ensemble de la population;  Effectif cumulé: somme des effectifs dans l’ordre croissant ou décroissant;  Effectif théorique: effectif qu’il existerait si il n’y avait pas de lien entre les variables;  Fréquence: rapport de l’effectif d’une valeur sur une valeur totale; support cours statistiques.xlsx  Fréquence cumulée: somme des fréquence dans l’ordre croissant ou décroissant;

Tableau recensant les motifs d’entrées aux urgences: motifseffectifEffectif cumulé fréquence Malaise Douleur thoracique Accident de la route Angoisse Maux de tête Douleurs abdominales Effectif total126

Exemple avec deux variables: Alimentation en EHPAD au petit déjeuner: Variable : sexe avec 2 modalités : hommes/femmes Variable: alimentation au petit déjeuner avec deux modalités « oui » et « non » Fréquence femme « oui »: 20/29 = Fréquence hommes « oui » : 35/50 = 0.7 support cours statistiques.xlsx femmeshommestotal Oui Non91524 total295079

LES INDICES DE TENDANCE CENTRALE ( PARAMÈTRES DE LOCALISATION)

Permettent de caractériser le centre d’une distribution, l’ordre de grandeur des valeurs d’une variable et de quelle manière ces valeurs se regroupent  Le mode: valeur la plus fréquente d’une variable  Unimodale : une valeur émerge  Bimodale: deux valeurs  Multimodale: plusieurs valeurs  support cours statistiques.xlsx support cours statistiques.xlsx

 La médiane: valeur qui partage en deux groupes de même effectif les individus d’une population. Mesure sûre mais sensible au nombre d’observations.  Pour un nombre impair d’observations: classer les observations en ordre croissant que l’on divise en deux. La médiane est la valeur par laquelle le groupe se divise de part et d’autre MÉDIANE 6 7

 Pour un nombre pair d’observations, la médiane se calcule par la moyenne des deux valeurs centrales: Médiane = 5+6/2= 5,5 support cours statistiques.xlsx

La moyenne est la plus connue des indices de tendance centrale mais elle a un inconvénient : elle est sensible aux valeurs extrêmes.

 La médiane est la mesure la plus sûre;  La moyenne est intéressante mais est sensible aux valeurs extrêmes;  Le mode peut être intéressant pour les valeurs nominales.  Ils permettent de caractériser une valeur selon sa forme graphique  support cours statistiques.xlsx support cours statistiques.xlsx

Interprétation des résultats: si les indices de tendance centrale ont des valeurs à peu près identiques on pourra dire que la distribution est symétrique:

 Si mode< médiane< moyenne: la distribution s’étale à droite:  Si mode> médiane>moyenne: la distribution s’étale à gauche  support cours statistiques.xlsx support cours statistiques.xlsx

LES INDICES DE DISPERSION

Il arrive que les valeurs d’une variables s’écartent et se dispersent de la valeur centrale de cette variable. Les indices de dispersion mesurent et indiquent la manière selon laquelle ces différentes valeurs s’écartent de la valeur centrale. Les principaux indices de dispersion sont:  L’étendue;  L’écart moyen;  La variance;  L’écart type;  Le coefficient de variation.

Rappel: ∑Somme σ Écart type σ²σ²Variance xDonnée µMoyenne NNombre d’éléments X²Khi²

 Étendue ou intervalle de variation: différence entre la plus grande et la plus petite valeur de la variable; support cours statistiques.xlsx  Écart moyen : moyenne des valeurs absolues des écarts à la moyenne  support cours statistiques.xlsx support cours statistiques.xlsx  Variance: donne une indication sur l’étalement de la distribution;  Écart type : sert à mesurer l’étalement de la dispersion des valeurs autour de la moyenne;   Coefficient de variation: permet de mesurer la variabilité des distributions entre elles

L’INFÉRENCE STATISTIQUE

 Elles sont obligatoirement bi-variées  Permettent:  Mettre en tension une hypothèse de recherche  De comparer deux populations ou deux échantillons  De rechercher une corrélation  Appelées aussi déductives  Trois types d’indicateurs:  Le Chi²  Le test de Student  Test de corrélation

COMPARER CORRÉLER INFÉRER Student Test de corrélation Khi²

CORRÉLATION≠CAUSALITÉ La corrélation entre deux variables ne signifie pas que l’une est la cause de l’autre. La corrélation peut être due:  Au hasard  A l’effet d’une troisième variable cachée

 organiser les données sous forme de tableau  Manipulation à partir d’un tableur:

support cours statistiques.xlsx Lecture des résultats: Le fait que la corrélation soit positive ou négative n’a aucune importance. Pour conclure à une forte corrélation le résultat doit se situer entre 0,80 et 1. valeurcorrélation + 1 corrélation linéaire positive parfaite 0Absence de corrélation - 1 corrélation linéaire négative parfaite

corrélation linéaire positive et négative absence de corrélation

Le principe: C’est un test de probabilité qui mesure l’indépendance entre deux variables. Un minimum de 60 observations est nécessaire pour réaliser ce test. L’apprenti chercheur pose l’hypothèse qu’il existe un lien de dépendance entre deux variables: le Khi² mesure l’indépendance de ces deux variables entre elles et permet au chercheur de mesurer le risque qu’il prend en proposant son hypothèse. Le résultat est interprété au regard de la table de Khi² etudes-marketing-table-khi2.htmhttp:// etudes-marketing-table-khi2.htm

Hypothèse Test du Khi² Indépendance vérifiée Indépendance non vérifiée L’apprenti chercheur prend un risque dans son hypothèse L’apprenti chercheur prend peu de risque dans son hypothèse

 Test qui s’utilise essentiellement dans les méthodes expérimentales et différentielles.  Le chercheur va tester son hypothèse sur deux goupes;  Il faut que ce soit le même nombre d’individus qui constitue l’échantillon car les variances doivent être identiques;  Le résultat s’interprète selon la table de Student :

Données brutes: tri à plat Graphiques et tableau Analyse descriptive Variables quantitatives: Discrètes continues Indices de tendance centrale: Moyenne Mode médiane Indices de dispersion: Étendue, écart, écart type variance Variables qualitatives: Nominales ordinales Statistiques inférentielles Hypothèse : Khi² Comparaison : Student Corréler: test de corrélation