Les liens entre les variables et les tests d’hypothèse

Slides:



Advertisements
Présentations similaires
Corrélation Position du problème Définition covariance (X,Y) r =
Advertisements

Risques d’erreur statistique et test statistique
Test statistique : principe
Les tests d’hypothèses (I)
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Situation du problème :
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
ASSOCIATION entre caractères qualitatifs
ASSOCIATION entre caractères qualitatifs
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Les tests d’hypothèses
1 Statistiques Séance 5 – 9 Nov Résumé séance précédente Lécart-type σ ou s. Comment le calculer? Les propriétés numériques de la courbe normale.
Indépendance & Khi-deux ²
Corrélation linéaire et la droite de régression
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Tests de comparaison de moyennes
la statistique descriptive se compose de 3 domaines distincts :   
Zéros de polynômes (La loi du produit nul) Remarque :
Plans à groupes indépendants: organisation
ou comment savoir si les différences observées sont significatives
Régression linéaire simple
Le contrôle de la vision binoculaire pour un sujet ne présentant aucune gêne pouvant avoir une origine motrice. (cas n°1 à l ’examen) Paul JEAN.
Test 2.
Problème Autre formulation :
La corrélation et la régression multiple
La corrélation et la régression
La régression logistique
La corrélation et la régression
Corrélation Principe fondamental d’une analyse de corrélation
Analyse factorielle de variance: Principes d’expérimentation
Objectifs du chapitre 8: Puissance statistique
Zéros de polynômes ( La loi du produit nul ) Remarque :
STATISTIQUES COURS 4 La régression. Nous avons vu divers tests statistiques afin de vérifier le degré d ’interdépendance entre 2 variables Test.
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Cédric LAOUENAN 20/11/2008 Tests statistiques Cédric LAOUENAN 20/11/2008
Lien entre deux variables
LA REGRESSION LINEAIRE
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
M2 Sciences des Procédés - Sciences des Aliments
1 1 Licence Stat-info CM7 a 2004 V1Christophe Genolini Récapitulatif : Variables qualitatives Variables qualitatives : –on se demande si elles sont liées.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Problème Autre formulation :
Tests d’ajustement à une distribution théorique
L’erreur standard et les principes fondamentaux du test de t
Méthodes de Biostatistique Chapitre 9 Tests Nonparamétriques.
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Test 2.
ou comment savoir si les différences observées sont significatives
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
Distribution à deux variables
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Famille A La famille A a cinq enfants – Patricia – Mary – Susan – Helen – Kathleen – Quelle est la probabilité que le prochain enfant soit un garçon ?
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Introduction aux statistiques Intervalles de confiance
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
Chap. III Statistiques inférentielles
Transcription de la présentation:

Les liens entre les variables et les tests d’hypothèse But: Est-ce qu’il y a un lien entre 2 variables? Ex: Consommation de viande et la taille d’un individu…vertical ou horizontal !!!

Lien entre le nb de personnes qui méditent en même temps et la paix dans une région!

Types de liens entre variables S’il n’y a aucun lien entre les variables on dit qu’elles sont… Indépendantes Ex: Est-ce qu’il y a un lien entre la couleur des yeux d’une personne et ses notes scolaires? S’il y a un lien entre 2 variables, elles sont… Corrélées Ex: est-ce qu’il y a un lien entre le sexe et la calvitie?

Corrélations Corrélation positive (faire graphique) Ex: Plus tu as un niveau de scolarité élevé, plus ton salaire risque d’être élevé Corrélation négative Ex: Prix d’un billet pour un film p/r au nombre de spectateurs Interdépendance: Dépendance mutuelle, réciproque. Ex: Il y a plus de clients dans un resto de sushi si le poisson est frais et le poisson est plus frais s’il y a beaucoup de clients.

Variables Causalité: Rapport d'une cause à son effet Ex: Garçon et la porcherie de son oncle. Variable indépendante Variable dépendante Concomitance: Existence ou évolution simultanée de deux choses ; simultanéité : La concomitance de deux phénomènes. 2 phénomènes se produisent en même temps sous l’influence d’un 3e facteur Ex: faible natalité et nb élevé de voitures/habitant Difficile de déterminer la variable dépendante Peut avoir plusieurs facteurs et certains pourraient être « non-contrôlables ». Ex: taille familles dans les pays pauvres

Principes du test d’indépendance du khi carré Ce test permet de déterminer s’il y a un lien entre 2 variables qualitatives Notre hypothèse de base est que les 2 variables sont indépendantes. Il va falloir alors confirmer ou infirmer cette hypothèse! Tableau de contingence (ou à double entrée) Voir tableau Excel On veut déterminer s’il existe un lien entre le type de fumeur et le type d’haleine

Le carré de contingence Maintenant qu’on sait comment calculer les fréquences théoriques, il faut être capable de dire si les écarts entre f(o) et f(t) sont significatifs ou non. On commence par calculer le carré de contingence (mesure de l’écart relatif). Si le carré de contingence est très petit, ça veut dire qu’il y a peu de différences entre les f(o) et f(t) et alors, on accepte l’hypothèse de base que les 2 variables sont indépendantes. Formule Voir feuille Excel.

Seuil de signification Probabilité (ou risque) qu’on rejette l’hypothèse nulle même si les variables sont indépendantes. Donc c’est le risque de se tromper. Donc, c’est le risque que le carré de contingence soit supérieur à la valeur critique lorsque les variables sont indépendantes. Les seuils les plus courants sont 1% ou 5%. Dans la vraie vie, si on veut avoir un risque de 5%, la taille de notre échantillon devra être de 1056 personnes. Si on veut avoir un risque de 1%, il va falloir avoir un échantillon de combien? plus de 9000 personnes!!!

Valeur critique du khi carré Si le carré de contingence est supérieur à la valeur critique on rejette l’hypothèse d’indépendance des variables Pour trouver la valeur critique, ça nous prend le « alpha » et le « v » (nb de degrés de liberté) V= nb catégories 1ère variable -1 x nb catégories 2e variable -1 Ex: si on choisit un alpha de 5% et on sait que v=4 (3-1)x(3-1), alors la valeur critique est de: 9.49 Alors puisque notre carré de contingence 47.75>9.49, on rejette l’hypothèse nulle. Ceci veut dire que les variables ne sont pas indépendantes. Il y a un risque d’accepter l’hypothèse nulle quand les variables sont dépendantes. Ce risque s’appelle Beta et c’est un risque de 2e espèce.

Quelle est la force du lien? Coefficient de contingence Coefficient de Cramér (préférable d’utiliser celui-ci) Valeur entre 0 et 1 Si c’est près de 1 c’est fort et si c’est près de 0, le lien est faible V=racine du (carré de contingence/n*(h-1)) h=nb de catégories(modalités) de la variable qui en a le moins.