Stat-infoCM6a : 1 Rappels.

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Inférence statistique
C1 Bio-statistiques F. KOHLER
Inférence statistique
Les TESTS STATISTIQUES
Régression ou corrélation
Comparaison de plusieurs moyennes Analyse de variance
- Régression linéaire -
Les TESTS STATISTIQUES
Échantillonnage-Estimation
Comparaison de plusieurs moyennes Analyse de variance
Régression -corrélation
Probabilités et statistique en TS
Programmes du cycle terminal
1 Statistiques Séance 5 – 9 Nov Résumé séance précédente Lécart-type σ ou s. Comment le calculer? Les propriétés numériques de la courbe normale.
Vers un indicateur de la qualité des cours d’ eau…
Les traitements croisés
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
LES ÉLASTICITÉS DE LA DEMANDE ET DE L’OFFRE
Les liens entre les variables et les tests d’hypothèse
Fonction puissance Montage préparé par : André Ross
Régression linéaire simple
Howell, Chap. 1 Position générale
Corrélation et régression linéaire simple
Toutes les variables étaient mesurées au niveau intervalle et sans erreur Toutes les variables étaient mesurées au niveau intervalle et sans erreur ->
La corrélation et la régression
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
La corrélation et la régression
La régression multiple
Régression linéaire (STT-2400)
Régression linéaire multiple : hypothèses & interprétation
Méthodes de Biostatistique
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Lien entre deux variables
La régression simple Michel Tenenhaus
Valeur ou Volume. Prix courants ou Prix constants
Probabilités et Statistiques Année 2010/2011
1 1 Licence Stat-info CM7 a 2004 V1Christophe Genolini Récapitulatif : Variables qualitatives Variables qualitatives : –on se demande si elles sont liées.
Probabilités et Statistiques
Probabilités et Statistiques Année 2009/2010
Introduction.
Rappels Variables nominales :
Statistiques analytiques sous STATA
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Problème Autre formulation :
Méthodes de Biostatistique Chapitre 9 Tests Nonparamétriques.
ETUDE DE 2 VARIABLES QUANTITATIVES
1 Licence Stat-info CM5a 2004 V1Christophe Genolini Problème Détection d’un phénomène particulier : –Flûtiste exceptionnelle ou moyenne –Groupe de TD super.
Test 2.
1 1 Licence Stat-info CM6 a 2004 V1Christophe Genolini Rappels 1.Variables nominales : –Oui / Non –Bleu / Brun / Roux / Noir Pour déterminer s’il y a un.
STT-3220 Méthodes de prévision Section 1 Évaluation des prévisions: Coefficient de Theil Version: 9 septembre 2004.
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
FICHE METHODOLOGIQUE n°3
M. YAMANAKA – Cours de mathématiques. Classe de 4ème.
Distribution à deux variables
1 Licence Stat-info CM4a 2004 V2Christophe Genolini Égalité des variances Une des conditions pour utiliser T est l’égalité des variances s APA  s MS On.
LOI NORMALE LOI STUDENT ECHANTILLONS ET TESTS DE MOYENNE
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
Individus Illustratifs (Supplémentaires) Individus jugés « intrinsèquement différents » Individus jugés « atypiques » Exemple Exemple :classe différente,
Transcription de la présentation:

Stat-infoCM6a : 1 Rappels

Stat-infoCM6a : 2 Rappels 1.Variables nominales : –Oui / Non –Bleu / Brun / Roux / Noir Pour déterminer s’il y a un lien, on utilise le  2 2.Variables quantitatives : –Notes sur 20 –Performances sportives Pour comparer des moyennes, on utilise les intervalles de confiances (loi normale ou T de student, selon les cas)

Stat-infoCM6a : 3 Covariance

Stat-infoCM6a : 4 Problème Y a-t-il un lien entre : Note de français et note de math ? Temps de préparation et performance ? Poids et taille ? Taille et note de math ?

Stat-infoCM6a : 5 Exemple 1 Note de français et note de math : y a-t-il un lien ?

Stat-infoCM6a : 6 Exemple 1 Note de français et note de math : y a-t-il un lien ?

Stat-infoCM6a : 7 Exemple 1 Note de français et note de math : y a-t-il un lien ?

Stat-infoCM6a : 8 Exemple 1 Note de français et note de math : y a-t-il un lien ?

Stat-infoCM6a : 9 Exemple 1 Note de français et note de math : y a-t-il un lien ?

Stat-infoCM6a : 10 Exemple 2 Taille et note de math : y a-t-il un lien ? TailleMath

Stat-infoCM6a : 11 Exemple 3 Note de techno et note de français : y a-t-il un lien ? TechnoFrançais

Stat-infoCM6a : 12 Lien ou pas ? Oui, lien positif bonne note de math = bonne note de français Oui, lien négatif bonne note de math = mauvaise note de techno Non : Taille et note sont indépendants

Stat-infoCM6a : 13 Intuitivement Lien positif Lien négatif Positif Négatif

Stat-infoCM6a : 14 Intuitivement Pour chaque point, on va calculer un indice qui –sera positif si le point est dans un quartier positif –sera négatif si le point est dans un quartier positif Ensuite, on fera la moyenne des indices Indice positif Indice négatif

Stat-infoCM6a : 15 Intuitivement Beaucoup d’indices positifs La moyenne sera positive Beaucoup d’indices négatif La moyenne sera négative

Stat-infoCM6a : 16 En pratique Moyenne des X Moyenne des Y

Stat-infoCM6a : 17 En pratique Donc est négatif Donc est positif Donc est négatif Donc est positif

Stat-infoCM6a : 18 Exemple MathFrançais

Stat-infoCM6a : 19 Exemple MathFrançais ; +2 +5; +5 +2; +3 +3; -2 -2; -3 -6; -5

Stat-infoCM6a : 20 Exemple MathFrançais x 2 = - 4 → ↑ 3 x - 2 = - 6 ← 2 x 3 = x - 3 = 6 → ↑ - 6 x - 5 = 30 5 x 5 = 25 ↓

Stat-infoCM6a : 21 Définition La covariance est la moyenne des indices : Cov(X,Y)= Note : la covariance étant un estimateur biaisé, on divise par n-1 et non par n

Stat-infoCM6a : 22 Exemple MathFrançais x 2 = - 4 → ↑ 3 x - 2 = - 6 ← 2 x 3 = x - 3 = 6 → ↑ - 6 x - 5 = 30 5 x 5 = 25 ↓ =57 Cov(X,Y) = 11,4

Stat-infoCM6a : 23 En pratique La covariance précise le lien : –Si Cov(X,Y) est grand (en valeur absolu), il y a un lien –Si Cov(X,Y) est négative, le lien est négatif –Si Cov(X,Y) est positif, le lien est positif

Stat-infoCM6a : 24 Exemple Cov = 18 Cov = -14

Stat-infoCM6a : 25 Coefficient de corrélation

Stat-infoCM6a : 26 Problème La covariance dépend de la taille des données : MathFrançais MathFrançais Contrôle noté sur 20 Même contrôle, noté sur 100 Cov = 11,5Cov=285 … Elle dépend aussi de l’unité : poids vs taille ↔ Kg vs cm

Stat-infoCM6a : 27 Solution Coefficient de corrélation : –C’est une covariance « normé » –Varie entre -1 et 1 –Pas d’unité (ni Kg, ni note sur 20,…)

Stat-infoCM6a : 28 Propriétés r varie entre -1 et 1 Si |r|=1, le lien entre les variables est parfait Si r>0, le lien est positif Si r<0, le lien est négatif Si r=0, on ne peut rien dire. Exemple :

Stat-infoCM6a : 29 Exemple MathFrançais MathFrançais Note sur 20 Note sur 100 Cov = 11,4Cov=285  X =4,05  Y =3,90  X =20,25  Y =19,49 r XY =0,72

Stat-infoCM6a : 30 r est-il significatif ? Pour le savoir, on pose Puis on fait un test de Student classique avec N-2 DDL : –Si T Obs > T Th, le r est significativement différent de zéro  Il y a un lien entre les variables –Si T Obs < T Th, le r n’est pas significativement différent de zéro  On ne peut rien conclure