Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 08:47 1 Concepts fondamentaux: statistiques et distributions.

Slides:



Advertisements
Présentations similaires
Introduction aux statistiques Intervalles de confiance
Advertisements

L’échantillonnage & Ses Fluctuations
Présentation des données
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Estimation ponctuelle Estimation par intervalle de confiance
Les tests d’hypothèses (II)
Chapitre 5. Description numérique d’une variable statistique.
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Echantillonnage Introduction
Inférence statistique
Inférence statistique
Comparaison de plusieurs moyennes observées
Variable aléatoire, estimation ponctuelle et par intervalle
Nombre de sujets nécessaires en recherche clinique
1. Les caractéristiques de dispersion. 11. Utilité.
Échantillonnage-Estimation
Les tests d’hypothèses
Statistique et probabilités au collège
Probabilités et statistique en TS
L’OUTIL STATISTIQUE.
Tests de comparaison de moyennes
Méthodes de Biostatistique
Les principaux résumés de la statistique
L’inférence statistique
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Échantillonnage (STT-2000)
Comprendre la variation
Groupe 1: Classes de même intervalle
Comprendre la variation dans les données: Notions de base
TECHNIQUES QUANTITATIVES APPLIQUEES A LA FINANCE
Les modèles linéaires (Generalized Linear Models, GLM)
Analyse de variance à un critère de classification (ANOVA)
Corrélation Principe fondamental d’une analyse de corrélation
Comparaison de deux échantillons
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
ANOVA à critères multiples
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Objectifs du chapitre 2 d’Howell sur les statistiques descriptives
TEST d’ADEQUATION A UNE LOI EQUIREPARTIE
Lectures Volume du cours : Chapitre 7
Les intervalles de confiance pour la moyenne d’une population
1 - Programme de Seconde (juin 2009) Statistique et probabilités
Chimiometrie (Chemometrics)
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Rappels de statistiques descriptives
Théorème de la limite centrale l’inférence statistique
STATISTIQUES DESCRIPTIVES
STATISTIQUES – PROBABILITÉS
Intervalles de confiance pour des proportions L’inférence statistique
Régression linéaire simple
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 1 Comparaisons multiples Ce qu’elles sont.
Concepts fondamentaux: statistiques et distributions
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :52 1 Comparaisons multiples Ce qu’elles sont.
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Tests d’ajustement à une distribution théorique
L’erreur standard et les principes fondamentaux du test de t
Analyse de variance à un critère de classification (ANOVA)
Révision des concepts fondamentaux
Quelques commentaires sur les tests statistiques
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Comparaison de deux échantillons Principes.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 13/08/2015 6:59 PM Bootstrap et permutations.
LOI NORMALE LOI STUDENT ECHANTILLONS ET TESTS DE MOYENNE
Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.
ECHANTILLONAGE ET ESTIMATION
Mesures de description des valeurs des variables
Formation Green Belt Lean Six Sigma
Introduction aux statistiques Intervalles de confiance
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Transcription de la présentation:

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions Terminologie Propriétés dune statistique Quelques statistiques utiles La distribution normale Lintervalle de confiance pour observations La distribution du t deStudent Lintervalle de confiance de la moyenne, la médiane, et la variance Design expérimental et puissance

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 2 Terminologie paramètre : définit une population statistique : estimés des paramètres dune population par exemple: la moyenne de la population ( ) versus la moyenne dun échantillon ( ) Population ( ) Échantillon

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 3 Propriétés dune statistique Exactitude: une statistique est exacte si la valeur moyenne du paramètre calculée pour tous les échantillons sapproche de la valeur réelle de la population XX Échantillon Population Statistique moins exacte Statistique plus exacte

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 4 Propriétés dune statistique Précision: une statistique précise variera peu parmi les échantillons pris dune même population Échantillon Population XX Statistique peu précise Statistique plus précise

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 5 Propriétés dune statistique Consistance: une statistique consistante approchera plus rapidement la valeur réelle de la population avec laugmentation de la taille de léchantillon. Échantillon Population X Moins consistante Plus consistante X Taille de léchantillon (N)

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 6 Comparaison de statistiques bien connues Fréquence Étendue de la variation

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 7 Statistiques: mesures de la tendance centrale moyenne: facile à calculer, la distribution est prévisible mais peut être influencée par des valeurs extrêmes médiane (M): est la valeur de la variable mesurée pour laquelle le nombre dobservations supérieures et inférieures est égal. Elle est moins influencée par les valeurs extrêmes que la moyenne. X Fréquence M

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 8 Paramètres de dispersion: létendue de la variation Létendue de la variation est définie par la valeur la plus grande et la valeur la plus petite de léchantillon Cest une statistique simple mais qui est biaisée parce quelle sous-estime la valeur de la population. Fréquence Létendue de la variation de la population Létendue de la variation de léchantillon

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 9 Dispersion Trois distributions de fréquences avec la même moyenne et taille déchantillon mais dont les patrons de dispersion sont différents.

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 10 Paramètres de dispersion: la variance, lécart- type et le coefficient de variation Variance: somme des carrés des écarts à la moyenne pondérée pour leffectif Lécart-type: racine carré de la variance Coefficient de variation: lécart-type divisé par la moyenne de léchantillon X 100)

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 11 f rel ^ Y A B C La distribution normale Des changements pour les valeurs de la moyenne et la variance entraînent des changements dans la forme et la position de la distribution normale. A. = 4, = 1 B. = 8, = 1 C. = 8, = 0.5

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 12 La distribution normale standard Obtenue en centrant et en réduisant la distribution. Les valeurs observées sont converties en valeurs normales standard (Z) La distribution obtenue a une moyenne = 0 et une variance 2 = 1 Probabilité Z Transformée (Z) Observée

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 13 La distribution normale standard 68% de léchantillon contenu par µ ± 96% contenu par µ ± 2 Probabilité Z ± 1 ± 2

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 14 Intervalles de confiance pour les observations Intervalle qui comprend une proportion donnée de la population généralement centré sur la moyenne ± Z IC à 95.5% est ± 2 mais et sont rarement connus....

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 15 Intervalles de confiance pour les observations: problèmes destimation Remplacer et par les paramètres de léchantillon peut entraîner de sérieux biais. Simulation:échantillonner une distribution normale standard et, pour chaque échantillon, calculer la moyenne, la variance. Ensuite, calculer IC à partir des valeurs de la moyenne et de la variance de léchantillon. Noter quelle proportion de la distribution se retrouve à lextérieur de lIC. Proportion (%) de la population hors de l IC à 95% Effectif= Moyenne=5%

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 16 Intervalles de confiance pour les observations: problèmes destimation Quand la taille de léchantillon est grande, les ICs estimés sont près des valeurs réelles. Toutefois, quand leffectif est petit, les ICs estimés sont beaucoup trop petits. Proportion (%) de la population hors de lIC à 95%

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 17 Intervalles de confiance pour les observations: problèmes destimation Les ICs estimés à partir des valeurs de Z se rapprochent des vrais ICs au fur et à mesure que leffectif augmente. Toutefois quand N est petit, les ICs sont biaisés.

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 18 La distribution du t de Student distribution des différences entre la moyenne de léchantillon et la moyenne de la population divisées par lécart-type de la moyenne converge vers la distribution normale standard quand le nombre de dl est élevé plus pointue et avec des queues plus longues quand le nombre de dl est faible Y t Y dl=2 dl=1000

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 19 Intervalle de confiance calculés avec t Quand leffectif est petit, les ICs sont calculés en remplaçant Z par la valeur de t de la distribution de Student. Cest une amélioration mais quand leffectif est très petit, les ICs sont trop encore trop petits.

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 20 Intervalles de confiance pour la moyenne Intervalle dans lequel on retrouve, avec une certaine probabilité, la vraie moyenne de la population. Plus petit que lIC pour les observations Probabilité ou Moyennes des échantillons Observations