Des variables et des données
Dans le domaine de la statistique le mot variable signifie une idée différente de celle dans l’algèbre ou les fonctions : Dans la statistique une variable signifie une caractéristique d’un object (soit une personne, un événement, etc.), et qui peut être décrite ou mesurée d’une manière quelconque à travers un groupe de tels objets individuels comparables qui possèdent cette caractéristique. Les valeurs d’une variable particulière devraient variées parmi les objets qui la possède. Sinon, la variable n’est pas intérrésante pour la statistiques (parce que ses valeurs seraient tout à fait prévisible). Le concept de variable L'on appelle les objects/cas individuels sur lesquels une variable particulière est mesurée les unités d'observation.
Des exemples : 1. La couleur des cheveux des gens 2. La hauteur des garçons d’un certain âge 3. La consommation d’essence d’un modèle de véhicule 4. La réussite des étudiants dans un cours Autres exemples?
Exemples: 1.La couleur des cheveux des gens 2.La hauteur des garçons d’un certain âge 3. La consommation d’essence d’un modèle de véhicule 4. La réussite des étudiants dans un cours On dit que Variable 1 est une variable qualitative ou catégorique, puisqu’elle prend des «valeurs» qui sont décrites par leur inclusion dans un groupe ou dans certaines catégories : p. ex. noir, châtains, roux, blonds, etc. On dit que les Variables 2 à 4 ce sont des variables quantitatives, parce que chacune prend des valeurs numériques qui représentent des mesures mathématiques de sa caractéristique respective.
Une distinction subtile Il faut distinguer entre une variable et ses «valeurs»: les valeurs particulières qu’une variable prend sont des données—ce sont des valeurs qui expriment l’état (catégorique) ou le montant (quantitative) de la caractéristique, ce qui n’est pas la même chose que la caractéristique elle-même Exemple: Noir, châtains, roux, blonds ce sont des catégories qui décrivent des états particuliers de la caractéristique couleur des cheveux, mais ils ne décrivent pas la caractéristique elle-même Exemples: 1. La couleur des cheveux des gens 2. La hauteur des garçons d’un certain âge 3. La consommation d’essence d’un modèle de véhicule 4. La réussite des étudiants dans un cours
Exemple: Un ensemble de données affiché à l'université montre une liste d' appartements disponibles à louer. Les renseignements fournis comprennent le loyer mensuel, le nombre de chambres à coucher, si le câble est inclus gratuitement, si des animaux sont acceptés, et la distance au campus. En quoi consiste un cas individuel (autrement dit l’unité d’observation) dans cet ensemble de données? Identifiez les variables décrites dans cet ensemble de données. Indiquez si chaque variable est catégorique ou quantitative. Comment pourrions-nous organiser l'ensemble pour faciliter la comparaison de tous les cas sur les mêmes variables données?
Du meurtre comme un événement consistant de données : Quels sont des attributs d'un meurtre qui pourraient être importants à identifier et évaluer ou mesurer dans tous les cas de meurtre? Précisez quelques telles variables Indiquez si chacune est catégorique ou quantitative
Tableau de cas des meurtres commis à Chicago en 1990 Lorsque un tel tableau est présenté dans une situation particulière, les unités d'observation sont faciles à identifier: ils correspondent à des lignes, dont chacune représente un cas individuel. Les variables correspondent aux colonnes du tableau et les contenus des cellules ce sont les données.
Quand un tel tableau de données n’est pas fourni on doit interpréter attentivement la déscription du scénario donné afin de corréctement identifier les variables et les unités d’observation. Parfois, cela peut être un défi necéssitant une réflexion plus approfondie. Nous verrons quelques exemples dans les prochaines activités en classe.