La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données.

Présentations similaires


Présentation au sujet: "Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données."— Transcription de la présentation:

1 Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données 4. Exemple de tableau EXCEL 5. Éviter déventuels problèmes

2 Paul-Marie Bernard Université Laval Variables et données Les données correspondent aux valeurs des variables mesurées pour chacun des individus (ou patients). Les variables sont celles déjà prévues et décrites dans le protocole de recherche.

3 Paul-Marie Bernard Université Laval Variables et données (suite) Les variables sont –pertinentes (si possible, éviter dajouter des variables autres que celles prévues dans le protocole) –définies au plan opérationnelle instruments de mesures codes pour les valeurs –les codes sont déjà établis. Par exemple: »AGE: en années (37, 64, …) »SEXE: F pour féminin, M pour masculin »Symboles pour valeurs N/A et valeurs manquantes »Etc.

4 Paul-Marie Bernard Université Laval Variables et données SOURCES DES DONNÉES: –les individus et/ou –les dossiers (médicaux ou autres)

5 Paul-Marie Bernard Université Laval 5 2. Saisie des données Pour constituer la base des données, celles- ci peuvent être saisies –à laide de fiches ou formulaires en papier –à laide de logiciel

6 Paul-Marie Bernard Université Laval Quatre petites règles (suite) 1.Sassurer de la fiabilité de la saisie des données: –Pratiquer, si possible, une double saisie, en vérifiant les données qui sont non concordantes dune saisie à lautre. –Simplifier le processus de saisie des données de sorte que la première phase de la saisie soit le plus près possible de la base de données finale. –Éviter les transcriptions manuelles de transcriptions. Chaque transcription manuelle amène son lot derreurs. Par contre, les transcriptions électroniques, elles, sont sans erreur.

7 Paul-Marie Bernard Université Laval Saisie des données quatre petites règles 2.Recueillir linformation la plus fine possible Exemple: si lâge est mesuré en années, –préférer enregistrer 36, 42, 53, etc. plutôt que –entre 35 et 39 –entre 40 et 45 –entre 50 et 54 –etc.

8 Paul-Marie Bernard Université Laval Quatre petites règles (suite) 3.Sen tenir à linformation sur les variables de base Exemple: pour la variable IMC, les valeurs du poids et de la taille suffisent à sa mesure. Il nest pas nécessaire de recueillir directement les valeurs de lIMC ou den calculer sa valeur au moment de la cueillette de linformation.

9 Paul-Marie Bernard Université Laval Quatre petites règles (suite) 4.Pour les variables qui réfèrent à la durée dun phénomène, il est préférable denregistrer directement les dates (ou temps) de début et de fin de ce phénomène, si ces dates (ou temps) sont disponibles plutôt que de calculer la durée puis denregistrer cette durée.

10 Paul-Marie Bernard Université Laval EXCEL et saisie des données En vertu de la petite règle 4, il nous apparaît préférable dutiliser un logiciel pour la saisie des données. Plusieurs logiciels sont disponibles: –SAS, SPSS, ACCESS, LOTUS, DBASE, SPHYNX, EXCEL, etc. Notre préférence : EXCEL

11 Paul-Marie Bernard Université Laval Logiciel EXCEL Logiciel –simple dutilisation (contexte WINDOWS) –universellement connu –accessible –tableur efficient Nous limitons la présentation dEXCEL au contexte de la saisie de données

12 Paul-Marie Bernard Université Laval Logiciel EXCEL EXCEL se prête très bien à –la saisie des données –la transcription (exportation ou importation) des données en format SAS, DBASE, SPSS, etc. –la création de tableaux interactifs –des analyses statistiques –la création de graphiques

13 Paul-Marie Bernard Université Laval Tableau EXCEL

14 Paul-Marie Bernard Université Laval Tableau EXCEL (suite) Chaque ligne représentera un individu pour qui sont mesurées les variables. (La première ligne est réservée aux noms des variables) Chaque colonne représentera les valeurs de la variable unique, identifiée à la première ligne et mesurée pour chaque individu (La première colonne, de préférence à toute autre, est réservée à une nécessaire variable-identification des individus: numéro de dossier, numéro de randomisation, numéro séquentiel ou autre.)

15 Paul-Marie Bernard Université Laval Tableau EXCEL (suite) La cellule au croisement dune LIGNE et dune COLONNE donne la valeur –de la variable (correspondant à la colonne) –pour lindividu (correspondant à la ligne)

16 Paul-Marie Bernard Université Laval EXEMPLE Tableau EXCEL

17 Paul-Marie Bernard Université Laval Exemple (suite) Dans le tableau: –8 variables : IDN: identification de lindividu AGE: âge SEXE: sexe TD: tension diastolique TS: tension systolique FUME: le fait de fumer DATE: la date dobservation HEURE: lheure dobservation –10 patients: IDN=1, 2, 3, 4,…,10 On remarque deux cellules vides: une pour TD du patient IDN= 5 et lautre pour FUME du patient IDN=7

18 Paul-Marie Bernard Université Laval Éviter déventuels problèmes 1.Pour désigner les variables: –utiliser des noms évocateurs: (TD pour tension artérielle diastolique) –caractères alphanumériques et _ (TD1 ou TD_1 pour tension artérielle diastolique au temps 1) –éviter tous caractères spéciaux, accents, tels !, «, /, $, %, ?, &, *, (, ), +, =,, ^, ç, #, {, etc. (Ne pas écrire ÂGE mais plutôt AGE)

19 Paul-Marie Bernard Université Laval Éviter … (suite) 2.Pour coder les valeurs dune variable: –si la variable est quantitative, le code est la valeur numérique: AGE=37, TD=70, … –chaque valeur a un code unique: (pour la variable SEXE, F et f sont considérés comme deux codes distincts) –une valeur manquante est désignée par une cellule vide (voir diapositives 15 et 16) –on sassure du format de la cellule pour inscrire le type de donnée (voir dans le menu Format Cellule Standard, Nombre, Date, …)

20 Paul-Marie Bernard Université Laval Éviter … (suite)

21 Paul-Marie Bernard Université Laval Éviter … (suite) 2.Les formats de cellule les plus utilisés: –STANDARD pour les valeurs alphanumériques –NOMBRE pour les valeurs numériques (décimales et valeurs négatives comprises) –DATE pour les dates (format suggéré: ) (Lentrée 27 oct 2009 sera automatiquement convertie en ) –HEURE pour le temps (format suggéré: 15:20 pour 15 heures 20 minutes ou 15:20:35 pour 15 heures 20 minutes 35 secondes)

22 Paul-Marie Bernard Université Laval Éviter … (suite) 3.Pour corriger la donnée dune cellule, simplement retaper la donnée dans cette même cellule 4.Pour changer les codes dune variable, utiliser dans Edition la fonction Remplacer 5.Pour ordonner les observations suivant une variable, cliquer sur la cellule où apparaît le nom de cette variable, puis dans le menu Données, cliquer sur Trier. (Le tri pour cette variable est automatiquement étendu à toutes les variables). Dans la petite fenêtre qui souvre, on peut faire son choix sur le type de triage, croissant ou décroissant. On peut aussi choisir une deuxième, et même une troisième, variable pour un tri subordonné au premier. Puis, on clique sur OK. (Voir exemple de tri ci-après)

23 Paul-Marie Bernard Université Laval Éviter … (suite) 6.En présence de plusieurs variables, on peut utiliser plusieurs feuilles-excel pour un même fichier, ce qui facilite la visualisation des données. Dans ce cas, répéter sur chaque feuille la variable-identification des individus. Cette précaution facilitera une fusion éventuelle des feuilles en une même base de données

24 Paul-Marie Bernard Université Laval Éviter … (suite) 7.Ne pas oublier –denregistrer régulièrement le fichier des données recueillies –de faire quelques copies de sécurité de la base de données

25 Paul-Marie Bernard Université Laval 25 Exemple de tri Référer à la base de données décrite à la diapo #16. Tri projeté: –Trier les données suivant la variable TS en ordre décroissant, puis suivant la variable AGE en ordre croissant. –Étendre ce tri à lensemble des données. (En dautres termes il faut que le tri exercé sur ces deux variables tiennent compte de toutes les autres variables).

26 Paul-Marie Bernard Université Laval 26 Exemple … (suite) 1. Choix de la cellule de la variable TS

27 Paul-Marie Bernard Université Laval 27 Exemple … (suite) Choix du type de tri pour TS et de la variable AGE

28 Paul-Marie Bernard Université Laval 28 Exemple… (suite) Résultat

29 Paul-Marie Bernard Université Laval 29 Exemple … (suite) Observations On observe dans ce nouveau tableau –que les valeurs de TS sont disposée en ordre décroissant –que, pour les deux sujets (IDN=3 et 9) ayant 144 pour TS, la variable AGE est en ordre croissant, 37 puis 40 –que les valeurs de toutes les autres variables ont bougé en fonction de ces deux tris, (conservant ainsi intégralement les observations faites sur chacun des individus)

30 Paul-Marie Bernard Université Laval 30 Enfin, Vous découvrirez bien dautres trucs! Pour commentaires, suggestions et questions, me rejoindre à: Paul-Marie Bernard


Télécharger ppt "Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données."

Présentations similaires


Annonces Google