Informatique décisionnelle

Slides:



Advertisements
Présentations similaires
Module Systèmes d’exploitation
Advertisements

Premier programme en C :
Chapitre I : Systèmes d’exploitation
Vocabulaire pour la passage du modèle conceptuel des données au modèle relationnel des données. MCDMRD EntitéTable PropriétésChamps, attribut IdentifiantClé
C.
Outils de développements
Objectifs Présentation et utilisation du langage PERL
Autorisations Utilisation eCATT
Introduction : Compilation et Traduction
ESIEE Paris © Denis BUREAU I N Initiation à la programmation avec le langage Java.
FLSI602 Génie Informatique et Réseaux
La fonction Style Permet de créer des types de texte, par exemple
Prise en main rapide... Ou comment commencer avec RevisAudit ?
Procédure dinstallation Windows Xp pro. Dans cette procédure nous verrons comment installer Windows xp pro sur un disque dur Vierge. Dans un premier temps,
Gestion de la communication par établissement sur le site ville
1 GPA435 Systèmes dexploitation et programmation de système Copyright, 2000 © Tony Wong, Ph.D., ing. Chapitre 5 Interpréteur de commande, Bourne shell,
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
Page 1 Introduction à ATEasy 3.0 Page 2 Quest ce quATEasy 3.0? n Ensemble de développement très simple demploi n Conçu pour développer des bancs de test.
CPI/BTS 2 Programmation Web Introduction au PHP
Aide-mémoire – FORMULAIRE Web DA/DT
Introduction : Compilation et Traduction
Partie 1 Etude de l'existant
1 Comment utiliser votre Extranet Se connecter 2.My Site 3.Documentation 3.1 Documents dintégration 3.2 Documents types 4.Vos informations privées.
1 GPA435 Systèmes dexploitation et programmation de système Copyright, 2000 © Tony Wong, Ph.D. Chapitre 9 Filtre programmable nawk(1)
CLUB DES UTILISATEURS SAS DE QUÉBEC
Mode plan – Table des matières
Les instructions PHP pour l'accès à une base de données MySql
LOGICIEL PL7 MICRO PROGRAMMATION MISE AU POINT Consignes?
Module 4 : Création et gestion de comptes d'utilisateur
Création et gestion de comptes d'utilisateur
Structures de données IFT-2000
1 GPA435 Systèmes dexploitation et programmation de système Copyright, 2000 © Tony Wong, Ph.D., ing. Chapitre 4 Syntaxe des commandes, documentation standard,
1 GPA435 Systèmes dexploitation et programmation de système Copyright, 2000 © Tony Wong, Ph.D. Chapitre 9 Programmation nawk(1)
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI
1. Représentation des informations
Types de données fondamentaux

1 GPA435 Systèmes d’exploitation et programmation de système Copyright, 2000 © Tony Wong, Ph.D. Chapitre 8 Filtres UNIX.
Veolia Consommateurs Contenu
Vue d'ensemble Surveillance des journaux d'événements
PHP & My SQL.
Le langage XHTML 420-S4W-GG Programmation Web Client
© 2008 General Parts International, Inc. Written permission is required to copy or forward to anyone other than the intended recipient. 1 © 2008 General.
MonACCÈS-Enseignant Guide n° 2 Le carnet de notes.
Création et présentation d’un tableau avec Word 2007
Dans la barre des messages, cliquez sur Activer la modification,
- Allez sur Google et tapez ``SKYPE`` dans la zone de recherche
Le site-en-kit pour les locales 2. Créer des pages.
Module 8 : Surveillance des performances de SQL Server
PROGRAMMATION INFORMATIQUE D’INGÉNIERIE II PRO-1024.
Guide n° 1 Formation initiale Primaire
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
Objectifs A la fin de ce chapitre, vous pourrez : présenter l'utilisation d'opérations de chargement de données par chemin direct décrire l'utilisation.
PROGRAMMATION INFORMATIQUE D’INGÉNIERIE II
 Syntaxe du langage PHP
Tutorat en bio-informatique Le 14 novembre Au programme… Les objets –Propriétés (attributs) –Constructeurs –Méthodes.
Fonctions avancées et graphiques
Introduction au langage C Les entrées-sorties
Informatique décisionnelle
Patricia Renault UPMC 2005/2006
QCM VBA.
Chapitre 4 La représentation des nombres.
LOGICIEL PL7 MICRO PROGRAMMATION MISE AU POINT Consignes?
Initialisation au logiciel (Statistical Analysis System)
Utilisation des formules de base
Abes agence bibliographique de l’enseignement supérieur Les scripts.
1 Tableur Excel. 2 Introduction Un tableur est un logiciel permettant de manipuler des données numériques et d'effectuer automatiquement des calculs sur.
Présentation Excel Microsoft Excel est le tableur de la suite bureautique propriétaire « Office System ». Développé pour les plateformes Windows et Macintosh.
Transcription de la présentation:

Informatique décisionnelle SAS mohamed.hamou@gmail.com

Un fonctionnement en modules SAS est un logiciel fonctionnant en modules : les modules sont en quelques sortes des sous parties du logiciel SAS. Par exemple pour réaliser des opérations de type ETL il est indispensable de posséder le module lié aux ETL (non inclus dans la version basique). En fonction de ses besoins, l'utilisateur choisira les modules les plus adaptés : l'offre de SAS peut en quelque sorte être considérée comme « une offre à la carte ». Historisées : Pas de suppressions, Nécessité d’un référentiel de temps. L’historisation permet l’extrapolation, la mesure de l’impact d’une décision par comparaison de la situation avant et après la mise en application de cette décision. Exemple : Suivi des évolutions des comportements des clients

Un fonctionnement en modules Historisées : Pas de suppressions, Nécessité d’un référentiel de temps. L’historisation permet l’extrapolation, la mesure de l’impact d’une décision par comparaison de la situation avant et après la mise en application de cette décision. Exemple : Suivi des évolutions des comportements des clients

Un fonctionnement en modules Historisées : Pas de suppressions, Nécessité d’un référentiel de temps. L’historisation permet l’extrapolation, la mesure de l’impact d’une décision par comparaison de la situation avant et après la mise en application de cette décision. Exemple : Suivi des évolutions des comportements des clients

Le fonctionnement de SAS Le logiciel SAS fonctionne par l'intermédiaire du langage SAS. La programmation SAS peut être découpée en trois parties : Les étapes DATA : elles permettent au mettre titre que SQL une manipulation des données. Les procédures PROC : elles permettent les analyses statistiques de bases de données. Le langage macro : il sert à automatiser les programmes et réaliser des manipulations plus sophistiquées sur les données. Historisées : Pas de suppressions, Nécessité d’un référentiel de temps. L’historisation permet l’extrapolation, la mesure de l’impact d’une décision par comparaison de la situation avant et après la mise en application de cette décision. Exemple : Suivi des évolutions des comportements des clients

Environnement de fenêtrage SAS Le mode fenêtrage interactif vous permet d’établir une interface avec SAS Historisées : Pas de suppressions, Nécessité d’un référentiel de temps. L’historisation permet l’extrapolation, la mesure de l’impact d’une décision par comparaison de la situation avant et après la mise en application de cette décision. Exemple : Suivi des évolutions des comportements des clients

Exécution des programmes SAS Objectifs : Invoquer le système SAS et inclure un programme dans votre session SAS Soumettre un programme et examiner les résultats Naviguer dans l’environnement de fenêtrage SAS Historisées : Pas de suppressions, Nécessité d’un référentiel de temps. L’historisation permet l’extrapolation, la mesure de l’impact d’une décision par comparaison de la situation avant et après la mise en application de cette décision. Exemple : Suivi des évolutions des comportements des clients

Exécution des programmes SAS Soumission d’un programme SAS Lorsque vous exécutez un programme SAS, la sortie générée par SAS comprend deux parties principales : JOURNAL SAS contient des informations sur le traitement du programme SAS, y compris des messages d’erreur et d’avertissement SORTIE SAS contient les rapports générés par les procédures SAS et les étapes DATA Historisées : Pas de suppressions, Nécessité d’un référentiel de temps. L’historisation permet l’extrapolation, la mesure de l’impact d’une décision par comparaison de la situation avant et après la mise en application de cette décision. Exemple : Suivi des évolutions des comportements des clients

TABLES SAS Les données doivent être présentées sous forme de tables SAS pour être traitées par plusieurs procédures SAS et certaines instructions d’étape DATA. Un programme SAS est un fichier contenant des lignes de code SAS Une table SAS est un fichier ayant une structure particulière et contenant des valeurs de données Une table SAS comporte une zone descriptive et une zone de données

Examen de la zone descriptive La zone descriptive d’une table SAS contient : Des informations sur la table SAS (nom, nombre d’observations, etc.) Les attributs des variables (nom, type, longueur, position, informat, format, étiquette) La procédure CONTENTS affiche la zone descriptive d’une table SAS.

Examen de la zone descriptive Format général de la procédure CONTENTS : PROC CONTENTS DATA=table-SAS; Run; Exemple : Proc contents data=work.staff;

Vue partielle de la sortie PROC CONTENTS LA zone descriptive contient les méta données de la table

Tables SAS : zone de données La zone de données d’une table SAS contient des valeurs de données de type caractère ou numérique. Les variables (colonnes) dans la table correspondent aux champs de données, et chaque colonne de données porte un nom. Les observations (rangées) dans la table correspondent aux enregistrements ou lignes de données.

Variables SAS Il existe deux types de variables : Type caractère : Contient n’importe quelle valeur : lettres, chiffres, caractères spéciaux et blancs. Les valeurs de type caractère peuvent être d’une longueur 1 à 32 767 octets. Un octet est égal à un caractère. Type numérique : emmagasinée en nombres à virgule flottante de 8 octets de mémoire par défaut. Huit octets de mémoire à virgule flottante fournissent de l’espace pour 16 ou 17 chiffres significatifs. Vous n’êtes pas restreint à 8 chiffres.

Désignation des tables SAS et des variables Noms SAS peuvent être d’une longueur de 32 caractères peuvent être en majuscules ou minuscules, ou les deux doivent commencer par une lettre ou un trait de soulignement. Les caractères qui suivent peuvent êtres des lettres, des traits de soulignement ou des chiffres.

Noms SAS valides Sélectionnez les noms SAS valides par défaut. Data5mon 5monthsdata Data#5 Five months data Fivemonthsdata

Valeurs de date SAS SAS emmagasine les valeurs des dates comme des valeurs numériques. Une valeur de date SAS est interprétée comme le nombre de jours entre le 1er janvier 1960 et la date visée.

Valeurs de données manquantes Une valeur doit exister pour chaque variable et observation. Les valeurs manquantes sont des valeurs valides. Une valeur de type caractère manquante s’affiche sous la forme d’un blanc. Une valeur de type numérique manquante s’affiche sous la forme d’un point

Examen de la zone de données La procédure PRINT affiche la zone de données d’une table SAS. Par défaut, PROC PRINT affiche Toutes les observations Toutes les variables Une colonne Obs à gauche

Examen de la zone de données Format général de la procédure PRINT PROC PRINT DATA=table-SAS; Run; Exemple : Proc print data=sashelp.prdsale;

Règles de syntaxe SAS Instructions SAS commencent habituellement par un mot clé (Data, proc,…) se terminent toujours par un point-virgule proc print data = work.test; Run; proc means data=work.test; class emploi; var salaire;

Règles de syntaxe SAS Les instructions SAS sont à structure libre. Un ou plusieurs blancs ou des caractères spéciaux peuvent être utilisés pour séparer les mots. Elles peuvent commencer et se terminer dans n’importe quelle colonne. Une même instruction peut s’étendre sur plusieurs lignes Plusieurs instructions peuvent être entrées sur la même ligne. Proc means data=work.test; class emploi; var salaire; run; Un bon espacement facilite la lecture du programme.

Commentaires SAS EXERCICES Tapez /* au début de votre commentaire Entrez le texte de votre commentaire Tapez */ à la fin de votre commentaire /* Affichage de la table test */ Proc print data = work.test; Run; EXERCICES

Exercices EXERCICES Compléter les phrases D’ordinaire, les instructions SAS débutent avec un …………… Toutes les instructions SAS se terminent par un …………. Les variables de type caractère peuvent comporter jusqu’à ….. caractères de long et utilisent …. Octet(s) de stockage par caractère. Un nom de variable SAS contient jusqu’à … caractères et commence par un …ou un …………. Par défaut, les variables numériques sont stockées dans … octets. La valeur de date SAS stockée de façon interne pour le 1er Janvier 1960 est ….. Une valeur manquante de type caractère est affichée sous la forme d’un …… h. Une valeur numérique manquante est affichée sous la forme d’un ….. EXERCICES

Erreurs de syntaxe Les erreurs de syntaxe comprennent : des mots clés mal orthographiés des signes de ponctuation manquants ou non valides Proc print data=work.erreur Run; proc print data=work.erreur 8 run; --- 22 - 200 ERREUR 22-322: Erreur de syntaxe ; syntaxe requise : ;, (, DATA, DOUBLE, HEADING, LABEL, N, NOOBS, OBS, ROUND, ROWS, SPLIT, STYLE, UNIFORM, WIDTH. ERREUR 200-322: Le symbole n'est pas reconnu et sera ignoré.

Erreurs de syntaxe EXERCICES Lorsque SAS découvre une erreur de syntaxe, SAS relève l’erreur et consigne l’information suivante dans le journal SAS : Le mot ERROR ou WARNING L’emplacement de l’erreur Une explication de l’erreur EXERCICES

Bibliothèque de données SAS Objectifs Expliquer le concept de bibliothèque de données SAS Expliquer la différence entre une bibliothèque permanente et une bibliothèque temporaire Utiliser la procédure CONTENTS pour examiner le contenu d’une bibliothèque de données SAS.

Bibliothèque de données SAS Une bibliothèque de données SAS peut se comparer au tiroir d’un classeur et une table SAS, à l’une des chemises se trouvant dans un tiroir du classeur. Peu importe le système d’exploitation hôte que vous utilisez, vous devez identifier les bibliothèques de données en assignant à chacune une référence bibliographique (libref). Lorsque vous invoquez SAS, vous avez accès automatiquement à des bibliothèques de données SAS, soit une temporaire (work) et une permanente (sasuser, sashelp).

Assignation d’une libref Vous pouvez utiliser l’instruction LIBNAME pour assigner à une libref à une bibliothèque de données SAS. Format général de l’instruction LIBNAME : LIBNAME libref ‘bibliothèque-de-données-SAS’ <options> ; Règles d’affectation de nom à une libref : Doit compter 8 caractères ou moins; Doit commencer par une lettre ou un trait de soulignement; Les caractères qui suivent peuvent être des lettres, des chiffres ou des traits de soulignement.

Assignation d’une libref Exemples : Windows Libname libsas ‘c:\cours\dev’; Unix Libname libsas ‘/cours/dev’;

PROC CONTENTS DATA=libref._ALL_ NODS; Examen d’une bibliothèque de données SAS Vous pouvez utiliser les mots clés _ALL_ pour afficher le contenu de toute une bibliothèque et l’option NODS pour supprimer les zones descriptives des tables. Format général de l’option NODS : PROC CONTENTS DATA=libref._ALL_ NODS; RUN; L’option NODS doit être utilisée avec le mot clé _ALL_ ;

Examen d’une bibliothèque de données SAS Pour explorer une zone descriptive d’une table SAS, précisez le nom de la table dans l’option DATA=. PROC CONTENTS DATA=libref.tablesas; RUN;

Exercices Création d’un libname ‘cours’ qui pointe sur votre disque. Copier la table Class qui se trouve dans la SASHELP dans le libname ‘cours’. 3. Explorer la zone descriptive de cette table.

Lecture de fichiers de données brutes : Méthode d’entrée par colonnes Objectifs : Créer une table SAS temporaire à partir d’un fichier de données brutes. Créer une table SAS permanente à partir d’un fichier de données brutes. Expliquer comment l’étape DATA traite les données. Lire des données standard avec la méthode d’entrée par colonnes. Historisées : Pas de suppressions, Nécessité d’un référentiel de temps. L’historisation permet l’extrapolation, la mesure de l’impact d’une décision par comparaison de la situation avant et après la mise en application de cette décision. Exemple : Suivi des évolutions des comportements des clients

Création d’une table SAS Pour créer une table SAS à partir d’un fichier de données brutes, vous devez : Débuter par une étape DATA et nommer la table SAS qui sera créée (instruction DATA). Identifier l’emplacement du fichier de données brutes (instruction INFILE) Donner les instructions nécessaires à la lecture des champs du fichier de données brutes (instruction INPUT)

Création d’une table SAS Format général de l’instruction DATA : DATA libref.table(s)-SAS; Exemple : L’instruction DATA crée une table temporaire SAS nommée tabtest. DATA work.tabtest; Exemple : L’instruction DATA crée une table permanente SAS nommée tabtest. libname ia ‘bibliothèque-de-données-SAS’; DATA ia.tabtest;

Pointeur vers un fichier de données brutes Format général de l’instruction INFILE : INFILE ‘nom-de-fichier’ <options>; Exemples : UNIX Infile ‘/users/fic.dat’; WINDOWS Infile ‘c:\fichier\fic.dat’;

Lecture de champs de données Format général de l’instruction INPUT : INPUT spécifications-input; Les spécifications-input : nomment la variable SAS identifient les variables comme type de caractère ou type numérique identifient l’emplacement du fichier de données brutes peuvent suivre la syntaxe d’entrée par colonnes, formatée, de liste ou par nom.

Lecture de données avec la méthode d’entrée par colonnes La méthode d’entrée par colonnes est adéquate pour la lecture : Des données à l’intérieur de colonnes fixes Des données de type caractère et de type numérique standard. Format général de l’instruction INPUT par colonnes : INPUT variable <$> debutcol-fincol … ; Exemples de données de type numérique standard : 15 -15 15.4 +1.23 1.23E3 -1.23E-3

Lecture de données avec la méthode d’entrée par colonnes Fichier de données brutes Etape DATA Data nom-table-SAS; infile ‘nom-de-fichier-données-brutes’; input variable <$> debutcol-fincol … ; Run;

Création de tables SAS temporaires Emmagasinez la table test dans la bibliothèque work. data work.test; infile ‘donneebrute.txt’ ; input vol $ 1-3 Date $ 4-11 Dest $ 12-14 first 15-17 Eco 18-20; run;

Création de tables SAS permanentes Modifiez l’étape DATA précédente afin d’emmagasiner de façon permanente la table test. libname ia ‘bibliothèque-de-données-SAS’; data ia.test; infile ‘donneebrute.txt’ ; input vol $ 1-3 Date $ 4-11 Dest $ 12-14 first 15-17 Eco 18-20; run;