Saisie des données de recensement: vue d’ensemble

Slides:



Advertisements
Présentations similaires
Global Total Microcode Support (TMS ou GTMS) Microcode Management proactif pour System i, System p, System x et SAN.
Advertisements

Les Systèmes d’Information Financière Atelier conjoint ACBF / Banque Mondiale / AFRITAC de l’Ouest Gérer l’application dans le temps, sur les plans fonctionnel,
Les Ressources Requises pour un Exercice de Profilage des PDIs Atelier Bangui, République Centrafrique 9 mars 2011.
Accueil du public Déficient visuel. Quel est sa déficience visuelle ? Quelles solutions techniques ? - Quel est son niveau en informatique ? - Quelles.
Comment généraliser la dématérialisation dans les cabinets ?
Processus d'expression du besoin
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Appariement Pres. 7.
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Méthodologies et procédures.
RISCD Compilation des SCD dans les pays Africains Thierno Aliou BALDE Division de statistique des Nations unies Atelier régional pour les pays africains.
“PDA”/Ordinateurs de poche/Internet pour la collecte des données de recensement Atelier régional des Nations Unies sur le traitement des données du recensement :
Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako,
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données.
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données.
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données.
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données.
Saisie optique des données :
Atelier Recensement UNSD Jour 2 – Session 7 Optical Mark Reading (OMR) Michael Smethurst: Regional Manager, International, DRS DRS est le spécialiste mondial.
Atelier de recensement UNSD Jour 3 - Session 10 Saisie de Données: Stades du Processus Michael Smethurst: Regional Manager, International, DRS DRS est.
Atelier régional des Nations Unies sur le traitement des données du recensement (3-7 novembre 2008, Bamako/Mali) Traitement des données du recensement.
Atelier régional des Nations Unies sur le traitement des données du recensement (3-7 novembre 2008, Bamako/Mali) BAKAYOKO Massoma, Démographe à lInstitut.
Atelier de Recensement UNSD
(recommandation de Johanesburg)
Les Ateliers de Génie Logiciel
Cours Visual Basic pour Application
La revue de projet.
GED Masters: Gestion Électronique de Documents
SECURITE DU SYSTEME D’INFORMATION (SSI)
Introduction au Génie Logiciel
Amélioration de la sécurité des données à l'aide de SQL Server 2005
Parcours de formation SIN-7
Préqualification OMS des Produits Médicamenteux
Un intranet documentaire : concepts, outils et avantages
Le Travail Collaboratif ...
Outil dAnalyse Rapide de Situation en matière de Protection des Enfants Inter-agency Child Protection Working Group Picture by: Hani Mansourian.
Module 4 : Création et gestion de comptes d'utilisateur
Création et gestion de comptes d'utilisateur
© Nuance Communications, Inc. Tous droits réservés. Page 1 OmniPage Ultimate mai 2013.
Techniques de test Boulanger Jean-Louis.
Thème 8 : l'observation et l'expérimentation
Mesures de performance organisationnelle Cours ICO 810 Professeur: Michel Pérusse Hiver 2005 Session 9.
IGL301 - Spécification et vérification des exgiences 1 Chapitre 2 Le processus dingénierie des exigences (ref : Bray chapitre 2)
© Petko ValtchevUniversité de Montréal Janvier IFT 2251 Génie Logiciel Notions de Base Hiver 2002 Petko Valtchev.
Module 4 : Maintenance des pilotes de périphériques
Jonathan Montois Cyrille Kriegel
Progrès technique et logique économique : leur liaison interne
Chaînes de Résultats Conservation Coaches Network Formation des coachs Tester la logique de vos stratégies.
Mise en oeuvre et exploitation
Module 8 : Surveillance des performances de SQL Server
IAEA International Atomic Energy Agency Préparation aux urgences Aperçu sur les concepts de base de la préparation et la conduite des interventions d'urgence.
Supports de formation au SQ Unifié
CHAPITRE IV MÉTHODES DE COLLECTE ET DE TRAITEMENT DES DONNÉES
-Utilisation du logiciel Download helper -Utilisation de la vidéo -Utilisation d'un exercice via Hot Potatoes.
2003 (revisé 2008)SEG Chapitre 11 Chapitre 1 “The Systems Engineering Context” Le contexte du génie de systèmes.
Introduction aux bibliothèques numériques Alain Jacquesson Bibliothèque publique et universitaire Ville de Genève Vers
1 Registration Physique Séminaire du Master Davide Bazzi Université de Fribourg
Introduction au Génie Logiciel
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
Initiation à la conception des systèmes d'informations
MOCK.
MODULE DE FORMATION À LA QUALITÉ
En route vers le déploiement . . .
ISO 31000: Vers un management global des risques
Définition d’un CMS Comparatif des différents CMS Les CMS Généraux.
All rights reserved © 2007, AlphaBot Spécialiste dans le domaine de la robotisation, nous vous proposons de mettre notre expertise à votre service.
ACTIVITES INFORMATIQUES DU RGPH 2014 SYNDOU DIOMANDE INGENIEUR INFORMATICIEN (GENIE LOGICIEL) DIRECTEUR DES SYSTEMES DE L’INFORMATION INS (COTE D’IVOIRE)
ISO 9001:2000 Interprétation Article 7 Réalisation du produit
ACTIVITES INFORMATIQUES DU RGPH 2014 SYNDOU DIOMANDE INGENIEUR INFORMATICIEN (GENIE LOGICIEL) DIRECTEUR DES SYSTEMES DE L’INFORMATION INS (COTE D’IVOIRE)
Transformation digitale Comment maîtriser les risques ?
PRESENTATION DU PROJET SHINE – OXFAM MALI AU CLUSTER SECURITE ALIMENTAIRE BAMAKO 25 JUIN, 2015 Présenté par: Ir. Cheikhou DIAGANA Emergency Food Security.
31Mai 2016 Utilisation des technologies mobiles pour la collecte des prix à la consommation Direction centrale de la conjoncture et études économiques.
Transcription de la présentation:

Saisie des données de recensement: vue d’ensemble A ma connaissance les traductions des acronymes du métier de la Lecture Automatique de Documents sont: OCR: Reconnaissance Optique des caractère OMR: Reconnaissance Optique des cases à cocher ICR: Reconnaissance Intelligente des Caractère Data processing: traitement/exploitation des questionnaires Editing: apurement des fichiers. Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008

Sommaire Définition (N-U) Méthodes de saisie de données : Différentes Méthodes Avantages et inconvénients Facteurs à considérer lors du choix d’une méthode Conclusion Je vais commencer par: Définir ce que c’est la saisie de données; puis Présenter une vue d’ensemble sur les différentes méthods qu’on pratique pour la saisie des données de recensement; et Plus spécifiquement, quels sont leurs avantages et leurs inconvénients Ensuite Mettre l’accent sur les facteurs qu’on doit considérer lorsqu’on procède au choix d’une méthode; et Enfin conclure. Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008

Qu’est-ce que la saisie de données? “la saisie de données est le procédé utilisé pour convertir les données obtenues lors du recensement dans une forme interprétable par un ordinateur” (traduction libre) “Data capture is the system used to convert the information obtained in the census to a format that can be interpreted by a computer.” Source: United Nations Principles and Recommendations for Population and Housing Censuses, Rev. 2, p.68. Définition: Cette définition provient de Source: United Nations Principles and Recommendations for Population and Housing Censuses, Rev. 2, p.68. (Le document doit etre distribue aux participants) Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008

Méthodes de saisie de données Saisie au clavier (manuelle) Reconnaissance optique de marques (OMR) Reconnaissance optique de caractères (OCR) / Reconnaissance intelligente de caractères /ICR) Assistant Numérique Personnel (PDA) Internet Pour les données de recensement, on pratique plusieurs méthodes de saisie, dont La saisie au clavier, La lecture optique de marques, La lecture (ou reconnaissance) optique de caracteres, ainsi que la reconnaissance intelligente de caracteres Les dispositifs portables comme les PDAs ou les ordinateurs de poche Et par le nouveau venu Internet Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 4

Saisie au clavier (manuelle) Les réponses obtenues lors du recensement sont entrées par le biais du clavier dans un ordinateur Peut avoir recours à une assistance par ordinateur où l’opérateur sélectionne une réponse parmi plusieurs options affichées sur écran L’utilisation de cette méthode dépend des facteurs délai, coût, installation d’une infrastructure technologique, etc. Peut nécessiter le traitement des réponses sous forme de texte en une classification par catégorie Les réponses codées obtenues lors du recensement sont entrées manuellement par le biais du clavier dans un ordinateur La saisie au clavier assistee par ordinateur se pratique generalement a l’aide de logiciels de saisie sur micro-ordinateur comportant des controles logiques integres où l’opérateur sélectionne une réponse parmi plusieurs options affichées sur écran et les programmes permettent des verifications et controles logiques (tels que la validite des codes des districts de recensement, numerotation automatique des membres de menage a l’interieur d’un district de recensement, garantie que les valeurs des variables restent les fourchettes prealablement fixees, etc. La decision d’utiliser cette méthode vs une saisie automatique dépendrait d’un certain nombre de facteurs tels que: le délai imparti pour completer le precessus de traitement, les coûts relatifs entre ceux occasinnes par employer un grand nombre d’agents vs ceux occasionnes par les equipements. D’autres considerations incluent la faisabilité d’installer une infrastructure technologique plus sophistiquée Cette methode peut nécessiter le traitement des réponses sous forme de texte en une classification par catégorie Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 5

Avantages et inconvénients de la saisie manuelle Advantages Méthode requièrt des logiciels et équipements simples Moins coûteuse! Déploiement d’un grand nombre de PC pour d’autres utilisations après le recensement Disadvantages Exige plus de personnel Tâche prend plus de temps que celle de la saisie automatique Erreurs potentielles durant la saisie Normalisation des opérations difficle vu que la performance dépend des individus Avantages: Les besoins en matériel et logiciel sont très simples comparativement aux autres méthodes. Généralement moins coûteux, mais il dépend du coût de la main-d'œuvre (Inde vs Etats-Unis) Le grand nombre d'ordinateurs utilisés au cours de cette méthode de saisie de données peut être déployé pour d'autres usages après le recensement Inconvénients Nécessite un grand nombre d’agents (et ce qui peut être un avantage dans un pays mais peut être un inconvénient dans un autre pays) Il est evident, que l'entrée manuelle des données prend beaucoup plus de temps à completer que celle de l'entrée automatisée de données. En tant qu'entrée de données qui est manuelle, cette méthode est sujette à des erreurs Et étant donné qu‘elle est basée sur les individus, ses opérations sont difficiles à être normalisées Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 6

Technologies de saisie de données Les techniques d’imagerie et de reconnaissances optique et intelligente de caractères offrent un grand potentiel et des avantages pour la saisie des données L’utilisation de la technologie pour la saisie des données devrait être pour renforcer leur efficacité/efficience et non pour le bien de la technologie Sensibilisation pour les longs délais et l’infrastructure technologique nécessaires pour la réussite de la mise en œuvre de la reconnaissance intelligente de caractères - Les nouvelles technologies de l'imagerie et de reconnaissances optique et intelligente de caractères offrent un grand potentiel et les avantages pour la saisie des données, en termes de delais et d’amelioration de la precision - Toutefois, l'emploi de la technologie pour la saisie des données devrait être axée sur la demande, c'est-à-dire de renforcer l'efficience et l’efficacité de la saisie de données, et non pas axée sur la technologie - Les ONS doivent être conscients de la longueur des délais et l'infrastructure technologique nécessaires pour la réussite de la mise en œuvre de la reconnaissance intelligente de caractères Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 7

Reconnaissance Optique de Marques (OMR) L’OMR est une méthode de numérisation des formulaires ou les réponses sont lues par un ordinateur sans le recours à un clavier La technologie OMR lit les réponses à des questions de type “cases à cocher” sur un papier spécial La machine ne détecte que la présence ou l’absence de la marque Les réponses scannées sont transformées en codes Les réponses écrites à la main doivent être saisies manuellement ou codées avec l’assistance d’un ordinateur L’OMR est une méthode de scannerisation des formulaires ou les réponses sont lues par un lecteur optique simplement connecte a un micro-ordinateur sans le recours à un clavier La technologie OMR lit les réponses à des questions de type “cases à cocher” sur un papier conçu spécialement La machine ne détecte que la présence ou l’absence de la marque Les réponses scannées sont transformées en codes Vu que l’OMR traite seulement avec des marques, les réponses manuscrites doivent être saisies manuellement ou codées avec l’assistance d’un ordinateur Exemples of reponses: X, O, L'utilisateur de ce type de documents renseigne son choix en marquant d'un petit trait ou d'une croix la case de son choix, ceci à l'aide d'un moyen de marquage visible par la machine, crayon de graphite ou stylo, en général bleu ou noir. Les cases de marquage sont de couleur invisible par la machine, en général rouge ou orange et servent à indiquer l'endroit où les marques doivent être faites. Fabricants en Europe de ce type de machines : NEOPTEC en France Axiome en Suisse DRS en Angleterre Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 8

Avantages et inconvénients de l’OMR Amélioration dans la précision des données Plus rapide que celle de la saisie manuelle Equipement relativement pas cher Relativement simple à installer et faire fonctionner Technologie testée et utilisée dans plusieurs pays Inconvénients Restrictions au niveau du modèle des formulaires, les types de papier et encre à utiliser Précision exigée pour le processus d’impression et de coupure du papier Les réponses dans des cases doivent être cochées par des moyens de marquage visibles par la machine (un stylo ou crayon de graphite) Pas de saisie de réponses sous forme de texte Avantages: 1. La technologie OMR présente un niveau de fiabilité très élevé du résultat de la lecture (l’experience montre que les taux d’erreurs sont tres bas pour la saisie des marques ou cochage des questionnaires), permettant d’améliorer la précision des données. 2. La technologie OMR se caracterise par une grande vitesse de lecture effective (jusqu’a 7.000 documents/heure) 3. Equipement robuste, relativement pas cher 4. L’analyse du contenu du document lu se passe au niveau du lecteur optique qui dispose d’une intelligence propore et dediee (micro-processeur). Le lectuer se connecte simplement au micro-ordinateur par le port serie, sans parametrages ou installations particulieres, faisant que l’ équipement est simple à installer et faire fonctionner 5. L’OMR est désormais une technologie connue et eprouvee: Elle a été testée et utilisée dans la saisie de données de recensement dans plusieurs pays. Inconvénients En raison de conditions relativement strictes pour le traitement du papier, des pays à climats humides ou très poussiéreux, et qui ne sont dotees de bonnes infrastructures de transport sont dissuadés d'utiliser OMR. Il est nécessaire de suivre les restrictions spéciales pour la conception du questionnaire, la qualité du papier, et de respecter un cahier des charges précis en ce qui concerne l'impression et la découpe du papier. Ces restrictions pourraient etre problématiques pour de nombreux PVD pour pouvoir produire localement les questionnaires. La nécessité de réserver un espace relativement important pour le marquage de zones et d'adhérer à d'autres limitations imposées par l’OMR pourrait rendre difficile de concevoir le meilleur questionnaire du point de vue du processus de denombrement. Un autre problème pratique est que la plupart des dispositifs OMR mettent des restrictions à l'instrument d'écriture et les couleurs qui peuvent être utilisés dans le marquage (i.e.exigence que les réponse dans les cases doivent être correctement marquées avec un stylo ou un crayon). Limiation de l’OMR aux questionnaires de type case a cocher: pas de saisie de reponses sous forme de texte Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 9

Reconnaissance Optique de Caractères (OCR)/ Reconnaissance Intelligente de Caractères (ICR) OCR et ICR combinent les technologies de scannage et de reconnaissance de caractères pour numériser au complet le formulaire et interpréter les réponses L’OCR reconnait seulement les caractères imprimées à la machine L’ICR lit à la fois les réponses imprimées à la machine et celles écrites à la main dans des places bien spécifiques du formulaire et convertit les réponses en codes Pour l’OCR, les réponses écrites à la main doivent être saisies manuellement ou codées avec l’assistance par ordinateur La reconnaissance optique de caractères (ROC) désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Elle réalise beaucoup moins que l'être humain qui, lui, exécute, en plus de la reconnaissance, la compréhension du message, sa mémorisation, voire son analyse critique dans un seul temps. Un ordinateur réclame pour l'exécution de cette tâche un logiciel de reconnaissance optique de caractères, ROC ou OCR (abréviation du terme anglais optical character recognition), Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou du moins, sur un support sûr et exploitable par un système informatique. La reconnaissance intelligente de caractères connue sous l'acronyme ICR est une technologie proche de l'OCR. Il s'agit, à partir d'une image issue par exemple de la numérisation d'une page via un scanner, d'extraire le contenu textuel. Cependant, par rapport à l'OCR, l'ICR ajoute la technologie de reconnaissance de caractères manuscrits et intègre également un mécanisme d'apprentissage de nouveaux caractères qui permet au moteur d'ICR d'améliorer les performances lors des reconnaissances qui suivent. Autrement dit, si un caractère manuscrit qui représente un caractère "A" est identifié difficilement, il sera possible d'apprendre au moteur ICR qu'il s'agit d'un "A". Lorsque de nouveau une matrice représentant potentiellement un "A" se présentera, le système utilisera sa base de caractères enrichie par apprentissage pour en déduire que la matrice correspond au caractère "A". L'ICR est également associée à des règles permettant au moteur de prendre des décisions en cas de doute. Les technologies d'ICR sont utilisées dans des solutions de LAD. Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 10

Principes de fonctionnement Scannage optique d’une page dont on veut récupérer le texte (image numérique) Image contrastée pour que le programme discerne facilement les caractères Le programme lit le document et, se basant sur des bibliothèques de formes, détecte les caractères afin d’en faire correspondre la forme au caractère attendu Des dictionnaires permettent de recupérer certaines erreurs puisque le logiciel se basera alors sur des mots existants pour faire ses comparaisons Fonctionnement On part de l'image numérique réalisée par un scanner optique d'une page (document imprimé, feuillet dactylographié, etc.) dont on veut récupérer le texte. L'image doit être assez contrastée pour que le programme discerne facilement les caractères. Certains logiciels comportent, en outre, une interface pour l'acquisition numérique de l'image. Le principe du programme est de lire le document et, grâce à des bibliothèques de formes, détecter les caractères afin d'en faire correspondre la forme au caractère attendu. Des dictionnaires permettent de récupérer certaines erreurs puisque le logiciel se basera alors sur des mots existants pour faire ses comparaisons. Certains logiciels vont même tenter de conserver l'enrichissement du texte (corps, graisse et police) ainsi que la mise en page, voire rebâtir les tableaux. Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008

Advantages of OCR/ICR La conception du formulaire n’est pas aussi stricte que pour l’OMR Le délai de traitement peut être réduit en raison de la nature automatisée du processus Permet le dépôt sous forme numérique des questionnaires, améliorant l'efficacité de stockage et de récupération des questionnaires pour un usage futur Certains réponses manuscrites peuvent être automatiquement codées améliorant ainsi la qualité des données 1.Bien que moins que l’OMR, les OCR / ICR offrent un taux d'erreur satifaisant Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 12

Inconvénients de OCR/ICR Augmentation du coût des équipements (matériel sophistiqué / logiciel requis) Personnel («IT ») de haut niveau, nécessaire pour appuyer le système L’ écriture manuelle sur les formulaires de recensement doit être aussi proche que possible du modèle de l'écriture pour éviter les erreurs de reconnaissance Possibilité d’erreurs durant la substitution de caractères, affectant la qualité des données Le réglage du moteur de reconnaissance est critique, avec un compromis sur la qualité et le coût 1. Des coûts plus élevés de l'équipement en raison de la sophistication du matériel et des logiciels requis 2. Exige un haut niveau de qualité du personnel TI afin de soutenir le système 3. Exige que l'écriture manuscrite sur les formulaires de recensement être aussi proche que possible au modèle de l'écriture pour éviter les erreurs de reconnaissance 4. Possibilité d’erreurs durant la substitution de caractères, pourrait affecter la qualité des données 5. Le réglage du moteur de reconnaissance, pour reconnaître avec une meilleure précision les caractères, est critique avec un compromis sur la qualité et le coût Plus: Des erreurs systématiques peuvent se produire lors du processus de codage automatique, ce qui affecte la qualité des données Des coûts supplémentaires importants associés à du papier stricte, à l'encre et aux exigences d'impression. Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 13

Assistant Numérique Personnel (PDA) Un PDA (Personal Digital Assistant, littéralement assistant numérique personnel, aussi appelé organiseur) est un ordinateur de poche composé d'un processeur, de mémoire vive, d'un écran tactile et de fonctionnalités réseau dans un boîtier compact d'extrêmement petite taille. Un PDA (Personal Digital Assistant, littéralement assistant numérique personnel, aussi appelé organiseur) est un ordinateur de poche composé d'un processeur, de mémoire vive, d'un écran tactile et de fonctionnalités réseau dans un boîtier compact d'extrêmement petite taille. Utilité du PDA Le PDA est un ordinateur de poche dont l'usage est prévu originalement dans un but d'organisation. Un assistant personnel fournit donc généralement en standard les application suivantes : Un agenda, pour l'organisation de l'emploi du temps, avec des mécanismes de rappel visuels ou auditifs. Les rendez-vous et événements planifiés dans l'agenda peuvent être contextualisés, afin de répondre à des besoins tant professionnels que personnels, grâce à une classification adaptable (bureau, privé, etc.) Un gestionnaire de tâches faisant office d'aide-mémoire pour les tâches à effectuer. Une priorité, des dates limites ou des mécanismes de rappel peuvent être affectées à chaque tâche. Un carnet d'adresses (gestionnaires de contacts), permettant d'avoir à tout moment sous la mains les coordonnées de ses contacts (numéro de téléphone, adresse postale, adresse de messagerie, etc.). Un logiciel de messagerie, rendant possible la consultation de ses méls ainsi que la rédaction de nouveaux messages. Les assistants personnels proposent des outils de bureautique allégés tels qu'un traitement de texte, un tableur, une calculatrice, des visualiseurs pour un grand nombre de formats de fichiers (fichiers PDF, images, etc.). Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008

Fonctionnement du PDA Le contenu du formulaire de recensement est enregistré sur le PDA afin que les questions apparaissent successivement sur l'écran Les données sont entrées dans un ordinateur de poche au lieu du papier du formulaire de recensement Les données sont ensuite transmises par voie électronique à la base de données de l’office national de la statistique pour un traitement ultérieur En plus de ces fonctions de base, de plus en plus de PDA proposent des outils multimédias avancés permettant de lire des vidéos (dans les différents formats, y compris le format DivX), des musiques (notamment au format mp3) ou des animations Flash. Les PDA sont également de plus en plus utilisés pour des usages de géolocalisation, de cartographie et de navigation routière lorsqu'ils sont couplés à un dispositif de géolocalisation (GPS, Global Positionning System). En effet, pour un faible coût il est possible de disposer d'un système GPS embarqué très performant permettant une navigation routière à l'aide d'une carte indiquant en permanence sa position, la vitesse et une représentation visuelle de la route (éventuellement en 3D) avec des instructions à l'écran et dictées par une voix de synthèse. Système d'exploitation Les PDA possèdent des systèmes d'exploitation dont la définition est adaptée à la résolution d'affichage de l'écran et dont les fonctionnalités correspondent aux caractéristiques de ce type d'appareil. Il existe plusieurs systèmes d'exploitation pour PDA, correspondant la plupart du temps à des types de PDA différents et portés par des constructeurs différents, au même titre qu'il existe des ordinateurs Mac et PC. Les deux principaux systèmes sont : PalmOS, promu par la société Palm. Windows Mobile ou Pocket PC (anciennement Windows CE), promu par la société Microsoft. Ces deux systèmes possèdent à peu près les mêmes caractéristiques et les mêmes fonctionnalités avec une prise en main différentes mais surtout des applications incompatibles entre les deux systèmes. Il est à noter qu'il existe des systèmes d'exploitation Linux développés spécifiquement pour les deux types de machines. Caractéristiques techniques: Lors de l'achat d'un PDA il est notamment important de veiller aux caractéristiques suivantes : poids et dimensions : Le PDA est destiné à être emporté partout et doit donc tenir dans la main ou la poche. Ses dimensions et son poids doivent donc être choisis les plus petits possible, en gardant à l'esprit le besoin d'ergonomie et de surface d'affichage. autonomie : L'autonomie du PDA est fonction des caractéristiques de la batterie. Ni-Cad (Nickel / Cadmium) : type de batterie rechargeable devenu obsolète car souffrant de l'effet mémoire, c'est-à-dire une baisse progressive de la charge maximale lorsque celle-ci est rechargée alors qu'elle n'est pas complétement "à plat". Ni-Mh (Nickel / Métal Hybride): type de batterie rechargeable plus performant que les batteries Nickel-Cadmium. Li-Ion (Lithium / Ion): type de batterie rechargeable équipant la majorité des ordinateurs portables. Les batteries Li-Ion offrent d'excellentes performances pour un coût modeste. D'autre part les batteries Li-Ion ne souffrent pas de l'effet mémoire, ce qui signifie qu'il n'est pas nécessaire de vider complétement la batterie avant de recharger l'appareil. Li-Polymer (Lithium / Polymère) : type de batterie rechargeable ayant des performances équivalentes aux batteries Li-Ion mais beaucoup plus légères dans la mesure où le liquide électrolytique et le séparateur microporeux des batteries Li-Ion sont remplacés par un polymère solide, beaucoup plus léger. En contrepartie le temps de charge est plus important et leur durée de vie est plus faible. Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 15

Avantages et inconvénients de l’utilisation du PDA Advantages La saisie instantanée des données au point de collecte, permet de réduire les erreurs de saisie manuelle Validation immédiate des données, réduction des re-vérifications ultérieures Délai plus efficace avec les régles de validation logique, réduisant les erreurs logiques Traitement plus rapide de l’ information du recensement menant à la dispposition à temps des résultats Inconvénients Mise en place du système peut prendre beaucoup de temps car il nécessite de nombreux essais Exige que les agents recenseurs aient la capacité d'utiliser le dispositif qui nécessiterait la conduite d'un test Nécessite une formation intensive des enquêteurs sur l'usage de dispositif (formation plus compliquée) Besoin de recharger la batterie qui pourrait se décharger durant le recensement Possibilité de défaillance de l'équipement Avantages: L'information est enregistrée selon des règles pré-déterminé, réduisant ainsi les erreurs. Les procédures de vérification instantanee des données sont programmées dans le PDA, de maniere qu’une alarme est activée si une donnée qui est incompatible avec le format, ou qui est incompatible avec les autres réponses déjà fournies, ait été entrée dans le dispositif. Le périphérique ne peut pas permettre à l'opérateur de passer d'une réponse incomplète à une autre question à moins que l'ancien a été achevée. Le fait que le dispositif avertit l'opérateur lorsque il ya une erreur, signifie que l'information peut être vérifiée par les agents recenseurs par obtention d’informations plus précises tant qu’ils sont encore avec le menage. Le périphérique ne peut pas accepter des codes ou des réponses au-delà de la norme acceptable permettant ainsi d'améliorer la qualité des données. Avantage supplémentaire des PDA : Certains diront que les ANP sont rentables avec moins de copies papier Inconvénients: Mise en place du système peut prendre beaucoup de temps car il nécessite de nombreux essais Exige que les agents recenseurs aient la capacité d'utiliser le dispositif qui nécessiterait la conduite d'un test Nécessite une formation intensive des enquêteurs sur l'usage de dispositif (formation plus compliquée) Besoin de recharger la batterie qui pourrait se décharger durant les operations du recensement Possibilité de défaillance de l'équipement lui-même Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 16

Collecte par Internet Internet est de plus en plus utilisé pour la collecte des données du recensement Toutefois, la méthode est toujours utilisée en complément avec d'autres méthodes plus établies Le formulaire en ligne n'est pas une version téléchargeable de la version papier Un mot de passe, pour accéder et remplir le formulaire, est requis Le développement du système de collecte de données par Internet est généralement sous-traité pour manque d'expertise interne Approche Internet: Les répondants soumettent leurs questionnaires de recensement via Internet au lieu d'utiliser la méthode écrite Conventionnelle Comme pour le PDA, le formulaire en ligne n'est pas une version téléchargeable de la version papier Le recours à cette méthode requiert un mot de passe afin d'accéder et remplir le formulaire Le développement du système de collecte de données par Internet est généralement sous-traité pour manque d'expertise-maison Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 17

Internet: avantages/inconvénients Réduction des ressources nécessaires à la gestion des formulaires et la saisie des données Meilleure opportunité pour atteindre les zones géographiques difficiles et recenser certains groupes de population Filtrage automatique de la pertinence des questions Des données de meilleure qualité en raison du mécanisme de vérification interactif, intégré à la machine Disponibilité plus rapide des résultats du recensement, due a un processus de saisie et correction de données plus simplifié Inconvénients Exige que les répondants aient un ordinateur avec accès Internet Gestion des réponses peut être problématique, par exemple, que les ménages ont répondu une et une seule fois Exige un haut niveau de système de sécurité pour assurer la sécurité du transfert et la confidentialité des données Nécessité de mettre en place du système de traitement parallèle vu que tout le monde ne va utiliser l'Internet Nécessite d’un mécanisme pour vérifier les omissions et communications Est coûteux et nécessite beaucoup de ressources pour la mise en place de manière adéquate et tester le système Disadvantages: 2. Management of responses can be problematic, e.g., that households have responded once and only once: Efficient tracking system! Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 18

Facteurs à considérer lors du choix d’une méthode Choix de la méthode devrait faire partie de l'objectif stratégique global du recensement de la population en termes de délai, de précision et de coût Choix de système de traitement et de la technologie à utiliser doivent être mis en place au début du processus de recensement Suffisamment de temps est nécessaire pour expérimenter et mettre en œuvre le système Lorsque la technologie de l'imagerie est utilisée pour la saisie des données, des tests sont nécessaires bien avant le recensement Possibilité de sous-traiter quand l'expertise requise n'est pas disponible Facteurs importants à considérer lors du choix d’une méthode de saisie de données: Le choix de la méthode devrait faire partie de l'objectif stratégique global du recensement de la population en termes de délai, de précision et de coût Les choix du système de traitement et de la technologie à utiliser doivent être mis en place au début du processus de recensement. Enough time is required to test and implement the system. Lorsque la technologie de l'imagerie est utilisée pour la saisie des données, des tests extensifs sont nécessaires bien avant le recensement afin de déterminer le meilleur équipement et le papier, les configurations d'essai, et de fixer les spécifications de performance optimale pour les équipements Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 19

Facteurs à considérer (cont.) Des tests extensifs du système sont également critiques quant la collecte de données est effectuée soit par PDA soit via Internet Conception et qualité du papier de recensement devraient être liées à la méthode de saisie des données Lorsque on décide d’utiliser la technologie de l'imagerie, une formation adéquate des agents recenseurs sur la façon de bien remplir les formulaires est cruciale Aussi: Des tests extensifs du système sont également critiques quant la collecte de données est effectuée soit par PDA soit via Internet Conception et qualité du papier de recensement devraient être liées à la méthode de saisie des données Lorsque on décide d’utiliser la technologie de l'imagerie, une formation adéquate des agents recenseurs sur la façon de bien remplir les formulaires est cruciale Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008

Conclusion Le choix d’une méthode appropriée dépend de la situation particulière de chaque pays Chaque méthode a ses avantages et ses inconvénients, ses coûts et impacts sur les équipments logiciel et matériel au niveau de la saisie de données mais aussi au niveau des étapes ultérieures Dans un recensement, la saisie de données peut impliquer une combinaison de plus d’une des méthodes présentées Méthode à utiliser dépend des conditions dans le pays 2. Différents avantages/coûts/impacts au niveau de la saisie de données ainsi qu’au niveau des étapes ultérieures. 3. Combinaison de plus d’une des méthodes ci-dessus. Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008

Merci Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008