Les analyses statistiques de données textuelles 7. Validation des résultats Ludovic Lebart CNRS - ENST.

Slides:



Advertisements
Présentations similaires
XXV Jon Friestedt and Gwyn Shumar. Selon le prince, que font les hommes? Comment est-ce que le puts est different que les puits sahariens? Donnez des.
Advertisements

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données.
Règles significatives
La fonction Style Permet de créer des types de texte, par exemple
Les noms des partenaires ____________________________________ ____________________________________ Partie A: Notre thème est: ______________________________.
LMD: Langage de Manipulation de Données
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
Section A: dire, lire, ecrire
Séquence Les animaux de la ferme
La méthodologie expérimentale Fondements et bases d’application
Les Fonctions. Définir une fonction Sections de code indépendantes que lon peut appeler à nimporte quel moment et dans nimporte quel ordre. Bout de code.
1 Example of a test Go S. Onillon
Aujourd’hui, c’est mercredi, le 2 mai Objectifs: use aller + infinitive to tell what you are going to do in the near future; use the prepositions to/in/at.
WALT: Read and write about TV programmes and leisure events WILF: To be able to pick out key words for grade E. To be able to work out and deduce meanings.
1. choose a pen pal from advertisement page 2. follow directions for writing a letter to that person.
What is the nanotechnology History applications of nanotechnology Conclusion.
INDUCTEL V1.0 Zones de dialogue Dialog areas Etiquettes productiques: zones de dialogue Automated tags: dialog areas.
Chapitre 6.2 Les curseurs Cours SGBD 3A Mme hkimi Jihène
ANALYSE DE DONNEES TESTS D’ASSOCIATION
-Utilisation du logiciel Download helper -Utilisation de la vidéo -Utilisation d'un exercice via Hot Potatoes.
I can tell time in French!
Que sont les fichiers de mobilité de l’INSEE?
Mesures d'association non paramétriques Mitchell Brown Université d'Auburn This material is distributed under an Attribution-NonCommercial-ShareAlike 3.0.
Les approches qualitatives et quantitatives pour la recherche comparative Anthony Sealey Université de Toronto This material is distributed under an Attribution-NonCommercial-ShareAlike.
Popular Mobilization Creating a mass movement to take action and put pressure on decision makers for social change Créer une masse critique d’acteurs.
L’agenda masque encore le début des textes du Mag and co. Nous maintenons la demande du décalage de 50 pixels. Possible de réduite la typo Possible de.
BENCHMARK JOBS Marie-Laure Rivier – January 2015.
Le superlatif Comparing people and things within a group.
Chapitre 5 Lesson 3 Essential Question: How do the French say they must or can do something?
Edson Brito April, 10, 2011 French IP.  Legacy is anything handed down from the past, as from an ancestor or predecessor.
Nous allons .. préparer un texte (pour écrire ou décrire)
Questions to consider: How are French nouns different from nouns in English? What is the difference between saying, “I have a pen.” and saying, “I have.
Year 10. Bon appetit unit. Introducing ‘en’. ‘en’ – ‘some of it’ or ‘some of them’ ‘En’ is a small but important word in French that is commonly used.
Overview %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%
GCSE Speaking Assessment Presentation Based Discussion In your first GCSE Speaking Assessment, you are being interviewed by your French friend for their.
Les pronoms sujets Singular subject pronouns. Les normes: Communication 1.2 Comparisons 4.2  Les questions essentielles:  What is a subject pronoun?
Let’s enjoy making Session 3 Let’s enjoy making: Session 3 Que pensez-vous ?
L’impératif! (Commands).
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 24/07/2015 2:29 PM Bootstrap et permutations.
Les couleurs.
Unit 1A – Greetings and Good-byes Page 3. Page 2.
Qu’est-ce que Que Qu’est-ce que is followed by a subject and verb (S & V) tu Qu’est-ce que tu regardes? What are you watching?
Unité 2 Leçon 1 I can describe myself and others Day 3 I can describe an ideal friend.
Overview %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%
Analyse des semis de point
Localisation collaborative dans les réseaux de capteurs
Journal 7/10/14 Tell me you are going TO these places Turn in your devoirs Je vais… 1. Japon4. Israël 2. France 5. Etats-Unis 3. Canada6. Mexique.
Français 2 Reprise Interro #1.
Chapter 5 Comment est ta famille?. Essential Questions ● How can you describe yourself and others? ● What is the vocabulary that can be used to describe.
Stephen Gagné, DTM Laura Gagné, DTM.  Evaluation method  Test speaker  Break-out work groups  Evaluations  Evaluations of evaluations.
Overview %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%%%%%% %%%%%%%
Analyse de données avec R
Mes préférences At the end of this lesson; you will be able to:
Proposal in Theme VII: Funding Proposition Theme VII: Financement Catherine Edwards Executive Director 1.
État des Lieux Les Questions Les Réponses en français et en anglais.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Le Cours-Les Questions 1.What is the verb in French for: “To join/enrol for a course” etc = 2.What type of course does she sign up for? 3.When does she.
Trivago.
O WHY IS IT IMPORTANT TO PLAN AHEAD FOR THE FUTURE?
As-tu un animal? Mettez les dessins dans le bon ordre alphabetique.Écrivez les mots français avec ‘un’ ou ‘une’. Put the pictures below in alphabetical.
➜ simplify the rules ➜ make them known ➜ make formalization desirable Formalizing microentreprises in Mali.
Measures of Comparative Advantage. 2 Outline 1.Defining measures 2.Some tests and examples.
TITLE Business PowerPoint Templates PowerPoint note pad template.
Resource allocation: what can we learn from HPC? 20 janvier 2011 Vincent Breton Crédit: Catherine Le Louarn.
Mercredi 18 septembre Planète facebook Objectif: To be able to say what you do on facebook To revise time phrases To revise the present tense for –er verbs.
Le Présent Subjonctif Être FlashCards. Vivre Hélène is very happy. She has so many things to be thankful for. Look through her photo album and say in.
Starter dans le cahier bleu comment dit-on en français?
Leçon 6 I am what I am or to be or not to be
Buddy Program AEGEE-Alicante
Je me présente Je suis petit quite Je suis petite I am tall (f)
Transcription de la présentation:

Les analyses statistiques de données textuelles 7. Validation des résultats Ludovic Lebart CNRS - ENST

Validation interne : Bootstrap, opportunité de la méthode Raisons d’utiliser le “bootstrap” : –Complexité de l’approche analytique –Se libérer des hypothèses sur les distributions –S’adapter à toutes les situations

Cas des analyses des correspondances simples et mumtiples Gifi (1981), Meulman (1982), Greenacre (1984) furent les premiers à proposer l’approche bootstrap dans ce cadre. Il reste cependant très difficile de procéder à des tests sur les valeurs propres. Il existe également plusieurs modalités d ’applications selon les contextes.

Rappel sur le Bootstrap Exemple : Zones de confiances sur les visualisations. Exemple de table de contingence (CESP Multi-Media Survey, 1993). Dans chaque case: nombre de medias contactés la veille. Colonnes : Media [Radio, TV, National & Regional Daily N., Magazines]. Lignes : Catégories socio-professionnelles. Radio Tele Nat. Reg. Maga TV_Mag Farmer Small Business Executive Intermediate Employee Skilled worker Unskilled worker Housewives, Ret

Visualisation des associations entre profession et contacts medias [ A. des correspondances]

(Rappel sur le Bootstrap) Exemple : Zones de confiances sur les visualisations Exemple de table répliquée Radio Tele Nat. Reg. Maga TV_M Farmer Small Business Executive Intermediate Employee Skilled worker Unskilled worker Housewives, Ret

Zones de confiance Bootstrap : “ellipses de replications”

Zones de confiance Bootstrap : “enveloppess convexes de replications”

exemple (textes anglais) Question ouverte : "What is the single most important thing in life for you?" Suivie par la relance : "What other things are very important to you?". Question incluses dans une enquête internationale auprès de sept pays (Japon, France, Allemagne, Italie, Hollande, U K, USA) vers 1990 (Hayashi et al., 1992). L ’exemple concerne le volet anglais de l ’enquête (taille d ’échantillon : 1043).

Le bilan de la première phase de codage numérique est : Pour 1043 réponses, il y a occurrences (tokens), avec mots distincts (types). Si l ’on ne retient que les mots apparaissant au moins 16 fois, il reste occurrences de ces mots (tokens), avec 135 mots distincts (types). Exemple 1, suite

Exemple d ’une table lexicale

Les deux diapositives suivantes montrent le plan principal de l ’analyse des correspondances de la table lexicale précédente. La proximité entre 2 points- categorie (colonnes) signifie similarité des profils lexicaux des 2 catégories. La proximité entre 2 points- mots (lignes) signifie similarité des profils lexicaux de ces mots. Ellipses et enveloppes convexes décrivent l ’incertitude. 9 points categories, en rouge (toutes les categories, en fait) 6 points mots, en bleu.

Zones de confiance pour 4 catégories (en rouge) et 3 mots (en bleu)

Zones de confiance pour 4 catégories (en rouge)

Zones de confiance pour 3 mots (en bleu)

Zones de confiance pour 4 catégories (en rouge) et 3 mots (en bleu)

Zones de confiance pour 4 catégories (en rouge) et 3 mots (en bleu)

Fin de la section 7 Application DTM:  Petit exemple dit pédagogique  Shakespeare  Poèmes sur l ’automne

Both example data and software (DTM) can be freely downloaded from