Les recherches dans Frantext

Slides:



Advertisements
Présentations similaires
L’adjectif qualificatif
Advertisements

Rechercher sur SUPERDOC
Les démonstratifs.
DTD Sylvain Salvati
Utiliser les calculatrices en classe. 1. Introduction et choix de loutil Deux stratégies dutilisation sont possibles ; elles peuvent même être utilisées.
J'ADE 2005 J’aide Au Développement des Evaluations Animateurs TICE
Courbes de fonctions avec Excel
C’est vs. Il est/Elle est, C’est vs. ça, c’est vs. ce sont
L’adjectif qualificatif
Système formel Nous avons introduit : signes de variables (x, y, z, …), de constantes (0, 1), d’opérations (+, ), de relations (=, ) Axiomes : ce sont.
Se former au logiciel documentaire du CDI. De lutilité dun catalogue Tous les documents présents au CDI sont enregistrés dans le logiciel documentaire.
Nicolas Bourbaki.
Microsoft® Office Excel® Formation
Comment utiliser BCDI 2.07 Pour accéder aux différents modes de recherche, il suffit de cliquer sur le bouton OK.
Soyez Positif…pas Négatif 
LA DÉFINITION Par Carole Proulx Cégep de Trois-Rivières.
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
Cours de français en PPS
La Kessamo « » (Caisse à mots)
Les types de phrases La phrase déclarative
La base textuelle FRANTEXT
Le « non-accord » des adverbes
Création d'un diaporama Création d'un diaporama
Prédictions.
28 novembre 2012 Grégory Petit
Project de la langue française
Techniques de test Boulanger Jean-Louis.
Nature ou fonction d’un mot
Expression littérale  1) Définition
1.2 FONCTIONS Cours 2.
Modélisation des opérations Spécifier les transformations détat que lon attend des services de la machine Létat dune machine entièrement déterminée par.
TRAITEMENT INSTRUMENTÉ DE CORPUS
Paradigmes des Langages de Programmation
Thème 1 : Se présenter et présenter quelqu’un
PROGRAMMATION INFORMATIQUE D’INGÉNIERIE II PRO-1024.
expression de la comparaison
PROGRAMMATION INFORMATIQUE D’INGÉNIERIE II
Les classes grammaticales
La phrase complexe révisions.
D.E ZEGOUR Ecole Supérieure d’Informatique. Problèmes de décision Concepts de base Expressions régulières Notation particulière pour exprimer certaines.
Aujourd'hui, nous allons étudier les classes grammaticales des mots.
Thème 4 : Les éléments naturels. Cours 2 : L’eau dans la nature et chez les êtres vivants. Français Guide du Maître Thème 3 : Localiser un endroit et le.
Conversation permanente
Thème 1 : Se présenter et présenter quelqu’un
Programmation annuelle: Etude de la langue
Comment trouver un document dans la base de données du CDI
Les classes de mots ou classes grammaticales
S. Domas Système d’Exploitation Make et la construction d’exécutables 1ère annéeIUT Belfort-Montbéliard.
La Grammaire Unité 1 Les parties de la phrase
MODE D’EMPLOI Sous-titre. Onglet explorer voir toutes les activités crées par les autres professeurs, on peut réutiliser le contenu Dans files d’abonnement.
Comprendre le SGBDR Microsoft Access – partie 2
Module d’auto-apprentissage
Thème 4 : Les éléments naturels. Cours 2 : L’eau dans la nature et chez les êtres vivants. Français Guide du Maître Thème 3 : Localiser un endroit et le.
Chapitre 4 Variables aléatoires discrètes
Voici un petit guide pour vous permettre de vous inscrire sur le forum. Cliquez sur l’icone du forum dans la page d’accueil du site. Une fois sur le forum,
Progression/Programmation – Français (1/3)
CDI du lycée Jean Jaurès / La recherche dans BCDI.
CONSTRUIRE UNE SEANCE DE COURS
COURS D’HERMENEUTIQUE Secteur Sud-ouest Grande-Terre.
CONSTRUCTION DE TABLEAUX CROISES SUR LE LOGICIEL MODALISA MET4 – Avril 2005.
Comprendre les codes d'erreurs Pour corriger une copie
Chap. 3 Récursion et induction. Les définitions par récurrence consistent à construire des objets finis, à partir d'autres, selon certaines règles. Les.
Un mode impersonnel Les infinitifs présents et passés
1. Les Rôles Un rôle est une fonction détenue par un utilisateur à un moment donné. Un rôle confère des droits spécifiques. » Le CIL – correspondant informatique.
Les natures de mots Adapté par Tnisabelle Une année au CE2/blog.
1 Tableur Excel. 2 Introduction Un tableur est un logiciel permettant de manipuler des données numériques et d'effectuer automatiquement des calculs sur.
LE SIMULATEUR DE MARCHE UN OUTIL APEC POUR EXPLORER SON MARCHE Le simulateur marché est un outil exclusif Apec, qui permet d’analyser ses débouchés en.
Le plus- que -parfait. Conjugaison 1. Imparfait (auxiliaire être ou avoir) 2. Participe passé Note: n’oubliez pas d’accorder: être (sujet) et avoir (pas.
Présentation de la base Frantext
Transcription de la présentation:

Les recherches dans Frantext ATTENTION : Seule la version catégorisée de Frantext permet de désambiguïser les cas d’homographie (en précisant la catégorie grammaticale du mot recherché). Avant de lancer une recherche sur un mot (ou une séquence) dans la base non catégorisée, il faut s’assurer ce mot (ou cette séquence) ne possède pas une forme homographe appartenant à une autre catégorie grammaticale (ex : pouvoir n.m. vs pouvoir v.inf). Pour les deux bases de Frantext, le formulaire de recherche se présente de la même manière. On accède au formulaire depuis le menu déroulant :

Recherches dans la base non catégorisée Malgré le problème de l’homographie, la base non catégorisée de Frantext peut être utilisée pour rechercher des graphies données (mots ou séquences de mots). Toute recherche intervient après avoir défini un corpus de travail. 1. Rechercher une graphie donnée Pour rechercher une forme donnée d’un mot, il suffit de « taper » cette forme dans le formulaire de recherche. Exemple : Recherche du mot maison dans La Peau de chagrin

On obtient alors le nombre de résultats, que l’on peut ensuite visualiser : La visualisation des résultats permet de vérifier si la formule utilisée répond bien à la requête. Si ce n’est pas le cas, on peut retourner au formulaire pour corriger la formule, en utilisant l’icone du navigateur.

Ce mode de rédaction permet également de rechercher une séquence donnée. Exemple : Recherche de la séquence maison blanche La recherche d’une graphie donnée constitue la manière la plus simple de faire une requête sur Frantext.

2. Intégrer des expressions de choix Admettons à présent que l’on veuille chercher les séquences suivantes : petite maison, grande maison, jolie maison et vieille maison, qui mettent chacune en jeu un adjectif qualificatif différent. On doit construire une formule qui intègrera un choix entre les différents adjectifs. L’expression de ce choix se note : (choix1|choix2|choix3|….) Pour cet exemple, la formule sera donc : (petite|grande|jolie|vieille) maison On peut, sur ce principe, combiner plusieurs expressions de choix. Question : à quelles séquences correspond la formule suivante ? homme (riche(et généreux|et célèbre)|pauvre) Réponse : homme riche et généreux, homme riche et célèbre, homme pauvre.

3. Intégrer une séquence « quelconque » La notation &q(n1,n2) désigne une suite quelconque de mots dont le nombre est compris entre n1 et n2. Ce paramètre est très utile lorsque l’on recherche par exemple les occurrences de un homme riche et que l’on ne veut pas pour autant exclure les séquences du type un homme très riche ou un homme assez riche. La formule pour cet exemple serait donc : un homme &q(0,1) riche Si l’on voulait également inclure les exemples du type un homme bon et riche, on noterait la formule suivante : un homme &q(0,2) riche Le signe &q peut également être employé seul (sans indication numérale) mais dans ce cas il équivaut à &q(1,1). Exemple : la formule un homme &q riche correspond uniquement aux cas ou un mot quelconque s’intercale entre homme et riche (cette formule exclue donc la séquence un homme riche).

4. Intégrer une séquence facultative Le symbole &? placé devant une expression signifie que cette expression est facultative. Exemples : a- une &?toute petite voix permettra de rechercher les occurrences de une petite voix et de une toute petite voix. b- une &?(toute petite) voix  une voix et une toute petite voix. c- une &?(&?toute petite) voix  une voix, une petite voix, une toute petite voix. d- une &?(petite|grosse) voix  une voix, une petite voix, une grosse voix.

un homme très ^(gros|vieux|intelligent) 5. Le symbole de négation Le symbole ^ exprime la négation (ou plus exactement, l’exclusion). On le place devant l’expression que l’on veut rejeter. Exemple : un homme ^très riche Cette formule permet de rechercher toutes les occurrences de un homme XXX riche dans lesquelles XXX n’est pas égal à très. On trouvera donc des occurrences telles que un homme excessivement riche. On peut combiner le symbole de négation à une expression de choix : un homme très ^(gros|vieux|intelligent) Cette formule permet de rechercher toutes les occurrences de un homme très XXX dans lesquelles XXX n’est ni égal à gros, ni à riche, ni à intelligent.

6. Formes fléchies Dans tous les exemples précédents, la recherche portait sur une séquence donnée. Les formes fléchies des mots n’étaient donc pas prises en compte. Or, il est possible, dans la base non catégorisée de Frantext, de rédiger des formules intégrant les formes fléchies des verbes, noms et adjectifs. Codes utilisés pour désigner les formes fléchies : Verbes : &cXXX (exemple : &caimer) Noms et adjectifs : &mXXX (exemples : &mmaison, &msale) ATTENTION : ces formules permettent de rechercher toutes les occurrences des formes qui s’écrivent comme une des formes du verbe, du nom ou de l’adjectif spécifié, sans aucune garantie qu’elles appartiennent à la même catégorie grammaticale. Si on lance une recherche &caimer dans la base non catégorisée, on obtiendra également le nom aimant (forme homographe du participe présent du verbe).

Exercice d’application Rédigez une formule permettant de rechercher toutes les occurrences de l’expression faire peur  tout en intégrant les occurrences de faire très peur, faire drôlement peur, etc. (FAIRE + adverbe + peur) Formule : &cfaire &q(0,1) peur Il est vivement conseillé d’utiliser les symboles de formes fléchies pour des recherches portant sur des séquences lexicalisées plutôt que sur des mots isolés afin de limiter les problèmes d’homographie, et d’effectuer les recherches portant sur les formes fléchies d’un mot à partir de la base catégorisée.

Recherches dans la base catégorisée La base catégorisée de Frantext permet de construire des formules dans lesquelles on spécifie la catégorie grammaticale d’un ou plusieurs mots. Pour reprendre l’exemple d’aimer, la base catégorisée va donner la possibilité de spécifier que l’on recherche uniquement les formes fléchies du verbe et permettre ainsi d’exclure les occurrences du nom aimant. On va également pouvoir rechercher des constructions nues (sans contenu lexical). Exemple : Nom + adverbe + adjectif  homme très riche, femme assez sympathique… L’utilisation des fonctions de la base catégorisée nécessite une connaissance du code attribué à chaque catégorie grammaticale.

1. Principes généraux La plupart des règles d’écriture utilisées dans la base non catégorisée sont réutilisables dans la base catégorisée. Il faut seulement combiner les éléments de la requête en respectant certains principes. Les entités catégorisées (entités dont on va préciser la catégorie grammaticale) sont introduites par &e et suivies du code grammatical correspondant entre parenthèses. Exemples de notations : 1- Pour une recherche de substantifs : &e(g=S) 2- Pour une recherche de verbes : &e(g=V) 3- Pour une recherche de substantifs ou de noms propres : &e(g=S Np) Le signe ! accolé à g signifie que l’on ne veut pas que l’entité catégorisée appartienne à la catégorie grammaticale spécifiée. Exemple : &e(g!=V) désigne une entité catégorisée qui n’est pas un verbe.

2. Préciser la catégorie grammaticale d’un mot Reprenons à présent l’exemple du verbe aimer et supposons que nous ayons à construire la formule précisant que seules les occurrences verbales nous intéressent. Il va falloir mentionner le mot dont on va préciser la catégorie grammaticale. La mention d’un mot se note c=MOT Formule pour l’exemple du verbe aimer : &e(c=&caimer g=V) A l’inverse, si seules les occurrences du nom aimant nous intéressent : &e(c=&maimant g=S) On peut, sur le même principe, rechercher une forme particulière d’un mot (et non les formes fléchies) : &e(c=pouvoir g=S)

Exercices 1. Déchiffrer des formules Proposez un exemple d’occurrence que l’on obtiendrait avec chacune des formules suivantes : a- &e(g=S) &e(g=Adv) &e(g=Apr) Nom + Adverbe + Adjectif participe présent  histoire très amusante b- comment &e(c=&cpouvoir g=V) - (tu|vous) &e(g=Inf) cela Comment + verbe pouvoir + - + tu ou vous + 1 verbe à l’infinitif + cela  Comment pouvez-vous dire cela c- &e(g=S Np) &e(g=V) &?(&e(g=D)) &e(g=S Np) à &e(g=Inf) 1 Nom ou 1 Nom propre + 1 verbe (+ 1 déterminant) + 1 Nom ou 1 Nom propre + à + 1 verbe à l’infinitif  Pierre incite Marie à partir  patron pousse les employés à démissionner

Proposez une formule permettant de rechercher les occurrences de : 2. Rédiger des formules Proposez une formule permettant de rechercher les occurrences de : a- Venir de faire quelque chose (formes fléchies de venir + de + vb infinitif) &e(c=&cvenir g=V) de &e(g=Inf) b- Prendre part à quelque chose (formes fléchies de prendre + part + à + nom) ATTENTION : pour cette expression, on peut rencontrer : prendre part à / au / aux &e(c=&cprendre g=V) part (à|au|aux) &?(&e(g=D)) &e(g=S)