La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les recherches dans Frantext ATTENTION : Seule la version catégorisée de Frantext permet de désambiguïser les cas dhomographie (en précisant la catégorie.

Présentations similaires


Présentation au sujet: "Les recherches dans Frantext ATTENTION : Seule la version catégorisée de Frantext permet de désambiguïser les cas dhomographie (en précisant la catégorie."— Transcription de la présentation:

1 Les recherches dans Frantext ATTENTION : Seule la version catégorisée de Frantext permet de désambiguïser les cas dhomographie (en précisant la catégorie grammaticale du mot recherché). Avant de lancer une recherche sur un mot (ou une séquence) dans la base non catégorisée, il faut sassurer ce mot (ou cette séquence) ne possède pas une forme homographe appartenant à une autre catégorie grammaticale (ex : pouvoir n.m. vs pouvoir v.inf). Pour les deux bases de Frantext, le formulaire de recherche se présente de la même manière. On accède au formulaire depuis le menu déroulant :

2 Recherches dans la base non catégorisée Malgré le problème de lhomographie, la base non catégorisée de Frantext peut être utilisée pour rechercher des graphies données (mots ou séquences de mots). Toute recherche intervient après avoir défini un corpus de travail. Pour rechercher une forme donnée dun mot, il suffit de « taper » cette forme dans le formulaire de recherche. Exemple : Recherche du mot maison dans La Peau de chagrin 1. Rechercher une graphie donnée

3 On obtient alors le nombre de résultats, que lon peut ensuite visualiser : La visualisation des résultats permet de vérifier si la formule utilisée répond bien à la requête. Si ce nest pas le cas, on peut retourner au formulaire pour corriger la formule, en utilisant licone du navigateur.

4 Ce mode de rédaction permet également de rechercher une séquence donnée. Exemple : Recherche de la séquence maison blanche La recherche dune graphie donnée constitue la manière la plus simple de faire une requête sur Frantext.

5 2. Intégrer des expressions de choix Admettons à présent que lon veuille chercher les séquences suivantes : petite maison, grande maison, jolie maison et vieille maison, qui mettent chacune en jeu un adjectif qualificatif différent. On doit construire une formule qui intègrera un choix entre les différents adjectifs. Lexpression de ce choix se note : (choix1|choix2|choix3|….) Pour cet exemple, la formule sera donc : (petite|grande|jolie|vieille) maison On peut, sur ce principe, combiner plusieurs expressions de choix. Question : à quelles séquences correspond la formule suivante ? homme (riche(et généreux|et célèbre)|pauvre) Réponse : homme riche et généreux, homme riche et célèbre, homme pauvre.

6 3. Intégrer une séquence « quelconque » La notation &q(n1,n2) désigne une suite quelconque de mots dont le nombre est compris entre n1 et n2. Le signe &q peut également être employé seul (sans indication numérale) mais dans ce cas il équivaut à &q(1,1). Exemple : la formule un homme &q riche correspond uniquement aux cas ou un mot quelconque sintercale entre homme et riche (cette formule exclue donc la séquence un homme riche). La formule pour cet exemple serait donc : un homme &q(0,1) riche Ce paramètre est très utile lorsque lon recherche par exemple les occurrences de un homme riche et que lon ne veut pas pour autant exclure les séquences du type un homme très riche ou un homme assez riche. Si lon voulait également inclure les exemples du type un homme bon et riche, on noterait la formule suivante : un homme &q(0,2) riche

7 4. Intégrer une séquence facultative Le symbole &? placé devant une expression signifie que cette expression est facultative. Exemples : a- une &?toute petite voix permettra de rechercher les occurrences de une petite voix et de une toute petite voix. b- une &?(toute petite) voix c- une &?(&?toute petite) voix d- une &?(petite|grosse) voix une voix et une toute petite voix. une voix, une petite voix, une toute petite voix. une voix, une petite voix, une grosse voix.

8 5. Le symbole de négation Le symbole ^ exprime la négation (ou plus exactement, lexclusion). On le place devant lexpression que lon veut rejeter. On peut combiner le symbole de négation à une expression de choix : un homme très ^(gros|vieux|intelligent) Cette formule permet de rechercher toutes les occurrences de un homme très XXX dans lesquelles XXX nest ni égal à gros, ni à riche, ni à intelligent. Exemple : un homme ^très riche Cette formule permet de rechercher toutes les occurrences de un homme XXX riche dans lesquelles XXX nest pas égal à très. On trouvera donc des occurrences telles que un homme excessivement riche.

9 Dans tous les exemples précédents, la recherche portait sur une séquence donnée. Les formes fléchies des mots nétaient donc pas prises en compte. 6. Formes fléchies Codes utilisés pour désigner les formes fléchies : Verbes : &cXXX (exemple : &caimer) Noms et adjectifs : &mXXX (exemples : &mmaison, &msale) Or, il est possible, dans la base non catégorisée de Frantext, de rédiger des formules intégrant les formes fléchies des verbes, noms et adjectifs. ATTENTION : ces formules permettent de rechercher toutes les occurrences des formes qui sécrivent comme une des formes du verbe, du nom ou de ladjectif spécifié, sans aucune garantie quelles appartiennent à la même catégorie grammaticale. Si on lance une recherche &caimer dans la base non catégorisée, on obtiendra également le nom aimant (forme homographe du participe présent du verbe).

10 Rédigez une formule permettant de rechercher toutes les occurrences de lexpression faire peur tout en intégrant les occurrences de faire très peur, faire drôlement peur, etc. (FAIRE + adverbe + peur) Formule : &cfaire &q(0,1) peur Il est vivement conseillé dutiliser les symboles de formes fléchies pour des recherches portant sur des séquences lexicalisées plutôt que sur des mots isolés afin de limiter les problèmes dhomographie, et deffectuer les recherches portant sur les formes fléchies dun mot à partir de la base catégorisée. Exercice dapplication

11 Recherches dans la base catégorisée La base catégorisée de Frantext permet de construire des formules dans lesquelles on spécifie la catégorie grammaticale dun ou plusieurs mots. Pour reprendre lexemple daimer, la base catégorisée va donner la possibilité de spécifier que lon recherche uniquement les formes fléchies du verbe et permettre ainsi dexclure les occurrences du nom aimant. On va également pouvoir rechercher des constructions nues (sans contenu lexical). Exemple : Nom + adverbe + adjectif homme très riche, femme assez sympathique… Lutilisation des fonctions de la base catégorisée nécessite une connaissance du code attribué à chaque catégorie grammaticale.

12 1. Principes généraux Les entités catégorisées (entités dont on va préciser la catégorie grammaticale) sont introduites par &e et suivies du code grammatical correspondant entre parenthèses. La plupart des règles décriture utilisées dans la base non catégorisée sont réutilisables dans la base catégorisée. Il faut seulement combiner les éléments de la requête en respectant certains principes. Exemples de notations : 1- Pour une recherche de substantifs : &e(g=S) 2- Pour une recherche de verbes : &e(g=V) 3- Pour une recherche de substantifs ou de noms propres : &e(g=S Np) Le signe ! accolé à g signifie que lon ne veut pas que lentité catégorisée appartienne à la catégorie grammaticale spécifiée. Exemple : &e(g!=V) désigne une entité catégorisée qui nest pas un verbe.

13 Reprenons à présent lexemple du verbe aimer et supposons que nous ayons à construire la formule précisant que seules les occurrences verbales nous intéressent. Il va falloir mentionner le mot dont on va préciser la catégorie grammaticale. 2. Préciser la catégorie grammaticale dun mot Formule pour lexemple du verbe aimer : &e(c=&caimer g=V) La mention dun mot se note c=MOT A linverse, si seules les occurrences du nom aimant nous intéressent : &e(c=&maimant g=S) On peut, sur le même principe, rechercher une forme particulière dun mot (et non les formes fléchies) : &e(c=pouvoir g=S)

14 Exercices 1. Déchiffrer des formules Proposez un exemple doccurrence que lon obtiendrait avec chacune des formules suivantes : a- &e(g=S) &e(g=Adv) &e(g=Apr) b- comment &e(c=&cpouvoir g=V) - (tu|vous) &e(g=Inf) cela c- &e(g=S Np) &e(g=V) &?(&e(g=D)) &e(g=S Np) à &e(g=Inf) Nom + Adverbe + Adjectif participe présent histoire très amusante Comment + verbe pouvoir tu ou vous + 1 verbe à linfinitif + cela Comment pouvez-vous dire cela 1 Nom ou 1 Nom propre + 1 verbe (+ 1 déterminant) + 1 Nom ou 1 Nom propre + à + 1 verbe à linfinitif Pierre incite Marie à partir patron pousse les employés à démissionner

15 2. Rédiger des formules Proposez une formule permettant de rechercher les occurrences de : a- Venir de faire quelque chose (formes fléchies de venir + de + vb infinitif) &e(c=&cvenir g=V) de &e(g=Inf) b- Prendre part à quelque chose (formes fléchies de prendre + part + à + nom) ATTENTION : pour cette expression, on peut rencontrer : prendre part à / au / aux &e(c=&cprendre g=V) part (à|au|aux) &?(&e(g=D)) &e(g=S)


Télécharger ppt "Les recherches dans Frantext ATTENTION : Seule la version catégorisée de Frantext permet de désambiguïser les cas dhomographie (en précisant la catégorie."

Présentations similaires


Annonces Google