Introduction à l’utilisation des corpus Introduction aux expressions régulières.

Slides:



Advertisements
Présentations similaires
BV2 Chapitre 6 Structures
Advertisements

Travailler avec un document authentique
Expressions Régulières
Les Structures.
CREER UN BLOG Avec la plateforme KaZéo
La recherche documentaire
L-System et modélisation de plantes…
Transformation de documents XML
DTD Sylvain Salvati
La phrase interrogative
Varier les Démarches d’apprentissage
Se créer un (ou plusieurs) mot(s) de passe sécurisé(s)
ANDRE Marine DABIN Julie WATERLOT Amandine
Base de Données "Titres" Projet "Visu" Réalisée dans le cadre de la maîtrise IL.
Introduction : Compilation et Traduction
La Recherche en Ligne.
L’histoire du Livre Le livre est l'ensemble de feuilles ma-nuscrites ou imprimées, cousues ou reliées jointes et qui forment un volume ordonné pour sa.
Les recherches dans Frantext
LOG 02 Bases de Données Avancées Rappels sur JSP / Servlet
IFT313 Introduction aux langages formels
Points importants de la semaine Les commentaires. Les variables. Les instructions conditionnelles. Les instructions itératives (les boucles).
Cours de programmation
UNE FOIS POUR TOUTES LEÇON 9
17 octobre 2012 Grégory Petit
Initiation aux bases de données et à la programmation événementielle
Bases de données lexicales
A- Fonctions du tableau Le tableau est le support de l'écrit ou de schémas. Il a des fonctions multiples: 1- Une fonction d'information: - objectifs de.
Introduction à la structuration des documents: les techniques M2: Gestion des connaissances.
Limparfait. Quest-ce que limparfait Cest un autre temps pour décrire les évènements dans le passé. It is a past tense, but instead of describing explicit.
Les pointeurs Modes d’adressage de variables. Définition d’un pointeur. Opérateurs de base. Opérations élémentaires. Pointeurs et tableaux. Pointeurs et.
SEANCE 10 Python Entrée et sortie de fichiers Lycée Louis Vincent Lundi 20 janvier
Moteur de recherche d’information
Semaine #1 INF130 par Frédérick Henri.
Semaine #1 INF135 par Frédérick Henri.
P. Van Roy, LINF1251 LINF1251: Le Langage Java Peter Van Roy Département dIngénierie Informatique, UCL
UNE FOIS POUR TOUTES LEÇON 9
PhP-MySQL Pagora 2012/2013 CTD 1 - Presentation de moi ^^
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Questions abordées Aujourd’hui Qu’est-ce qu’une expression régulière ?
PHP & My SQL.
L’observation réfléchie de la langue
CSI3525: Concepts des Langages de Programmation Notes # 13: Introduction au SmallTalk.
La recherche documentaire
Recherche sur Internet Présentation destinées au CAID tiré pour l’essentiel de
Le langage Racket (Lisp)
1. Se poser des questions Prendre du temps au départ
LA RECHERCHE DOCUMENTAIRE
Comment aborder la tâche?
1 PHP 5 Notions fondamentales (niveau 1 cours #4) Formation continue – Cégep de Sainte-Foy.
Fonctions avancées et graphiques
Points importants de la semaine Les caractères.
Les transducteurs En anglais transducers.
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
COMMENT FAIRE UNE AFFICHE D’EXPOSE?
A la leçon de français. Les feuilles d’automne Les saisons de l’anneé.
Introduction à la programmation (420-PK2-SL) cours 11 Gestion des applications Technologie de l’information (LEA.BW)
Scripts et fonctions Instructions de contrôle
Algorithmique Tableaux de données
Philippe Gandy - 8 septembre 2015 Basé sur les notes de cours de Daniel Morin et Roch Leclerc.
Initiation aux bases de données et à la programmation événementielle
Initiation aux bases de données et à la programmation événementielle
LA NUTRITION POUR TOUS Par Nicolas Bannester. Fundamentals of human nutrition  GEISSLER, Catherine. Fundamentals of human nutrition : for students and.
A la découverte d’Excel Certificat Informatique et Internet.
Faire un dossier documentaire
1. Les terminaisons: --ai --ons --as--ez --a--ont Le Futur: “will” Amsco=p
Préparer une épreuve de français (2 e année secondaire) Ms Mary Josephine Zammit INSET 2012 Examen de la mi-février.
UNITÉ 13 |ÇA SERT A TOUT! Quiz/composition: Lundi 21 Avril.
APP-TSWD Apprentissage Par Problèmes Techniques des Sites Web Dynamiques Licence Professionnelle FNEPI Valérie Bellynck, Benjamin Brichet-Billet, Mazen.
Transcription de la présentation:

Introduction à l’utilisation des corpus Introduction aux expressions régulières

Questions abordées  Aujourd’hui (18 Octobre 2006)  Qu’est-ce qu’une expression régulière ?  A quoi peut servir une expression régulière ?  Comment construire des patrons ?  Comment faire des requêtes avec TextStat/Wall en utilisant les expressions régulières.

Qu’est-ce qu’une expression régulière ?  Qu’ont en commun les expressions suivantes ?  Enlarge Image (125K)  Enlarge Image (273K)  Enlarge Image (159K)  Ou alors  volatile, volatile-rich, volatilization, volatility, volatilize ?  écrire, écrirais, écrivons, écrirons ….  Comment pourrait-on décrire une url ?  Ou une date ?

Qu’est-ce qu’une expression régulière ?  formule écrite dans un langage* crée dans le but de pouvoir décrire d’une façon concise des classes de chaînes de caractères  repérage de ‘patrons’ ou ‘motifs’  chaîne de caractères = suite de symboles  caractère = lettres, nombres, ponctuation, espaces, tabs

A quoi sert une expression régulière ?  Les applications sont immenses et vous en aurez certainement besoin un jour !!!  Rechercher/remplacer des séquences spécifiques dans les corpus. (en formulant un patron qu’on recherche)  Les outils de traitement de texte, concordanciers permettent en général des requêtes pas expressions régulières  La syntaxe des expressions régulières peut varier mais les utilités sont les mêmes.

Comment construire des patrons ? (Syntaxe des expressions régulières)

Comment construire des patrons ? 1. Chaînes de caractères  les plus simples expressions : chaînes de caractères :  « house »  « House »  « out of »  Exceptions : les caractères spéciaux   Ils doivent être ‘protégés’ par le symbole \.\^$|[ ]( )

Comment construire des patrons ? 2. La disjonction (alternatives)  caractères alternatifs  [HhMm]ouse  r[iau]ng  i[sz]e  [ ]  [aeiou]  chaîne de caractères alternatives  in (any|every)  volcano|lava

Comment construire des patrons ? 3. Intervalles  [0-9]  [a-z]  [A-Z]  [a-c]  Autres exemples d’ensembles(alternatives) :  [0-9a-zA-Z]  [a-zàèêëéïüùç]

Comment construire des patrons ? 4. La négation  [^A-Z]  [^aeoiuy]  [^Dd] ni D ni d

Comment construire des patrons ? 5. Quantificateurs  ? représente 0 ou 1 occurrence de l‘expression qui précède  Ex : arbres?  arbre | arbres  colou?r  color | colour  interest(s|(ed|ing)(ly)?)?  (school)? Bus(es)?  * 0 ou plus occurrences de l’expression qui le précède  lo*ng  lng, long, loong, looong, loooong  + au moins une occurrence  as [a-z]+ as  volatil[a-z]+

Comment construire des patrons ? 5. Autres quantificateurs  lo{1,3}ng  long, loong, looong  as ([a-z]+ ){1,3}as

Comment construire des patrons ? 6. Un dernier point  le symbole. remplace n’importe quel caractère (caractère joker)  r.ng  ring, rang, rbng, r4ng, r.ng, rng  r.*ng -> rng, rdshfksdhng, riiing, etc.  wait.{0,14} for  the more.{0,30} the more  the (more|less).{0,30} the (more|less)

Comment construire des patrons ? Exercices  Écrire les expressions régulières correspondant aux  les mots commençant par over–  les mots finissant par –ion  formes du verbe ask  formes des verbes finissant par –ise/–ize  adresses é mail  sites web  dates.