La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Une expérience d’analyse syntaxique calculatoire minimale Jacques Vergne GREYC - Université de Caen

Présentations similaires


Présentation au sujet: "Une expérience d’analyse syntaxique calculatoire minimale Jacques Vergne GREYC - Université de Caen"— Transcription de la présentation:

1 Une expérience d’analyse syntaxique calculatoire minimale Jacques Vergne GREYC - Université de Caen

2 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-2- - Objectifs du Groupe Syntaxe recherche de solutions minimales : pour une tâche donnée, minimiser les moyens utilisés - tout petits programmes - algorithmes très simples - solutions calculatoires (pas d’exploration combinatoire) - bases linguistiques minimales :. utilisation de très peu de propriétés, seulement celles qui servent aux calculs. très peu de ressources (lexicales, morphologiques, typographiques)

3 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-3- - Caractéristiques de l'expérience à titres expérimental et pédagogique, choix d'une tâche classique, limitée et (apparemment) simple : détecter et relier sujets et verbes avec le plus petit programme possible

4 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-4- - Un "analyseur-relieur" multilingue (anglais, français, italien, espagnol ou allemand) avec diagnostic de langue descendant : texte --> chunk, sans aller jusqu'au mot écrit en perl, de moins de 100 Ko, ressources comprises

5 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-5- - Un exemple de sortie 0 : dLe projet S sing principale --> 3 V 1 : [pd'appareil géant 2 : [pde : [pà 600 places A3XX ssconstitue V <-- 0 S sing V <-- 4 O 4 : [dun autre défi O --> 3 V 5 : [,, 6 : [Pmême si P 7 : [dson lancement n'Vest pas décidé. SV sing

6 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-6- - Étapes du traitement : xxx.html —extraction—> corps de texte : FRANCE: AÉRONAUTIQUE · BOEING VA MODERNISER SES 777 ET 747 POUR CONCURRENCER L'AIRBUS A340 TRÈS LONG-COURRIER. (TBNDF) Le groupe américain compte lancer un programme capable de concurrencer la version très long-courrier de l'Airbus A340. Celui-ci détient le record de la distance franchissable. Le match continue et ne faiblit pas: en réponse au programme des deux nouveaux quadriréacteurs de la gamme A340, les A et A , Boeing prévoit de décoller dans le sillage de ces concurrents en développant trois versions nouvelles de son gros biréacteur 777 et du célèbre 747. Car Airbus a lancé un nouveau défi à celui qui reste le premier constructeur mondial. L'avionneur de Toulouse a en effet développé, à partir de son A340, dont 261 exemplaires ont été commandés au 31 janvier dernier et 153 livrés, une version à très long rayon d'action, l'A , capable de franchir kilomètres avec 313 passagers, soit la distance la plus longue jamais parcourue par un avion de ligne. Un second modèle de cette version à rayon d'action record complète la gamme: l'A ne franchira « que » kilomètres, mais avec une capacité de 380 sièges. Airbus avait déjà réussi le défi lancé à Boeing avec sa famille A320 et ses versions dérivées, A321 et A319, en attendant bientôt l'A318, face au 737 qui demeure l'avion de ligne le plus vendu de l'histoire de l'aviation civile (3.450 exemplaires). Le projet d'appareil géant de 550 à 600 places A3XX constitue un autre défi, même si son lancement n'est pas décidé. Le groupe de Seattle ne pouvait rester les bras croisés alors qu'Airbus multiplie les offensives, en réussissant même à collectionner une kyrielle d'opérateurs aux Etats-Unis et en détrônant Boeing chez des clients aussi prestigieux, et jusque-là fidèles, que British Airways par exemple. D'où la réponse que le numéro un mondial veut apporter avec de nouvelles versions de son 777 et 747 pour contrer son adversaire. Selon John Roundhill, responsable de la stratégie Produits et Développement de la firme américaine, l'objectif consiste à procéder au lancement des nouveaux appareils à la mi-2000 pour une livraison en Ceci, précise-t-on à Seattle, si un nombre suffisant de clients affirme son intérêt pour ce type d'appareil. Le retard sur les nouveaux A340 serait limité à quelque six mois. Le 777, le plus grand biréacteur jamais mis en service, a été lancé voici quatre ans, et à l'époque son constructeur annonçait la possibilité d'une version à plus long rayon d'action. Le projet consiste maintenant à développer un X de 280 sièges capable de voler 900 kilomètres de plus, selon son fabricant, que l'A Et un X qui pourra voler sur kilomètres. 17 à 19 heures sans escale... De plus, un à capacité accrue (500 passagers sur kilomètres) devrait voir le jour. Une initiative qui pourrait sauver ce programme du déclin: 60 de ces appareils ont été vendus l'an dernier, 47 commandes sont attendues cette année et le niveau des ventes pourrait bien stagner à une quinzaine par an d'ici à La fin de la crise asiatique et la nouvelle version devrait faire remonter les commandes. Ces nouveaux Airbus et Boeing seront aptes à rester en vol sans escale pendant 17 à 19 heures... De surcroît, Boeing espère que ce 747 restylé, avec ses capacités nettement accrues, sera suffisant pour concurrencer le projet d'A3XX en gestation à Toulouse. Après avoir douté de l'existence d'un marché suffisant pour des avions aussi grands, Boeing estime maintenant la demande potentielle à quelque 350 unités d'ici à Patrick Marx. La Tribune (not to be redisseminated) Tel: +33 (0) LA TRIBUNE (FRENCH LANGUAGE) 26/04/1999 (C)Copyright 1996 Reuters Limited. All rights reserved. Republication or redissemination of the contents of this screen are expressly prohibited without the written consent of Reuters Limited overnment official, who said earlier that Kabila had left for the southern city of Lubumba

7 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-7- - Étapes du traitement : segmentation en phrases Le projet d'appareil géant de 550 à 600 places A3XX constitue un autre défi, même si son lancement n'est pas décidé.

8 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-8- - Étapes du traitement : pose de balises de début de segment dLe projet [pd'appareil géant [pde 550 [pà 600 places A3XX constitue [dun autre défi[,, [Pmême si [dson lancement n'est pas décidé.

9 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-9- - Étapes du traitement : pose de balises d'auxiliaires dLe projet [pd'appareil géant [pde 550 [pà 600 places A3XX constitue [dun autre défi[,, [Pmême si [dson lancement n'Vest pas décidé.

10 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Étapes du traitement : découpage en segments sur [ dLe projet [pd'appareil géant [pde 550 [pà 600 places A3XX constitue [dun autre défi [,, [Pmême si [dson lancement n'Vest pas décidé. segments obtenus par découpage en virgulots, puis en chunks approchés (voir le "segment" de Thomas Lebarbé)

11 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale Étapes du traitement : traitement répétitif sur les segments

12 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale 1 : [pd'appareil géant Étapes du traitement : traitement répétitif sur les segments

13 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale 1 : [pd'appareil géant 2 : [pde 550 Étapes du traitement : traitement répétitif sur les segments

14 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale 1 : [pd'appareil géant 2 : [pde : [pà 600 places A3XX constitue Étapes du traitement : traitement répétitif sur les segments

15 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale --> 3 V 1 : [pd'appareil géant 2 : [pde : [pà 600 places A3XX ssconstitue V <-- 0 S sing Étapes du traitement : traitement répétitif sur les segments

16 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale --> 3 V 1 : [pd'appareil géant 2 : [pde : [pà 600 places A3XX ssconstitue V <-- 0 S sing 4 : [dun autre défi Étapes du traitement : traitement répétitif sur les segments

17 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale --> 3 V 1 : [pd'appareil géant 2 : [pde : [pà 600 places A3XX ssconstitue V <-- 0 S sing V <-- 4 O 4 : [dun autre défi O --> 3 V Étapes du traitement : traitement répétitif sur les segments

18 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale --> 3 V 1 : [pd'appareil géant 2 : [pde : [pà 600 places A3XX ssconstitue V <-- 0 S sing V <-- 4 O 4 : [dun autre défi O --> 3 V 5 : [,, Étapes du traitement : traitement répétitif sur les segments

19 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale --> 3 V 1 : [pd'appareil géant 2 : [pde : [pà 600 places A3XX ssconstitue V <-- 0 S sing V <-- 4 O 4 : [dun autre défi O --> 3 V 5 : [,, 6 : [Pmême si P Étapes du traitement : traitement répétitif sur les segments

20 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale --> 3 V 1 : [pd'appareil géant 2 : [pde : [pà 600 places A3XX ssconstitue V <-- 0 S sing V <-- 4 O 4 : [dun autre défi O --> 3 V 5 : [,, 6 : [Pmême si P 7 : [dson lancement n'Vest pas décidé. SV sing Étapes du traitement : traitement répétitif sur les segments

21 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale Relier sujet - verbe et détection du verbe chunk nominal singulier empilé dans la pile S->V Sujet en attente de Verbe pile S->V = 0 = position

22 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale 1 : [pd'appareil géant 2 : [pde 550 chunks prépositionnels suivants Relier sujet - verbe et détection du verbe

23 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale 1 : [pd'appareil géant 2 : [pde : [pà 600 places A3XX constitue s'il y a un chunk nominal singulier empilé dans la pile S->V pile S->V = 0 (Sujet en attente de Verbe) et si un mot se termine par -e = marque d'accord au singulier Relier sujet - verbe et détection du verbe

24 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe projet S sing principale --> 3 V 1 : [pd'appareil géant 2 : [pde : [pà 600 places A3XX ssconstitue V <-- 0 S sing s'il y a un chunk nominal singulier empilé dans la pile S->V (Sujet en attente de Verbe) et si un mot se termine par -e (marque d'accord au singulier) alors ce mot est le Verbe le Sujet en attente est vraiment le Sujet et on peut les relier : 0 S --> 3 V Relier sujet - verbe et détection du verbe

25 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Relier sujet - verbe et choix du sujet s'il y a plusieurs sujets en attente empilés dans la pile S->V : lequel choisir ? le premier du domaine propositionnel courant domaine propositionnel = depuis le début de la proposition en cours

26 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Relier sujet - verbe : verbe provisoire 0 : dLe prix catalogue S sing principale --> 1 V 1 : [pde dl'A318 Vest fixé V sing <-- 0 S sing 2 : [pà 36 millions 3 : [pde dollars.

27 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe prix catalogue Relier sujet - verbe : verbe provisoire

28 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe prix sscatalogue SV sing principale Relier sujet - verbe : verbe provisoire catalogue : verbe provisoire empilé dans Vadj->V 0

29 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe prix sscatalogue S sing principale 1 : [pde dl'A318 Vest fixé V sing arrivée du verbe réel Relier sujet - verbe : verbe provisoire

30 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe prix catalogue S sing principale --> 1 V 1 : [pde dl'A318 Vest fixé V sing <-- 0 S sing arrivée du verbe réel, qui annule le verbe provisoire et le dépile de Vadj->V Relier sujet - verbe : verbe provisoire

31 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC : dLe prix catalogue S sing principale --> 1 V 1 : [pde dl'A318 Vest fixé V sing <-- 0 S sing 2 : [pà 36 millions 3 : [pde dollars. Relier sujet - verbe : verbe provisoire

32 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Relier A - B : les différentes piles chaque pile permet de traiter un type d'attente et de relation : S->V Sujet -> Verbe V->O Verbe -> Objet Vadj->V Verbe-adjectif -> Verbe V->cV Verbe -> Verbe coordonné SV->cSV Sujet-Verbe -> Sujet-Verbe coordonné

33 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Relier A - B : les différentes piles en allemand, d'autres types de relations : Allerdings existiert der Kleinsaurier, der über einen buschigen Schwanz verfügt haben könnte, bislang nur auf schlechten Fotos. V->S Verbe -> Sujet

34 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Relier A - B : les différentes piles en allemand, d'autres types de relations : Allerdings existiert der Kleinsaurier, der über einen buschigen Schwanz verfügt haben könnte, bislang nur auf schlechten Fotos. V->S Verbe -> Sujet Q->V pronom relatif -> Verbe

35 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Relier A - B : les différentes piles en allemand, d'autres types de relations : Weltweite Berühmtheit hatte der Chirurg erlangt als er im Dezember 1967 im Groote-Schuur-Krankenhaus in Kapstadt die erste Herztransplantation der Welt vornahm. Vaux->z auxiliaire -> auxilié

36 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Relier A - B : les différentes piles en allemand, d'autres types de relations : Weltweite Berühmtheit hatte der Chirurg erlangt als er im Dezember 1967 im Groote-Schuur-Krankenhaus in Kapstadt die erste Herztransplantation der Welt vornahm. Vaux->z auxiliaire -> auxilié K->V pronom personnel -> Verbe

37 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Relier A - B : les différentes piles en allemand, d'autres types de relations : So muss Busch als Referentin unter Umständen die Rede ihres Chefs schreiben. Vaux->I auxiliaire -> infinitif

38 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Interaction entre les processus de mise en relation une fois les segments A et B reliés, les segments entre A et B ne peuvent plus être reliés à un segment situé après B on oublie toute attente de segment entre A et B on dépile tout segment entre A et B de toutes piles A et B peuvent aussi être ( ) - -,, A B X

39 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : xxx.html —extraction—> corps de texte PRESS DIGEST - United Arab Emirates - Feb 16 01:07 a.m. Feb 16, 1999 Eastern DUBAI, Feb 16 (Reuters) - These are some of the leading stories in newspapers in the United Arab Emirates on Tuesday. Reuters has not verified these stories and does not vouch for their accuracy. KHALEEJ TIMES - Japan's Hamamatsu, Westminster of Britain, Ptuj of Slovenia and Broughshane of Northern Ireland get ``Nation in Bloom'' ecological awards, after a contest held in the UAE city of al-Ain. - OPEC members are expected to cut oil output this month paving the way for an agreement on further production cuts in March, the UAE oil ministry said. GULF NEWS - The Dubai Court of Appeals upholds a death sentence against a 24-year-old UAE national convicted of drug dealing. - UAE trade with Japan slipped 23.5 percent in 1998 to $5.7 billion, largely due to lower oil prices, according to figures published by the Japan External Trade Organisation. THE GULF TODAY - Dubai jewellery makers to produce the world's longest gold chain. It is planned to be one km (0.6 mile) long, may be extended to three kms, and will be sold in pieces during the city's upcoming shopping festival. - Dubai planning a 260 million dirham ($70.8 million) new vegetable market. AL-BAYAN - Dubai government-owned Emirates airline will take delivery of the first Airbus A in March. Emirates in 1997 confirmed a deal with Airbus Industrie ARBU.CN to purchase 16 A aircraft and a company statement issued in September 1998 said it had ordered a 17th aircraft of the same type. AL-KHALEEJ - Abu Dhabi Cooperative reported a 166 percent rise in profits to 280 million dirhams, and plans to distribute 45.8 million dirhams to members. AL-ITTIHAD - Sheikha Fatima bint Mubarak, wife of President Sheikh Zaid bin Sultan al-Nahayan, will travel to Jordan to offer condolences to the royal Hashemite family for the death of King Hussein. ($ dirhams) ((Gulf newsroom, , fax , dubai.newsroom+reuters.com))

40 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : segmentation en phrases Emirates in 1997 confirmed a deal with Airbus Industrie ARBU.CN to purchase 16 A aircraft and a company statement issued in September 1998 said it had ordered a 17th aircraft of the same type.

41 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : pose de balises de début de segment Emirates [pin 1997 confirmed [da deal [pwith Airbus Industrie ARBU.CN [pto purchase 16 A aircraft [cand [da company statement issued [pin September 1998 said it had ordered [da 17th aircraft [pof dthe same type.

42 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : pose de balises d'auxiliaires, pronoms,... Emirates [pin 1997 ssspconfirmed [da deal [pwith Airbus Industrie ARBU.CN [pto purchase 16 A aircraft [cand [da company statement issued [pin September 1998 Vsaid [P[Kit KVVhad ssspordered [da 17th aircraft [pof dthe same type.

43 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : découpage en segments sur [ 0 : Emirates 1 : [pin 1997 ssspconfirmed 2 : [da deal 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand 6 : [da company statement issued 7 : [pin September 1998 Vsaid 8 : [P 9 : [Kit KVVhad ssspordered 10 : [da 17th aircraft 11 : [pof dthe same type.

44 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur

45 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur 1 : [pin 1997 ssspconfirmed

46 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V 1 : [pin 1997 ssspconfirmed V <-- 0 S plur

47 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V 1 : [pin 1997 ssspconfirmed V <-- 0 S plur 2 : [da deal

48 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V

49 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN

50 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft

51 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand

52 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand 6 : [da company statement ssissued SV sing

53 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand 6 : [da company statement ssissued SV sing 7 : [pin September 1998 Vsaid

54 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V -&&-> 6 SV 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand 6 : [da company statement ssissued SV sing <-&&- 0 7 : [pin September 1998 Vsaid

55 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V -&&-> 6 SV 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand 6 : [da company statement issued S sing 7 V 7 : [pin September 1998 Vsaid V <-- 6 S sing

56 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V -&&-> 6 SV 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand 6 : [da company statement issued S sing 7 V 7 : [pin September 1998 Vsaid V <-- 6 S sing 8 : [P

57 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V -&&-> 6 SV 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand 6 : [da company statement issued S sing 7 V 7 : [pin September 1998 Vsaid V <-- 6 S sing 8 : [P 9 : [Kit KVVhad ssspordered SV sing

58 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V -&&-> 6 SV 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand 6 : [da company statement issued S sing 7 V 7 : [pin September 1998 Vsaid V <-- 6 S sing 8 : [P 9 : [Kit KVVhad ssspordered SV sing 10 : [da 17th aircraft

59 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V -&&-> 6 SV 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand 6 : [da company statement issued S sing 7 V 7 : [pin September 1998 Vsaid V <-- 6 S sing 8 : [P 9 : [Kit KVVhad ssspordered SV sing V <-- 10 O 10 : [da 17th aircraft O --> 9 V

60 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en anglais : traitement répétitif sur les segments 0 : Emirates S plur principale --> 1 V -&&-> 6 SV 1 : [pin 1997 ssspconfirmed V <-- 0 S plur V <-- 2 O 2 : [da deal O --> 1 V 3 : [pwith Airbus Industrie ARBU.CN 4 : [pto purchase 16 A aircraft 5 : [cand 6 : [da company statement issued S sing 7 V 7 : [pin September 1998 Vsaid V <-- 6 S sing 8 : [P 9 : [Kit KVVhad ssspordered SV sing V <-- 10 O 10 : [da 17th aircraft O --> 9 V 11 : [pof dthe same type.

61 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : xxx.html —extraction—> corps de texte UNA CRISIS DE CONFIANZA QUE PUEDE CONDUCIR A UNA RECESION E l de ayer fue otro día negro, que cierra una semana negra dentro de un ejercicio negro para los mercados internacionales de capitales. La Bolsa de Madrid cayó de nuevo un 2%, marcando el cuarto mínimo anual en cinco días, un hecho del que es difícil encontrar precedentes. El Ibex-35 ha perdido un 7% esta semana, un porcentaje parecido a las caídas registradas en Londres, París, Francfort y Milán. La Bolsa de Tokio cerró ayer a su nivel más bajo en 17 años mientras que Wall Street consumaba pérdidas por encima del 20% desde mayo pasado. Las estadísticas son demoledoras. Un dato que ilustra la magnitud del desastre: la cotización de Telefónica, el principal valor de la Bolsa española, ha descendido un 66% desde marzo del año pasado. Ello supone que la compañía vale hoy casi ocho billones de pesetas menos que hace 18 meses. La debacle de ayer se explica en parte por el aumento del paro en EEUU, que subió un 0,4% en agosto hasta situarse en el 4,9% de la población activa, la peor estadística desde El consumo sigue manteniéndose en niveles aceptables en EEUU, pero los beneficios de las empresas y la inversión han experimentado una fuerte contracción. EEUU, con un crecimiento del 2%, ha dejado de tirar de la economía mundial como lo venía haciendo desde Pero Europa no ha sido capaz de tomar el relevo. Alemania da alarmantes signos de debilidad, mientras que Japón, el tercer gigante de la economía mundial, sigue sumido en una profunda recesión que ha llevado a sus grandes compañías a efectuar despidos sin precedentes. Es la primera vez desde la crisis del petróleo de 1979 que las economías de EEUU, Europa y Japón se hallan simultáneamente estancadas, lo cual ya está teniendo efectos muy negativos sobre el comercio mundial. Pero lo peor está probablemente por venir, ya que el principal temor es que el hundimiento de las Bolsas acabe por afectar al consumo. Ocho millones de españoles han invertido parte de sus ahorros en acciones. Sus importantes pérdidas van a acabar notándose en la ventas de automóviles o en la adquisición de viviendas, con el efecto boomerang que ello produce sobre la inversión y el empleo en estos y otros sectores. Ningún analista es capaz de predecir dónde está el final de esta crisis de confianza. Pero sería un error minusvalorar la repercusión de este desplome, ya que, aunque los histéricos comportamientos de los mercados no guardan siempre relación con la economía real, una bajada fuerte y sostenida de las Bolsas acabará por crear las condiciones de una recesión, hoy todavía evitable. ¿Está usted de acuerdo con estas opiniones? Aporte sus ideas en el foro abierto sobre cada editorial en la dirección:

62 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : segmentation en phrases La Bolsa de Tokio cerró ayer a su nivel más bajo en 17 años mientras que Wall Street consumaba pérdidas por encima del 20% desde mayo pasado.

63 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : pose de balises de début de segment dLa Bolsa [pde Tokio cerró ayer [pa dsu nivel más bajo [pen 17 años [Pmientras que [Wall Street consumaba pérdidas [ppor encima [pdel 20% [pdesde mayo pasado.

64 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : découpage en segments sur [ 0 : dLa Bolsa 1 : [pde Tokio cerró ayer 2 : [pa dsu nivel más bajo 3 : [pen 17 años 4 : [Pmientras que 5 : [Wall Street consumaba pérdidas 6 : [ppor encima 7 : [pdel 20% 8 : [pdesde mayo pasado.

65 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale

66 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale 1 : [pde Tokio cerró ayer

67 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale --> 1 V 1 : [pde Tokio sscerró ayer V <-- 0 S sing

68 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale --> 1 V 1 : [pde Tokio sscerró ayer V <-- 0 S sing 2 : [pa dsu nivel más bajo

69 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale --> 1 V 1 : [pde Tokio sscerró ayer V <-- 0 S sing 2 : [pa dsu nivel más bajo 3 : [pen 17 años

70 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale --> 1 V 1 : [pde Tokio sscerró ayer V <-- 0 S sing 2 : [pa dsu nivel más bajo 3 : [pen 17 años 4 : [Pmientras que P

71 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale --> 1 V 1 : [pde Tokio sscerró ayer V <-- 0 S sing 2 : [pa dsu nivel más bajo 3 : [pen 17 años 4 : [Pmientras que P 5 : [Wall Street consumaba pérdidas

72 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale --> 1 V 1 : [pde Tokio sscerró ayer V <-- 0 S sing 2 : [pa dsu nivel más bajo 3 : [pen 17 años 4 : [Pmientras que P 5 : [Wall Street ssconsumaba pérdidas SV sing

73 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale --> 1 V 1 : [pde Tokio sscerró ayer V <-- 0 S sing 2 : [pa dsu nivel más bajo 3 : [pen 17 años 4 : [Pmientras que P 5 : [Wall Street ssconsumaba pérdidas SV sing 6 : [ppor encima

74 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale --> 1 V 1 : [pde Tokio sscerró ayer V <-- 0 S sing 2 : [pa dsu nivel más bajo 3 : [pen 17 años 4 : [Pmientras que P 5 : [Wall Street ssconsumaba pérdidas SV sing 6 : [ppor encima 7 : [pdel 20%

75 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC Un exemple en espagnol : traitement répétitif sur les segments 0 : dLa Bolsa S sing principale --> 1 V 1 : [pde Tokio sscerró ayer V <-- 0 S sing 2 : [pa dsu nivel más bajo 3 : [pen 17 años 4 : [Pmientras que P 5 : [Wall Street ssconsumaba pérdidas SV sing 6 : [ppor encima 7 : [pdel 20% 8 : [pdesde mayo pasado.

76 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC amorce lexicale multilingue de 100 à 200 "mots" / langue.pl < 100 Ko analyse descendante : phrases, virgulots, chunks approchés (frontière NV localisée au moment de la détection du verbe) traitement répétitif sur les chunks approchés un chunk en attend un autre, par jeu des piles S->V V->O Vadj->V V->cV SV->cSV mise en relation en 2 temps : empilement, dépilement verbe reconnu par l'attente d'un sujet, et par sa finale accordée interaction entre les processus de mise en relation Moyens du traitement

77 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-77- conclusions (provisoires) des tâches classiques sont faisables avec des moyens minimaux (d'autres tâches moins classiques aussi, cf. Nadine Lucas et Emmanuel Giguet) l'économie de moyens facilite le travail : - économie de ressources lexicales - facilité d'ajout d'une langue - toujours au dessus du mot (pas de différence entre mot et locution) encore du chemin... -

78 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-78- fin de l'exposé vous pouvez télécharger cette présentation sur voir aussi ma présentation à TALN 2001 sur voir aussi mon tutoriel du Coling 2000 "Trends in Robust Parsing" sur (présentation et références) -

79 9/10/2001 © Jacques Vergne Séminaire I3 du GREYC-79- vos questions ? -


Télécharger ppt "Une expérience d’analyse syntaxique calculatoire minimale Jacques Vergne GREYC - Université de Caen"

Présentations similaires


Annonces Google