La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 20081 Catégories discursives et de « mise en texte » (vers une « sémantique discursive.

Présentations similaires


Présentation au sujet: "Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 20081 Catégories discursives et de « mise en texte » (vers une « sémantique discursive."— Transcription de la présentation:

1 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Catégories discursives et de « mise en texte » (vers une « sémantique discursive » et son traitement automatique) Jean-Pierre Desclés LaLIC « La ngages, L ogiques, I nformatique, C ognition» Université de Paris-Sorbonne Université de Lyon, ENS, vendredi 4 avril 2008

2 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Plan de lexposé 1.Cadre théorique de référence1.Cadre théorique de référence 2. Trois composantes dune langue2. Trois composantes dune langue 3. Un exemple de structuration discursive3. Un exemple de structuration discursive 4. Terchnique linguistico-computationnelle dExploration Contextuelle4. Terchnique linguistico-computationnelle dExploration Contextuelle 5. Machine à annoter automatiquement, la machine EXCOM5. Machine à annoter automatiquement, la machine EXCOM 6. Un exemple dannotations discursives dun texte : un texte de Maurice Gross6. Un exemple dannotations discursives dun texte : un texte de Maurice Gross 7. Comment construire les règles ?7. Comment construire les règles ?

3 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril I. Cadre théorique de référence 1.Le langage et les langues 2.Modèles formels et computationnels 3.Théorie / Applications 4.Concepts aux fondements de la démarche : dialogisme, abduction, catégorisation …

4 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Quelques idées fortes 1.Trois composantes dune langue : lexicale; grammaticale; discursive. 1.Le grammatical est le squelette dune langue, le lexique en est la chair. 2.La composante discursive est structurante ; elle permet une annotation sémantique automatique de textes, ce qui conduit à de nouveaux modes dexploitation des informations textuelles.

5 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Le grammatical structure les langues La distinction « mots pleins » (le lexique) et « mots vides » (les unités grammaticales) nest pas opératoire pour lanalyse des langues. => Traitements statistiques Le grammatical (à ne pas réduire au syntaxique !) est le support de significations hautement structurantes.

6 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Structures discursives signifiantes dans les textes (discours) Structures discursives signifiantes dans les textes (discours) Un texte possède : - une structure physique (cf. SegaText); - une structure discursive qui a une portée sémantique.

7 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Découpages dune langue

8 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Découpage hiérarchique «classique » : Découpage hiérarchique «classique » : Traduction automatique, Linguistique structurale, Grammaire générative 1. Phonique 2. Morphologique 3. Syntaxique 4. Sémantique -> « quelle sémantique » ? 5. Pragmatique 6. Rhétorique -> Discours, Textes

9 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Autre découpage : Autre découpage : Kurylowicz, Jakobson, Vendryès, Guillaume, Benveniste, Pottier, Shaumyan, Desclés … Lexique Grammaire Discours

10 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Interactions entre découpages 1.Morphologie 2.Syntaxe 3.Sémantique 4.Pragmatique (énonciation) Lexique Grammaire Discours

11 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Grammaire Formescatégories morphologiques catégories syntaxiques Opérationsprédication détermination quantification énonciation ContexteExploration contextuelle Grammaires Catégorielles types opérateurs

12 Modèle de la Grammaire Applicative et Cognitive (GAC) Configurations morpho-syntaxiques dune langue Représentations logico-grammaticales (schémas grammaticaux et actanciels) Représentations sémantico-cognitives (schèmes; objets catégorisés) Synthèse lexicaleAnalyse lexicale Analyse catégorielleSynthèse catégorielle Grammaire Catégorielle Combinatoire Applicative Interprétation et construction sémantique

13 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Quest-ce quune langue ? Mise en relation entre : 1. Un système sémantico-énonciatif (non directement observable) et 2. Un système sémiotique expressif (plus directement observable).

14 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Langue comme un système sémiotique dexpressions catégorisées (morphèmes, mots, syntagmes, phrases, énoncés) Organisation sémantico-cognitive Primitives et schèmes sémantico-cognitifs Schèmes énonciatifs ; schèmes de diathèses … Opérateurs dintégration des schèmes en prédicats; Opérateurs de composition (prédication, détermination, thématisation, quantification …) AnalyseSynthèse

15 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Organisation sémantico-cognitive Primitives et schèmes sémantico-cognitifs; schèmes diathétiques (transitivité, moyen …) Opérateurs dintégration des schèmes en prédicats; Opérateurs de composition (prédication, détermination, quantification, thématisation, connexion …); => Insertion dans un référentiel pragmatico-énonciatif Schèmes énonciatifs ; relations dia-logiques => Opérations de « mise en texte », en discours Langue comme un ensemble dénoncés, de textes, de discours

16 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Trois composantes dune langue

17 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Trois composantes dune langue Composante lexicale (mots, morphèmes). Composante grammaticale (mots, morphèmes, phrases, énoncés). Composante discursive (phrases, propositions, textes, discours)

18 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Unités lexicales (mots lexicaux) Nominales (orientées « objet ») Opérateurs (orientés propriétés, relations) Unités discursives Unités grammaticales Unités linguistiques Morphèmes Phrases Enoncés Textes Discours Noms Verbes Prépositions Adjectifs

19 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Dépendance / Indépendance par rapport aux domaines dutilisation Le lexical (en particulier nominal) est fortement dépendant des domaines dutilisation => construction dontologies spécifiques aux domaines. Le grammatical et le discursif sont fortement indépendants des domaines dutilisation. Cette deuxième caractéristique (indépendance) doit / peut être exploitée pour la recherche dinformations et la construction, lutilisation et la transmission (aspect didactique) de connaissances.

20 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Unités lexicales Nominales (orientées objet) Opératives (orientées relations) Unités discursives Unités grammaticales Indépendance par rapport aux domaines et aux genres - + TEXTE (DISCOURS) MOT PHRASE (ENONCE)

21 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Catégories - lexicales - grammaticales - discursives

22 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Catégorie lexicale (1) Une forme lexicale (2) Un réseau polysémique (3) Relation entre une forme et un réseau de valeurs avec un éventuel invariant (« signifié de puissance ») (4)Règles dexploration contextuelle pour associer une valeur à une occurrence de forme

23 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Catégorie grammaticale (1)Paradigme de formes (conjugaisons, déclinaisons, oppositions formelles …) une forme grammaticale = marqueur dopérations (1)Carte (réseau) de concepts (opérateurs, traits …) (2)Relations (non biunivoques) entre (1) et (2) (3)Règles dexploration contextuelle (aspects discursifs)

24 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Catégorie discursive (1)Instances = indicateurs formels de notions discursives => classes dindicateurs (2)« Cartes sémantiques » de notions (3)Relations (non biunivoques) entre (1) et (2) (4)Règles dexploration contextuelle

25 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Catégories discursives « Mise en texte »Points de vue de fouille Organisation discursive Organisation du contenu Organisation dia-logique

26 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Catégories discursives de « mise en texte » Organisation discursive Organisation dun contenu Organisation dia-logique Titres, sous-titres Annonce de plan Références bibliographiques Annonce de figures Annonce de formules Annonce dexemples Annonce dune preuve Annonce dénumérations Navigation textuelle Navigation hyper-textuelle Annonce des objectifs Annonces thématiques Changements thématiques Conclusions Résultats Résumé dun propos Reformulation dun propos Enoncé dun problème Commentaires dune figure Soulignement de lauteur Adresse au lecteur Renvoi à des citations Point de vue personnel Point de vue médiatisé Prises en charge

27 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Points de vue de fouille NOTIONS discursives : Relations causales Enchaînements temporels Localisation spatiale Rencontres-connexions Définitions Citations : qui dit quoi ? Comment on fait une référence à un auteur (bibliosémantique)? Justifier une proposition Cause dune proposition Explication dune proposition Contredire une proposition Argument dautorité argument par « citation » Extraction « Prise en charge énonciative » Affirmation Assertion Constat Discours rapporté Prise en charge médiatisée Prise en charge modalisée ArgumentationPositionnements énonciatifs => Carte sémantique

28 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un Exemple de structuration discursive

29 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un exemple de structuration discursive (1) Cet article a pour objectif de montrer que … est un … très important dans …. Larticle est divisé en quatre parties. La première partie présentera le problème de …; la seconde tentera de répondre à la question de …; la troisième partie dévelopera les concepts relatifs à …; enfin, la dernière partie traitre de certaines applications et des modes dévaluation de ….

30 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un exemple de structuration discursive (1) Cet article a pour objectif de montrer que lexploration contextuelle est un processus très important dans lactivité de compréhension. Larticle est divisé en quatre parties. La première partie présentera le problème de lindétermination sémantique; la seconde tentera de répondre à la question de « comment lever lindétermination sémantique ? »; la troisième partie développera les concepts relatifs à la technique linguistico- informatique de lexploration contextuelle; enfin, la dernière partie traitre de certaines applications et des modes dévaluation de cette nouvelle approche opératoire du contexte dans la recherche des informations.

31 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un exemple de structuration discursive (2) Il est important de noter que … Le lecteur remarquera que la distinction entre … et … est inopérante, contrairement à …. Lapproche que nous préconisons est essentiellement …. Mon hypothèse, explicitée dans [X, 2007], est que …. « …, comme laffirme …, …. ».

32 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un exemple de structuration discursive (2) Il est important de noter que lEC est indépendante des domaines et des genres. Le lecteur remarquera que la distinction entre mots peins et mots vides est inopérante contrairement à ce qui a été souvent affirmé. Lapproche que nous préconisons ici est essentiellement linguistique. Mon hypothèse, explicitée dans [Desclés, 2007], est que la syntaxe est utile mais non indispensable aux processus de compréhension des textes. « La bonne compréhension, comme laffirme Culioli, est un cas particulier du malentendu ».

33 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un exemple de structuration discursive (3) Par définition, … est une composante de …. Elle comprend … parties : la première est un ensemble … ; la seconde un ensemble structuré de …; la troisième une relation entre … et … ; la quatrième un ensemble de règles …. Selon …., la …. est une des parties les plus essentielles de la ….. Mais pour nous, cest la composante … qui est la plus fondamentale pour létude des propriétés … dans ….

34 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un exemple de structuration discursive (3) Par définition, une catégorie grammaticale est une composante de la grammaire. Elle comprend quatre parties : la première est un ensemble de formes; la seconde un ensemble structuré de significations; la troisième une relation entre formes et significations; la quatrième un ensemble de règles dexploration contextuelle. Selon la Grammaire Générative, la syntaxe est une des parties les plus essentielles de la langue. Mais pour nous, cest la composante grammaticale qui est la plus fondamentale pour létude des propriétés stucturantes dans la langue.

35 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un exemple de structuration discursive (4) Dans [U, 2001], le lecteur trouvera toutes les explications … sur la démarche par …., développée par [X,1999; Y, 2001; Z,1997, 1999 ] en réponse aux propos tenus par [V, 1998]. En effet, lapproche par … risque dentraîner une augmentation du …. entre les … et …. Cest du moins lopinion de la plupart des experts du ….

36 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un exemple de structuration discursive (4) Dans [Desclés, 2001], le lecteur trouvera toutes les explications complémentaires et détaillées sur la démarche par exploration contextuelle, développée par [X,1999; Y, 2001; Z,1997, 1999 ] en réponse aux propos tenus par [V, 1998]. En effet, lapproche par ontologies trop régionales risque dentraîner une augmentation du fossé numérique entre les pays pauvres de lAfrique et les pays riches de lEurope et des Etats Unis dAmérique. Cest du moins lopinion de la plupart des experts du numérique.

37 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Technique linguistico- computationnelle de lExploration Contextuelle

38 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Abduction : remonter vers une hypothèse plausible HYPOTHESE : p Indice q1 Indice q2 Indice q3Indice q4 Les indices q1,q2,q3,q4 sont en faveur de lhypothèse p : Si p => q1, q2, q3, q4 or q1,q2,q3,q lhypothèse p est plausible

39 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Exploration contextuelle Lexploration contextuelle est destinée à résoudre un problème et à prendre des décisions. On ne sait pas a priori où trouver les indices pertinents dans le contexte. Par conséquent, il faut : déclencher la recherche dindices; définir lespace de recherche; prendre une décision comme : - lever une indétermination sémantique - retenir une information pertinente… distinguer les indices qui sont des déclencheurs dune exploration et les indices complémentaires qui vont confirmer, affiner ou infirmer une hypothèse

40 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Décision d i à partir de loccurrence de lunité analysée en fonction de son contexte unité analysée Wp V1 d1dndi V2 Wk Contexte gauche Contexte droit Espace des décisions possibles Espace de recherche

41 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Règle dexploration contextuelle Unité U W2 Signification de loccurrence de U W1 V2V3V1 Contexte avec unités non contiguës Lunité U est analysée dans un contexte discontinu ……… … …

42 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Une hypothèse dexploration contextuelle Les indices sont hiérarchisés. Certains indices sont plus importants que dautres. indices saillants Il y a des indices saillants (les indicateurs) et des indices complémentaires qui renforcent, spécifient, infirment ce quindique lindice saillant (lindicateur). Cest lindicateur qui déclenche et organise un processus dexploration contextuelle.

43 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Exemple : lever lindétermination dune forme polysémique Une occurrence dune forme (grammaticale, lexicale) polysémique contient en elle-même plusieurs significations plus spécifiques et déterminables par le contexte. Une forme indéterminée a donc - une potentialité de significations, - un « invariant de signification » - un « signifié de puissance » (Guillaume) Le recours au contexte lève lindétermination en permettant de spécifier la valeur quelle acquiert en contexte.

44 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un problème de « compréhension » pour le Traitement Automatique Cinq minutes plus tard, le train déraillait Un problème de décision : peut-on en inférer que –« Le train a déraillé ? » –« Le train na pas déraillé ? »

45 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Valeurs irréelle et de nouvel état Cinq minutes plus tard, le train déraillait Valeur de nouvel état : « le train a déraillé » Valeur irréelle : « le train na pas déraillé » ?

46 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Le train roulait à 150 km/h, le conducteur a bien vu le feu passer au rouge ; sans sa rapide réaction, cinq minutes plus tard, le train déraillait => « le train na pas déraillé » Valeur de lirréel Cinq minutes plus tard, le train déraillait.

47 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Cinq minutes plus tard, le train déraillait … Le train roulait à cent cinquante km/h, le conducteur a bien vu le feu passer au rouge mais, malgré sa rapide réaction, cinq minutes plus tard, le train déraillait.... => « le train a déraillé » Valeur de « nouvel état »

48 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Encore Encore : itération ou continuité ? Valeur itérative Nouvelle occurrence Valeur continue Il y est resté plus longtemps Luc est encore au bureau Invariant de Encore ? ?

49 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Encore Luc est encore au bureau => itération ou continuité Luc va encore au bureau => itération ou continuité A six heure du soir, Luc est encore au bureau => 1. Continuité ; 2. Itération ? Il est huit heure du soir : Luc est encore au bureau, tu peux ly trouver et faire signer ton papier => 1. Continuité Cest dimanche, et Luc est encore au bureau ! => 1. Itération

50 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Méthodes danalyse linguistique 1. Analyse distributionnelle 2. Analyses transformationnelles 2.1. entre niveaux (Chomsky, Shaumyan, Melchuk) niveau de surface => niveau profond 2.2. horizontale (Z.S. Harris) 2.3. Grammaire Applicative et Cognitive 3. Représentations logiques (Montague, Kamp…) 4. Analyses contextuelles 4.1. automates markoviens, langages réguliers, motifs : Intex, Nooj 4.2. règles contextuelles 4.3. exploration contextuelle

51 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril

52 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril

53 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Règle dexploration contextuelle Indicateur dune notion R1 (indice 11, …., indice 1n ) => décision : annotation A 1 R2 (indice 21, ….., indice 2p ) => décision : annotation A 2 Rk (indice k1, …., indice kr ) => décision : annotation A k Règles associées à lindicateur

54 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Indicateur discursif (déclencheur) Lindicateur déclenche une exploration contextuelle. Un indicateur est un indice saillant, cest une expression discursive dune notion (donc une forme identifiable); Les notions plus spécifiques dune notion de fouille (« point de vue de fouille ») forment une catégorie organisée comme une « carte sémantique »; A chaque notion plus spécifique sont associées une classe dinstances (les indicateurs saillants qui expriment la notion) + une classe de règles dexplorations contextuelles (impliquant des indices complémentaires). A chaque Indicateur est associée une classe de règles dexploration contextuelles : lindicateur identifié appelle des règles pour déclencher lexploration contextuelle => lIndicateur est un Indice déclencheur.

55 Classe de marqueurs de la notion 1 Classe de marqueurs de la notion 2 Classe de marqueurs de la notion 1.1. Classe de marqueurs de la notion 1.2. Carte sémantique (en intension) de la notion Notion 1 Notion 1.1. Notion 1.2. Notion 2 EC pour la notion 1.1. EC pour la notion 1.1. EC pour la notion 1.1. EC pour la notion 1

56 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril

57 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Carte sémantique de « la rencontre »

58 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Carte sémantique du repérage abstrait : analyse des valeurs sémantiques de « est » (Desclés, 1987)

59 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Annotations discursives par exploration contextuelle La technique par exploration contextuelle est utilisée pour annoter automatiquement les textes à partir de « point de vue de fouille discursifs ». Les décisions à prendre par lexploration contextuelle sont : - annoter (ou non) à partir de la carte sémantique en fonction des indices contextuels trouvés; - approfondir éventuellement lexploration contextuelle par un appel récursif à dautres règles.

60 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Machine à annoter automatiquement : EXCOM (« Exploration Contextuelle Multilingue »)

61 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Texte annoté automatiquement Le texte est annoté à partir des traces des opérations de « mise en texte », dindications discursives conduit à un enrichissement endogène, sans faire appel à des connaissances externes (par exemple des ontologies de domaines ou une classification par genres). Le texte contient en lui-même des indications sur sa propre structure et sur son contenu. Le texte annoté automatiquement permet de procéder à des applications avec des ressources linguistiques relativement économiques.

62 Texte annoté = texte auto-enrichi à la source dapplications Texte extrait dune base de textes Texte nettoyé Texte segmenté (organisation physique) Texte + annotations APPLICATIONS Résumé automatique Constitution de fiches thématiques Fouille sémantique par points de vue Navigation textuelle Recherche dinformations à partir de relations exprimant des « points de vue de fouille »

63 EXCOM : Machine à annoter des Textes par Exploration Contextuelle Base de textes bruts Base de textes annotés Point de vue « rencontre » Point de vue « citations » Points de vue de fouille sémantique Point de vue « causalité » Point de vue « définition » Ressources linguistiques des points de vue Base de textes segmentés Ressources linguistiques de segmentation automatique Nouveau Point de vue ….

64 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Machine à annoter des textes (1) La modélisation de la machine repose sur : Une technique linguistique dexploration contextuelle (EC); Une Indépendance des ressources et du traitement par rapport aux domaines; La constitution de ressources linguistiques légères et réutilisables pour les différents domaines; Un transfert multilingue relativement rapide (à partir des « cartes sémantiques »)…

65 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Pas danalyses morphologiques et syntaxiques préalables => nouvelle conception du TAL; Pas nécessairement des entités nommées préalables déterminées => coût plus réduit; Pas de recours à des dontologies (générales ou régionales) préalables; Pas de dictionnaires de synonymes (type : Wordnet) => Ressources lourdes à constituer et à maintenir => coût élevé, fragilité Pas dapprentissage préalable Machine à annoter des textes (2) Mais compatibilité avec des bases dentités nommées, des ontologies de domaines, des analyses morphologiques et syntaxiques auxiliaires, des dictionnaires de synonymie, des traitements statistiques …

66 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Machines à indexer et SRI en exploitant les annotations discursives Recherche dinformations - par des notions discursives liées à des points de vue dinterrogation, captées par les annotations automatiques; Applications au Web-sémantique, à la construction dontologies

67 MOCXE : Machine à Indexer selon des « points de vue » (relationssémantiquesdiscursives) SRI Questions posées sous forme de relations sémantiques Réponses sous forme de segments textuels Textes Indexés selon des points de vue BASE de TEXTES ANNOTES automatiquement selon des points de vue TEXTES ANNOTES manuellement (travail coopératif)

68 Recherche dinformations par « relations sémantiques » Questions Qui rencontre qui ? Qui rencontre qui ? où ? Quand ? Point de vue : « rencontre » Point de vue : « citation » Questions Qui a dit quoi ? Qui a dit quoi ? Comment ? Dans quel but ? Point de vue : « causalité » Questions Quoi est la cause de quoi ? Comment ? Dans quel but ? Point de vue : « définition » Questions Comment est défini quoi ? Qui a défini quoi ?

69 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Questions selon un point de vue SRIselon des « points de vue » sémantiques Rencontre ? Chirac rencontre Qui ? Qui a rencontré Poutine ? Chirac a-t-il rencontré Poutine ? Où ? Quand ? Réponses obtenues par des segments textuels extraits de documents

70 Une Application de lindexation : linterrogation multilingue Base de documents annotés en coréen en arabe Réponses par des segments textuels en coréen, en arabe … Traduction des réponses Traduction Automatique des réponses en français Questions posées en français selon « un point de vue » Questions « équivalentes » posées en coréen (arabe) TAO EXCOM + SRI en coréen (en arabe) TAO T humaine

71 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un exemple dannotations discursives dun texte pour le résumer

72 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Un texte La préface par Maurice Gross de Notes du cours de syntaxe Notes du cours de syntaxe de Zellig Harris (Ed. du Seuil, Paris, 1976) Extraire les informations « les plus pertinentes » qui donnent « une idée sur le contenu » du document

73 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Annotations discursives Annotations qui donnent des informations interprétatives sur certains segments dun texte Ces annotations sont sémantiques (indications sur le « contenu » du texte) Elles correspondent à des points de vue de « lecture » dun humain qui annote (mentalement) ou physiquement (soulignement) un texte

74 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Structurations dans un texte Métadonnées : Où est piublié le texte ? Quand ? genre textuel ? Structuration physique ou formelle : segmentation Titres, section Paragraphes, phrases, sections Propositions Enumértations Images, diagrammes, photos Structuration discursive : - citations, définitions, exemples, - annonces thématiques, conclusives - soulignements de lauteur - rappels de connaissances - appel au lecteur - …

75 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Premières opérations « Nettoyer » le texte sil vient du Web enlever la publicité, isoler les métadonnées garder la structure HTML ? Segmenter le texte en identifiant : titres, sections, paragraphes, phrases, propositions …

76 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Fouille sémantique « selon des points de vue » discursifs Annonces thématiques - Conclusions - Signatures des auteurs Exemples (extraction) Appel au lecteur Définitions (extraction) Organisation discursive - Annonce de plan - Enchaînement discursif - Annonce de marqueurs dintégration linéaire (MIL)

77 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Exemple de Règle dexploration contextuelle pour lannotation sémantique Dans une phrase on identifie un déclencheur de la liste des déclencheurs « annonces thématiques » + une position [premier paragraphe] Annoter la phrase : thématique thématique\ Annonce thématique

78 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / annonce thématique Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe annonce thématique (Harris) \ + indice de position : [premier paragraphe, première phrase] => Indice de position déclencheur : [premier paragraphe, seconde phrase] => recherche dindices complémentaires / annonce thématique Jusquaujourdhui, il navait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles dêtre mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de annonce thématique (Harris) \ => Indice de position déclencheur : [premier paragraphe, troisième phrase ] avec des indices complémentaires : chaînage au nom dauteur Harris par des candidats pronoms.

79 / annonce thématique Dans les présentes notes du cours quil a professé à luniversité de Paris-Vincennes en , Harris livre sa description complète dune grammaire, celle de langlais, mais il est clair que son point de vue est quune telle forme de grammaire possède une grande généralité, voire quelle est annonce thématique (Harris) \ / Signature de lauteur Nous ne nous sommes pas contenté de traduire les notes que Harris a lui-même rédigées, mais nous nous sommes efforcé dadapter la majorité de ses analyses au Signature de lauteur \ / signature des auteurs Nous remercions Z.S. Harris qui nous a guidé à travers cette adaptation, ainsi que Mlle Yannick Gheerbrandt et M. Amr Helmy Ibrahim qui, par leur présentation dans un séminaire consacré à ce cours, ont contribué à éclaircir certains signature des auteurs (Harris) \ / appel au lecteur Le lecteur, peut-être plus familier avec les présentations de la grammaire générative, ne retrouvera pas immédiatement loutillage de formalisation développé par Chomsky à la suite des premiers travaux de appel au lecteur (Harris) \ / annonce thématique Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur dune grammaire annonce thématique (Harris) \

80 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / annonce thématique Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours annonce thématique (Harris) \ + Indice complémentaire : [dernière phrase dun paragraphe] / annonce thématique La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à lesprit que cette conception a été empiriquement motivée dune façon méthodique et très annonce thématique (Harris) \ + Indice complémentaire : [première phrase dun paragraphe] / annonce thématique Lexposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au annonce thématique (Harris) \ / annonce thématique Les analyses présentées par Harris sont entièrement formalisées, mais in ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient ladoption des solutions quil a choisies par rapport à dautres que le lecteur a rencontrées ailleurs ou quil pourrait aisément imaginer annonce thématique (Harris) \ / annonce thématique Harris a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de annonce thématique (Harris) \

81 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / annonce thématique / appel au lecteur / Enchaînement : - Dailleurs, Harris aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsquil est conduit à les annonce thématique \appel au lecteur \ Enchaînement : - (Harris) \ / annonce thématique Le système de Harris nest pas seulement abstrait de point de vue formel, il lest également par la nature des analyses proprement annonce thématique (Harris) \ / conclusion On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de langlais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont (Harris) \ Harris ne nie pas lintérêt de ces parties du discours, simplement il les retrouve comme conséquences de processus grammaticaux généraux appliqués à des mots particuliers de chaque \ + indice complémentaire : dernière phrase de paragraphe / annonce thématique / organisation discursive - Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - annonce thématique \ organisation discursive (Harris) \

82 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / annonce thématique / conséquences (Harris) / organisation Harris utilise largement les conséquences logiques de cette observation, ce qui lamène à procéder à des analyses du type suivant \ annonce thématique \ conséquences \ organisation discursive (Harris) \ / Exemple Il est un autre exemple qui illustre bien le caractère abstrait des représentations de base de Harris, et qui peut-être apparaît mieux en français quen Exemple illustratif \ / Cet exemple nous a dailleurs posé un problème dadaptation des analyses de Harris au Exemple \ Annonce Harris a élaboré graduellement sa théorie et, plus que tout autre, il la confrontée à constamment thématique \ / Annonce Sefforçant de construire une théorie minimale du point de vue formel, Harris a constamment cherché à restreindre lintroduction des notions Annonce thématique \ / Appel au Harris accepte ainsi comme grammaticales des phrases quun lecteur soucieux de pureté stylistique rejettera comme totalement Appel au lecteur \ / Enchaînement / Annonce Cest ainsi que, dans son analyse de la phrase, Harris sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase Enchaînement \ Annonce thématique/

83 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / Signature de Pour pouvoir rester le plus près possible de la présentation de Harris, nous avons donc dû transposer certains de ses exemples en les Signature de lauteur \ / Marqueur dIntégration linéaire :- / Annonce thématique: Dune part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre dailleurs Marqueur dIntégration linéaire :- \ Annonce thématique \ / Signature de Dans toute la mesure du possible, nous avons vérifié que ces modifications nintroduisaient pas dincohérence dans lanalyse des phrases françaises présentées, et nous espérons quainsi lesprit des solutions de Harris aura été Signature de lauteur \ + Position [dernier paragraphe, avent dernière phrase] / Signature de lauteur / Appel au Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de lessentiel des phénomènes Signature de lauteur / Appel au lecteur \ + Position : [dernier paragraphe, dernière phrase] ; problème du temps grammatical : passé composé

84 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Bilan de la réduction (phrases annotées) En retenant toutes les phrases annotées on obtient : 65 lignes / 255 lignes => rapport ¼ Trop important pour un résumé => trouver une « stratégie de résumé »

85 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Premières stratégies Introduire des poids poids forts accordés à certains mots - fréquences dans le texte - mots liés à un thesaurus, mais nécessité den avoir un => logiciel Pertinence (Lehmann) => résultats assez mauvais ! Privilégier les règles avec beaucoup dindices « plus il y a dindices, plus la règle est pertinente » Privilégier les segments avec des occurrences des termes du domaine étudié (travail spécifique à un domaine) Privilégier les segments avec plusieurs annotations discursives => beaucoup dinformations

86 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Seconde stratégie, plus linguistique Ordonner les points de vue dannotations discursives - 1. annonce thématique - 2. conclusions (soulignement) - 3. organisation discursive - 4. remarques dauteur - 5. exemples - 6. appel au lecteur

87 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Stratégie de « réduction » (condensation) On retient les annonces thématiques On retient les remarques conclusives dauteur = remarques dauteurs dans certaines positions du texte (fin de paragraphe, dernier paragraphe) Organisation discursive

88 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / annonce thématique Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe annonce thématique (Harris) \ + indice de position : [premier paragraphe, première phrase] => Indice de position déclencheur : [premier paragraphe, seconde phrase] avec des indices complémentaires : chaînage au nom dauteur Harris par des candidats pronoms + recherche dindices complémentaires / annonce thématique Jusquaujourdhui, il navait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles dêtre mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de annonce thématique (Harris) \ => Indice de position déclencheur : [premier paragraphe, troisième phrase ]

89 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril => Indice de position déclencheur : [premier paragraphe, troisième phrase ] avec des indices complémentaires : chaînage au nom dauteur Harris par des candidats pronoms. / annonce thématique Dans les présentes notes du cours quil a professé à luniversité de Paris-Vincennes en , Harris livre sa description complète dune grammaire, celle de langlais, mais il est clair que son point de vue est quune telle forme de grammaire possède une grande généralité, voire quelle est annonce thématique (Harris) \ / annonce thématique Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur dune grammaire annonce thématique (Harris) \ / annonce thématique Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en génral non commutatives, et pas toujours annonce thématique (Harris) \ + Indice complémentaire : [dernière phrase dun paragraphe]

90 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / annonce thématique La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à lesprit que cette conception a été empiriquement motivée dune façon méthodique et très annonce thématique (Harris) \ + Indice complémentaire : [première phrase dun paragraphe] / annonce thématique Lexposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au annonce thématique (Harris) \ / annonce thématique Les analyses présentées par Harris sont entièrement formalisées, mais in ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient ladoption des solutions quil a choisies par rapport à dautres que le lecteur a rencontrées ailleurs ou quil pourrait aisément imaginer annonce thématique (Harris) \

91 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / annonce thématique Harris a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de annonce thématique (Harris) \ / annonce thématique / appel au lecteur / Enchaînement discursif : - Dailleurs, Harris aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsquil est conduit à les annonce thématique \appel au lecteur \ Enchaînement : - (Harris) \ / annonce thématique Le système de Harris nest pas seulement abstrait de point de vue formel, il lest également par la nature des analyses proprement annonce thématique (Harris) \ / conclusion On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de langlais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont (Harris) \ / annonce thématique / organisation discursive Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : annonce thématique \ organisation discursive (Harris) \

92 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / annonce thématique / conséquences (Harris) / organisation Harris utilise largement les conséquences logiques de cette observation, ce qui lamène à procéder à des analyses du type suivant conséquences \ annonce thématique \ organisation discursive (Harris) \ / Annonce Harris a élaboré graduellement sa théorie et, plus que tout autre, il la confrontée à constamment thématique \ / Annonce Sefforçant de construire une théorie minimale du point de vue formel, Harris a constamment cherché à restreindre lintroduction des notions Annonce thématique \ / Enchaînement / Annonce Cest ainsi que, dans son analyse de la phrase, Harris sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase Enchaînement \ Annonce thématique \ / Marqueur dIntégration linéaire / Annonce thématique: Dune part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre dailleurs Marqueur dIntégration linéaire : Marqueur dIntégration linéaire - \ Annonce thématique \

93 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Texte obtenu en enlevant les balises

94 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusquaujourdhui, il navait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles dêtre mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de langlais. Dans les présentes notes du cours quil a professé à luniversité de Paris-Vincennes en , Harris livre sa description complète dune grammaire, celle de langlais, mais il est clair que son point de vue est quune telle forme de grammaire possède une grande généralité, voire quelle est universelle. Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur dune grammaire algébrique. Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours associatives. La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à lesprit que cette conception a été empiriquement motivée dune façon méthodique et très détaillée. Lexposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ.

95 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient ladoption des solutions quil a choisies par rapport à dautres que le lecteur a rencontrées ailleurs ou quil pourrait aisément imaginer lui-même. Harris a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. Dailleurs, Harris aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsquil est conduit à les préciser. Le système de Harris nest pas seulement abstrait de point de vue formel, il lest également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de langlais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : -

96 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Harris utilise largement les conséquences logiques de cette observation, ce qui lamène à procéder à des analyses du type suivant. Harris a élaboré graduellement sa théorie et, plus que tout autre, il la confrontée à constamment lexpérience. Sefforçant de construire une théorie minimale du point de vue formel, Harris a constamment cherché à restreindre lintroduction des notions abstraites. Cest ainsi que, dans son analyse de la phrase, Harris sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. Dune part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre dailleurs ici.

97 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril « Nettoyage final » du texte : Remplacer certaines occurrences de « Harris » par lanaphore « il » : Règles dEC : Substituer aux occurrences de « Harris », le terme « il » Règle positive : (1)SI « Harris » précède un verbe, ALORS lui substituer « il » Règles négatives : (2)SI Harris suit « N de » ALORS ne pas substituer (3)SI « Harris » suivi par « par », ALORS ne pas substituer. (4)SI « Harris » précède « qui », ALORS ne pas substituer. (5)SI « Harris » a une première occurrence dans la première phrase dun paragraphe, ALORS ne pas substituer Autre règle de nettoyage Substituer au signe « il » dans le contexte dun point «. » de fin de phrase qui le précède de façon contiguë, par « Il ».

98 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusquaujourdhui, il navait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles dêtre mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de langlais. Dans les présentes notes du cours quil a professé à luniversité de Paris-Vincennes en , il livre sa description complète dune grammaire, celle de langlais, mais il est clair que son point de vue est quune telle forme de grammaire possède une grande généralité, voire quelle est universelle. Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur dune grammaire algébrique. Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours associatives. La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à lesprit que cette conception a été empiriquement motivée dune façon méthodique et très détaillée. Lexposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ.

99 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient ladoption des solutions quil a choisies par rapport à dautres que le lecteur a rencontrées ailleurs ou quil pourrait aisément imaginer lui-même. Il [->Il] a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. Dailleurs, il aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsquil est conduit à les préciser. Le système de Harris nest pas seulement abstrait de point de vue formel, il lest également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de langlais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : -

100 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril il [->Il] utilise largement les conséquences logiques de cette observation, ce qui lamène à procéder à des analyses du type suivant. il [->Il] a élaboré graduellement sa théorie et, plus que tout autre, il la confrontée à constamment lexpérience. Sefforçant de construire une théorie minimale du point de vue formel, il a constamment cherché à restreindre lintroduction des notions abstraites. Cest ainsi que, dans son analyse de la phrase, il sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. Dune part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre dailleurs ici.

101 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Réduction supplémentaire : Suppression : - des phrases avec MIL par introducteurs - enchaînements discursifs

102 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusquaujourdhui, il navait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles dêtre mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de langlais. Dans les présentes notes du cours quil a professé à luniversité de Paris-Vincennes en , il livre sa description complète dune grammaire, celle de langlais, mais il est clair que son point de vue est quune telle forme de grammaire possède une grande généralité, voire quelle est universelle. [[Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur dune grammaire algébrique. Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours associatives. ]] La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à lesprit que cette conception a été empiriquement motivée dune façon méthodique et très détaillée. Lexposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ.

103 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient ladoption des solutions quil a choisies par rapport à dautres que le lecteur a rencontrées ailleurs ou quil pourrait aisément imaginer lui-même. Il [->Il] a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. [[ [[ Dailleurs, Il aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsquil est conduit à les préciser. ]] Le système de Harris nest pas seulement abstrait de point de vue formel, il lest également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de langlais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. [[ Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - - ]]

104 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril il [->Il] utilise largement les conséquences logiques de cette observation, ce qui lamène à procéder à des analyses du type suivant. il [->Il] a élaboré graduellement sa théorie et, plus que tout autre, il la confrontée à constamment lexpérience. Sefforçant de construire une théorie minimale du point de vue formel, il a constamment cherché à restreindre lintroduction des notions abstraites. [[ Cest ainsi que, dans son analyse de la phrase, il sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. ]] [[Dune part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre dailleurs ici. ]]

105 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Mis en œuvre par effacement

106 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusquaujourdhui, il navait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles dêtre mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de langlais. Dans les présentes notes du cours quil a professé à luniversité de Paris-Vincennes en , il livre sa description complète dune grammaire, celle de langlais, mais il est clair que son point de vue est quune telle forme de grammaire possède une grande généralité, voire quelle est universelle. La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à lesprit que cette conception a été empiriquement motivée dune façon méthodique et très détaillée. Lexposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. Résumé obtenu par extraction, après nettoyage

107 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient ladoption des solutions quil a choisies par rapport à dautres que le lecteur a rencontrées ailleurs ou quil pourrait aisément imaginer lui-même. Il [->Il] a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. Le système de Harris nest pas seulement abstrait de point de vue formel, il lest également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de langlais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. Il utilise largement les conséquences logiques de cette observation, ce qui lamène à procéder à des analyses du type suivant. Il a élaboré graduellement sa théorie et, plus que tout autre, il la confrontée à constamment lexpérience. Sefforçant de construire une théorie minimale du point de vue formel, il a constamment cherché à restreindre lintroduction des notions abstraites.. Réduction : 25 lignes / 255 lignes = 10 /100

108 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril

109 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril

110 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Signature de lauteur Appel au lecteur Exemples

111 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / Signature de lauteur Nous ne nous sommes pas contenté de traduire les notes que Harris a lui-même rédigées, mais nous nous sommes efforcé dadapter la majorité de ses analyses au Signature de lauteur \ / Signature de lauteur Nous remercions Z.S. Harris qui nous a guidé à travers cette adaptation, ainsi que Mlle Yannick Gheerbrandt et M. Amr Helmy Ibrahim qui, par leur présentation dans un séminaire consacré à ce cours, ont contribué à éclaircir certains Signature de lauteur (Harris) \ / Signature de Pour pouvoir rester le plus près possible de la présentation de Harris, nous avons donc dû transposer certains de ses exemples en les Signature de lauteur \

112 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / Signature de Dans toute la mesure du possible, nous avons vérifié que ces modifications nintroduisaient pas dincohérence dans lanalyse des phrases françaises présentées, et nous espérons quainsi lesprit des solutions de Harris aura été Signature de lauteur \ / Signature de lauteur / Appel au Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de lessentiel des phénomènes Signature de lauteur / Appel au lecteur \ + Position : [dernier paragraphe, dernière phrase] ; problème du temps grammatical : passé composé.

113 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Appel au lecteur / Appel au lecteur Le lecteur, peut-être plus familier avec les présentations de la grammaire générative, ne retrouvera pas immédiatement loutillage de formalisation développé par Chomsky à la suite des premiers travaux de Appel au lecteur (Harris) \ / Appel au Harris accepte ainsi comme grammaticales des phrases quun lecteur soucieux de pureté stylistique rejettera comme totalement Appel au lecteur \ / Signature de lauteur / Appel au Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de lessentiel des phénomènes Signature de lauteur / Appel au lecteur \ + Position : [dernier paragraphe, dernière phrase] ; problème du temps grammatical : passé composé.

114 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Appel au lecteur / appel au lecteur Le lecteur, peut-être plus familier avec les présentations de la grammaire générative, ne retrouvera pas immédiatement loutillage de formalisation développé par Chomsky à la suite des premiers travaux de appel au lecteur (Harris) \ / Signature de lauteur / Appel au Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de lessentiel des phénomènes Signature de lauteur / Appel au lecteur \

115 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril / Exemple Il est un autre exemple qui illustre bien le caractère abstrait des représentations de base de Harris, et qui peut-être apparaît mieux en français quen Exemple illustratif \ / Cet exemple nous a dailleurs posé un problème dadaptation des analyses de Harris au Exemple \ Exemples

116 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Comment construire les règles ?

117 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Comment construire des ressources linguistiques ? Une méthodologie nouvelle ? Comment trouver les indices (déclencheurs et complémentaires) ? Comment trouver les règles ? Comment les écrire ? Comment les présenter ? Comment les valider ?

118 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Premier cas : lever lindétermination dune forme identifiée => valeurs sémantiques connues Forme grammaticale = Indice déclencheur 1. Chercher un indice complémentaire pour déterminer une des valeurs sémantiques possibles dune occurrence ; 2. Une valeur étant déterminée, chercher dautres indices complémentaires pour confirmer ou infirmer la décision ; 3. Constituer une classe déquivalence dindices complémentaires pour une même valeur ; 4. Interpréter sémantiquement la classe.

119 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Indice déclencheur => valeurs Indicedéclencheur IC Valeur V2 Valeur V3 => IC => Valeur V1

120 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Une valeur => indices associées Forme Grammaticale = Indicateuravecvaleurdéterminée IC KIC1 KIC2 KIC3 KIC4

121 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Base de données : Indices - Valeurs Valeur iIndicateur1 Classe KIC1dindices complémentaires Valeur i Classe KIC2 dindices complémentaires Valeurj Classe KIC3dindices complémentaires Valeur j Classe KIC4 dindices complémentaires Classe KIC5 dindices complémentaires Valeur k indicateur 2 Classe KIC1dindices complémentaires Valeur j

122 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Règle pour lever lindétermination dune forme grammaticale Forme analysée = indice déclencheur Indice complémentaire appartenant à une classe K i Valeur sémantique V j + sont des indices en faveur de la Indentification dune occurrence dune forme comme Indice Déclencheur SI on a une occurrence dun indice complémentaire dune classe K i ALORS ce sont des indices en faveur de la valeur sémantique V j Action : assigner la valeur V j au segment linguistique contenant la forme

123 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Second cas : résoudre une tâche à partir de notions discursives Tâche (exemples : résumer, filtrer des informations saillantes, construire des fiches catégorisées, commenter un diagramme, …) Résoudre la tâche, cest identifier des notions discursives et annoter les textes selon des points de vue correspondant à la tâche à effectuer. Exemple : pour résumer, il faut trouver : les annonces thématiques ; les hypothèses de travail ; les conclusions ; les méthodes ; les résultats

124 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Notion => expressions linguistiques Notion discursive (exemples « citation », « définition », « annonce thématique ») 1. identifier les expressions discursives qui sont les marqueurs (indicateurs principaux) de cette notion ; 2. trouver dans le contexte de ces marqueurs des indices complémentaires qui renforcent les indices déclencheurs ; 3. pour chaque indice déclencheur, classer les indices complémentaires dans des classes déquivalence et écrire des règles dexploration contextuelle ; 4. donner une interprétation sémantique aux classes déquivalence; 5. donner une spécification sémantique aux indices déclencheurs. 6. Dresser la « carte sémantique » de la notion.

125 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Notion -Indices Notion IC ID ID ID

126 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Notion : regroupement en classes Indicateur2 Indices complémentaires Indices complémentaires Indices complémentaires KIC 1 KIC 2 KIC 3 Indicateur1 Notion

127 Base de données : Indices - Notions Notion i Indicateur 1 Classe KIC1dindices complémentaires Notion i Classe KIC2 dindices complémentaires Notion i Indicateur 2 Classe KIC1dindices complémentaires Notion i Classe KIC2 dindices complémentaires Notion i Classe KIC3 dindices complémentaires Notion j Indicateur 3 Classe KIC1dindices complémentaires

128 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Règle pour déterminer une notion Indice complémentaire associé à une notion N j Indice Déclencheur appartenant à une classe K i Notion j + sont des indices en faveur de la Identification dune occurrence dune forme comme Indice Déclencheur dune notion Nj SI on a une occurrence dindices complémentaires dune classe K i ALORS ce sont des indices en faveur de la notion sémantique N j Action : assigner au segment linguistique lannotation N j

129 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Quelques références bibliographiques Desclés Jean-Pierre, Langages applicatifs, langues naturelles et cognition, Hermès, Paris, Desclés Jean-Pierre, Systèmes dexploration contextuelle, Co-texte et calcul du sens, (Claude Guimier), Presses de luniversitaires de Caen, 1997 pp Descles J.-P., Soh (Éditeurs) Langage, cognition et textes, tome 1, tome 2, Université de Hankuk et Université de Paris-Sorbonne, Paris, Séoul, avril 1997, Desclés Jean-Pierre, « Polysémie verbale, un exemple : le verbe avancer », Colloque international « Polysémie », Université de Paris- Sorbonne, Paris, décembre Desclés Jean-Pierre, Jean-Luc Minel, « Résumé automatique et filtrage sémantique des textes », Ingénierie des langues, sous la direction de Jean-Marie Pierrel, Paris : Hermès, 2000, pp Desclés Jean-Pierre, Jean-Luc Minel, « Interpréter par exploration contextuelle », sous la direction de Francis Corblin, Claire Gardent, Interpréter en contexte, Hermès, Paris, pp Desclés Jean-Pierre, Flageul Valérie, Kerenbosh Chritiane, Meunier Jean-Marc, Richard Jean-François, Sémantique cognitive de laction, I. Contexte théorique, Langages, n° 132 décembre 1998 pp Minel, Jean-Luc, Desclés, Jean-Pierre, Fouille sémantique des textes, TSI, 2002

130 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Thèses Thèses soutenuesThèses soutenues : C. Jouis, J. Berri, D. Reppert, Y. Oh, A. Jackiewicz, D. Garcia, G. Mourad, J.L. Minel, S. Ben Hazes, S., Benthami, G. Crispino, D. Wonsever … Thèses en cours :Thèses en cours : Antoine Blais Montacem Alrahabi Marc Bertin Iana Atanassova ….

131 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril Merci pour votre attention !


Télécharger ppt "Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 20081 Catégories discursives et de « mise en texte » (vers une « sémantique discursive."

Présentations similaires


Annonces Google