La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Université de Lyon, ENS, vendredi 4 avril 2008

Présentations similaires


Présentation au sujet: "Université de Lyon, ENS, vendredi 4 avril 2008"— Transcription de la présentation:

1 Université de Lyon, ENS, vendredi 4 avril 2008
Catégories discursives et de « mise en texte » (vers une « sémantique discursive » et son traitement automatique) Jean-Pierre Desclés LaLIC « Langages, Logiques, Informatique, Cognition» Université de Paris-Sorbonne Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

2 Plan de l’exposé 1. Cadre théorique de référence
2. Trois composantes d’une langue 3. Un exemple de structuration discursive 4. Terchnique linguistico-computationnelle d’Exploration Contextuelle 5. Machine à annoter automatiquement, la machine EXCOM 6. Un exemple d’annotations discursives d’un texte : un texte de Maurice Gross 7. Comment construire les règles ? Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

3 I. Cadre théorique de référence
Le langage et les langues Modèles formels et computationnels Théorie / Applications Concepts aux fondements de la démarche : dialogisme, abduction, catégorisation … Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

4 Quelques idées fortes Trois composantes d’une langue :
lexicale; grammaticale; discursive. Le grammatical est le squelette d’une langue, le lexique en est la chair. La composante discursive est structurante ; elle permet une annotation sémantique automatique de textes, ce qui conduit à de nouveaux modes d’exploitation des informations textuelles. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

5 Le grammatical structure les langues
La distinction « mots pleins » (le lexique) et « mots vides » (les unités grammaticales) n’est pas opératoire pour l’analyse des langues. => Traitements statistiques Le grammatical (à ne pas réduire au syntaxique !) est le support de significations hautement structurantes. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

6 Structures discursives signifiantes dans les textes (discours)
Un texte possède : - une structure physique (cf. SegaText); - une structure discursive qui a une portée sémantique. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

7 Découpages d’une langue
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

8 Découpage hiérarchique «classique » : Traduction automatique, Linguistique structurale, Grammaire générative 1. Phonique 2. Morphologique 3. Syntaxique 4. Sémantique -> « quelle sémantique » ? 5. Pragmatique 6. Rhétorique -> Discours, Textes Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

9 Autre découpage : Kurylowicz, Jakobson, Vendryès, Guillaume, Benveniste, Pottier, Shaumyan, Desclés … Lexique Grammaire Discours Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

10 Interactions entre découpages
Morphologie Syntaxe Sémantique Pragmatique (énonciation) Lexique Grammaire Discours Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

11 Grammaire Formes catégories morphologiques catégories syntaxiques
Opérations prédication détermination quantification énonciation Contexte Exploration contextuelle types Grammaires Catégorielles opérateurs Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

12 Modèle de la Grammaire Applicative et Cognitive (GAC)
Représentations sémantico-cognitives (schèmes; objets catégorisés) Interprétation et construction sémantique Analyse lexicale Synthèse lexicale Représentations logico-grammaticales (schémas grammaticaux et actanciels) Grammaire Catégorielle Combinatoire Applicative Analyse catégorielle Synthèse catégorielle Configurations morpho-syntaxiques d’une langue

13 Qu’est-ce qu’une langue ?
Mise en relation entre : Un système sémantico-énonciatif (non directement observable) et Un système sémiotique expressif (plus directement observable). Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

14 Organisation sémantico-cognitive
Primitives et schèmes sémantico-cognitifs Schèmes énonciatifs ; schèmes de diathèses … Opérateurs d’intégration des schèmes en prédicats; Opérateurs de composition (prédication, détermination, thématisation, quantification …) Synthèse Analyse Langue comme un système sémiotique d’expressions catégorisées (morphèmes, mots, syntagmes, phrases, énoncés) Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

15 Langue comme un ensemble d’énoncés, de textes, de discours
=> Insertion dans un référentiel pragmatico-énonciatif Schèmes énonciatifs ; relations dia-logiques Organisation sémantico-cognitive Primitives et schèmes sémantico-cognitifs; schèmes diathétiques (transitivité, moyen …) Opérateurs d’intégration des schèmes en prédicats; Opérateurs de composition (prédication, détermination, quantification, thématisation, connexion …); => Opérations de « mise en texte », en discours Langue comme un ensemble d’énoncés, de textes, de discours Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

16 2. Trois composantes d’une langue
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

17 Trois composantes d’une langue
Composante lexicale (mots, morphèmes). Composante grammaticale (mots, morphèmes, phrases, énoncés). Composante discursive (phrases, propositions, textes, discours) Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

18 Unités linguistiques Nominales (orientées « objet »)
Opérateurs (orientés propriétés, relations) Noms Unités lexicales (mots lexicaux) Verbes Prépositions Adjectifs Unités grammaticales Morphèmes Phrases Enoncés Textes Discours Unités discursives Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

19 Dépendance / Indépendance par rapport aux domaines d’utilisation
Le lexical (en particulier nominal) est fortement dépendant des domaines d’utilisation => construction d’ontologies spécifiques aux domaines. Le grammatical et le discursif sont fortement indépendants des domaines d’utilisation. Cette deuxième caractéristique (indépendance) doit / peut être exploitée pour la recherche d’informations et la construction, l’utilisation et la transmission (aspect didactique) de connaissances. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

20 - + TEXTE (DISCOURS) PHRASE (ENONCE) MOT Nominales (orientées objet)
Opératives (orientées relations) Unités lexicales Indépendance par rapport aux domaines et aux genres Unités grammaticales Unités discursives + Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

21 Catégories - lexicales - grammaticales - discursives
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

22 Catégorie lexicale Une forme lexicale Un réseau polysémique
Relation entre une forme et un réseau de valeurs avec un éventuel invariant (« signifié de puissance ») (4) Règles d’exploration contextuelle pour associer une valeur à une occurrence de forme Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

23 Catégorie grammaticale
Paradigme de formes (conjugaisons, déclinaisons, oppositions formelles …) une forme grammaticale = marqueur d’opérations Carte (réseau) de concepts (opérateurs, traits …) Relations (non biunivoques) entre (1) et (2) Règles d’exploration contextuelle (aspects discursifs) Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

24 Catégorie discursive Instances = indicateurs formels de notions discursives => classes d’indicateurs (2) « Cartes sémantiques » de notions (3) Relations (non biunivoques) entre (1) et (2) (4) Règles d’exploration contextuelle Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

25 Catégories discursives
« Mise en texte » Points de vue de fouille Organisation discursive Organisation du contenu Organisation dia-logique Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

26 Catégories discursives de « mise en texte »
Organisation discursive Organisation d’un contenu Organisation dia-logique Titres, sous-titres Annonce de plan Références bibliographiques Annonce de figures Annonce de formules Annonce d’exemples Annonce d’une preuve Annonce d’énumérations Navigation textuelle Navigation hyper-textuelle Annonce des objectifs Annonces thématiques Changements thématiques Conclusions Résultats Résumé d’un propos Reformulation d’un propos Enoncé d’un problème Commentaires d’une figure Soulignement de l’auteur Adresse au lecteur Renvoi à des citations Point de vue personnel Point de vue médiatisé Prises en charge Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

27 Points de vue de fouille
Positionnements énonciatifs Argumentation Extraction NOTIONS discursives : Relations causales Enchaînements temporels Localisation spatiale Rencontres-connexions Définitions Citations : qui dit quoi ? Comment on fait une référence à un auteur (bibliosémantique)? Justifier une proposition Cause d’une proposition Explication d’une proposition Contredire une proposition Argument d’autorité argument par « citation » « Prise en charge énonciative » Affirmation Assertion Constat Discours rapporté Prise en charge médiatisée Prise en charge modalisée => Carte sémantique Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

28 3. Un Exemple de structuration discursive
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

29 Un exemple de structuration discursive (1)
Cet article a pour objectif de montrer que … est un … très important dans …. L’article est divisé en quatre parties. La première partie présentera le problème de …; la seconde tentera de répondre à la question de …; la troisième partie dévelopera les concepts relatifs à …; enfin, la dernière partie traitre de certaines applications et des modes d’évaluation de …. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

30 Un exemple de structuration discursive (1’)
Cet article a pour objectif de montrer que l’exploration contextuelle est un processus très important dans l’activité de compréhension. L’article est divisé en quatre parties. La première partie présentera le problème de l’indétermination sémantique; la seconde tentera de répondre à la question de « comment lever l’indétermination sémantique ? »; la troisième partie développera les concepts relatifs à la technique linguistico-informatique de l’exploration contextuelle; enfin, la dernière partie traitre de certaines applications et des modes d’évaluation de cette nouvelle approche opératoire du contexte dans la recherche des informations. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

31 Un exemple de structuration discursive (2)
Il est important de noter que … Le lecteur remarquera que la distinction entre … et … est inopérante, contrairement à …. L’approche que nous préconisons est essentiellement …. Mon hypothèse, explicitée dans [X, 2007], est que …. «  …, comme l’affirme … , …. ». Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

32 Un exemple de structuration discursive (2’)
Il est important de noter que l’EC est indépendante des domaines et des genres. Le lecteur remarquera que la distinction entre mots peins et mots vides est inopérante contrairement à ce qui a été souvent affirmé. L’approche que nous préconisons ici est essentiellement linguistique. Mon hypothèse, explicitée dans [Desclés, 2007], est que la syntaxe est utile mais non indispensable aux processus de compréhension des textes. «  La bonne compréhension, comme l’affirme Culioli , est un cas particulier du malentendu ». Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

33 Un exemple de structuration discursive (3)
Par définition, … est une composante de … . Elle comprend … parties : la première est un ensemble … ; la seconde un ensemble structuré de …; la troisième une relation entre … et … ; la quatrième un ensemble de règles …. Selon …., la …. est une des parties les plus essentielles de la ….. Mais pour nous, c’est la composante … qui est la plus fondamentale pour l’étude des propriétés … dans …. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

34 Un exemple de structuration discursive (3’)
Par définition, une catégorie grammaticale est une composante de la grammaire. Elle comprend quatre parties : la première est un ensemble de formes; la seconde un ensemble structuré de significations; la troisième une relation entre formes et significations; la quatrième un ensemble de règles d’exploration contextuelle. Selon la Grammaire Générative, la syntaxe est une des parties les plus essentielles de la langue. Mais pour nous, c’est la composante grammaticale qui est la plus fondamentale pour l’étude des propriétés stucturantes dans la langue. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

35 Un exemple de structuration discursive (4)
Dans [U, 2001], le lecteur trouvera toutes les explications … sur la démarche par …., développée par [X,1999; Y, 2001; Z,1997, 1999 ] en réponse aux propos tenus par [V, 1998]. En effet, l’approche par … risque d’entraîner une augmentation du …. entre les … et …. C’est du moins l’opinion de la plupart des experts du …. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

36 Un exemple de structuration discursive (4’)
Dans [Desclés, 2001], le lecteur trouvera toutes les explications complémentaires et détaillées sur la démarche par exploration contextuelle, développée par [X,1999; Y, 2001; Z,1997, 1999 ] en réponse aux propos tenus par [V, 1998]. En effet, l’approche par ontologies trop régionales risque d’entraîner une augmentation du fossé numérique entre les pays pauvres de l’Afrique et les pays riches de l’Europe et des Etats Unis d’Amérique. C’est du moins l’opinion de la plupart des experts du numérique. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

37 4. Technique linguistico-computationnelle de l’Exploration Contextuelle
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

38 Abduction : remonter vers une hypothèse plausible
HYPOTHESE : p Indice q1 Indice q2 Indice q3 Indice q4 Les indices q1,q2,q3,q4 sont en faveur de l’hypothèse p : Si p => q1, q2, q3, q4 or q1,q2,q3,q4 l’hypothèse p est plausible Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

39 Exploration contextuelle
L’exploration contextuelle est destinée à résoudre un problème et à prendre des décisions. On ne sait pas a priori où trouver les indices pertinents dans le contexte. Par conséquent, il faut : déclencher la recherche d’indices; définir l’espace de recherche; prendre une décision comme : - lever une indétermination sémantique - retenir une information pertinente… distinguer les indices qui sont des déclencheurs d’une exploration et les indices complémentaires qui vont confirmer, affiner ou infirmer une hypothèse Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

40 Décision di à partir de l’occurrence de
l’unité analysée en fonction de son contexte Espace des décisions possibles d1 di dn unité analysée V1 V2 Wp Wk Contexte gauche Contexte droit Espace de recherche Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

41 Règle d’exploration contextuelle
Signification de l’occurrence de ‘U’ Unité U V1 V2 V3 W1 W2 Contexte avec unités non contiguës Contexte avec unités non contiguës L’unité U est analysée dans un contexte discontinu Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

42 Une hypothèse d’exploration contextuelle
Les indices sont hiérarchisés. Certains indices sont plus importants que d’autres. Il y a des indices saillants (les indicateurs) et des indices complémentaires qui renforcent, spécifient, infirment ce qu’indique l’indice saillant (l’indicateur). C’est l’indicateur qui déclenche et organise un processus d’exploration contextuelle. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

43 Exemple : lever l’indétermination d’une forme polysémique
Une occurrence d’une forme (grammaticale, lexicale) polysémique contient en elle-même plusieurs significations plus spécifiques et déterminables par le contexte. Une forme indéterminée a donc - une potentialité de significations, - un « invariant de signification » - un « signifié de puissance » (Guillaume) Le recours au contexte lève l’indétermination en permettant de spécifier la valeur qu’elle acquiert en contexte. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

44 Un problème de « compréhension » pour le Traitement Automatique
Cinq minutes plus tard, le train déraillait Un problème de décision : peut-on en inférer que « Le train a déraillé ? » « Le train n’a pas déraillé ? » Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

45 Valeurs irréelle et de nouvel état
Valeur de nouvel état : « le train a déraillé » Cinq minutes plus tard, le train déraillait ? Valeur irréelle : « le train n’a pas déraillé » Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

46 Cinq minutes plus tard, le train déraillait.
Le train roulait à 150 km/h, le conducteur a bien vu le feu passer au rouge ; sans sa rapide réaction, cinq minutes plus tard, le train déraillait => « le train n’a pas déraillé » Valeur de l’irréel Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

47 Cinq minutes plus tard, le train déraillait …
Le train roulait à cent cinquante km/h, le conducteur a bien vu le feu passer au rouge mais, malgré sa rapide réaction, cinq minutes plus tard, le train déraillait .... => « le train a déraillé » Valeur de « nouvel état » Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

48 Encore : itération ou continuité ?
Invariant de Encore ? Valeur itérative Nouvelle occurrence Valeur continue Il y est resté plus longtemps ? Luc est encore au bureau Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

49 Encore Luc est encore au bureau => itération ou continuité
Luc va encore au bureau => itération ou continuité A six heure du soir, Luc est encore au bureau => 1. Continuité ; 2. Itération ? Il est huit heure du soir : Luc est encore au bureau, tu peux l’y trouver et faire signer ton papier => 1. Continuité C’est dimanche, et Luc est encore au bureau ! => 1. Itération Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

50 Méthodes d’analyse linguistique
1. Analyse distributionnelle 2. Analyses transformationnelles 2.1. entre niveaux (Chomsky, Shaumyan, Mel’chuk) niveau de surface => niveau profond 2.2. horizontale (Z.S. Harris) 2.3. Grammaire Applicative et Cognitive 3. Représentations logiques (Montague, Kamp…) 4. Analyses contextuelles 4.1. automates markoviens, langages réguliers, motifs : Intex, Nooj 4.2. règles contextuelles 4.3. exploration contextuelle Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

51 Jean-Pierre Desclés, Catégories discursives,
ENS, Lyon, 4 avril 2008

52 Jean-Pierre Desclés, Catégories discursives,
ENS, Lyon, 4 avril 2008

53 Règle d’exploration contextuelle
Règles associées à l’indicateur R1 (indice 11, …., indice 1n) => décision : annotation A1 R2 (indice 21, ….., indice 2p) => décision : annotation A2 Rk (indice k1, …., indice kr) => décision : annotation Ak Indicateur d’une notion Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

54 Indicateur discursif (déclencheur)
L’indicateur déclenche une exploration contextuelle. Un indicateur est un indice saillant, c’est une expression discursive d’une notion (donc une forme identifiable); Les notions plus spécifiques d’une notion de fouille (« point de vue de fouille ») forment une catégorie organisée comme une « carte sémantique »; A chaque notion plus spécifique sont associées une classe d’instances (les indicateurs saillants qui expriment la notion) + une classe de règles d’explorations contextuelles (impliquant des indices complémentaires). A chaque Indicateur est associée une classe de règles d’exploration contextuelles : l’indicateur identifié appelle des règles pour déclencher l’exploration contextuelle => l’Indicateur est un Indice déclencheur. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

55 Carte sémantique (en intension)
de la notion Notion 1 Notion 2 Notion 1.1. Notion 1.2. EC pour la notion 1 Classe de marqueurs de la notion 1 Classe de marqueurs de la notion 2 Classe de marqueurs de la notion 1.1. Classe de marqueurs de la notion 1.2. EC pour la notion 1.1. EC pour la notion 1.1. EC pour la notion 1.1.

56 Jean-Pierre Desclés, Catégories discursives,
ENS, Lyon, 4 avril 2008

57 Carte sémantique de « la rencontre »
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

58 Carte sémantique du repérage abstrait : analyse des valeurs sémantiques de « est »
(Desclés, 1987) Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

59 Annotations discursives par exploration contextuelle
La technique par exploration contextuelle est utilisée pour annoter automatiquement les textes à partir de « point de vue de fouille discursifs ». Les décisions à prendre par l’exploration contextuelle sont : - annoter (ou non) à partir de la carte sémantique en fonction des indices contextuels trouvés; - approfondir éventuellement l’exploration contextuelle par un appel récursif à d’autres règles. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

60 5. Machine à annoter automatiquement : EXCOM (« Exploration Contextuelle Multilingue »)
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

61 Texte annoté automatiquement
Le texte est annoté à partir des traces des opérations de « mise en texte », d’indications discursives conduit à un enrichissement endogène, sans faire appel à des connaissances externes (par exemple des ontologies de domaines ou une classification par genres). Le texte contient en lui-même des indications sur sa propre structure et sur son contenu. Le texte annoté automatiquement permet de procéder à des applications avec des ressources linguistiques relativement économiques. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

62 Texte annoté = texte auto-enrichi à la source d’applications
Texte extrait d’une base de textes Texte nettoyé Texte segmenté (organisation physique) APPLICATIONS Texte + annotations Résumé automatique Constitution de fiches thématiques Fouille sémantique par points de vue Navigation textuelle Recherche d’informations à partir de relations exprimant des « points de vue de fouille »

63 Ressources linguistiques de segmentation automatique
Points de vue de fouille sémantique Ressources linguistiques des points de vue Point de vue « rencontre » Point de vue « citations » Point de vue « causalité » Point de vue « définition » Nouveau Point de vue …. EXCOM : Machine à annoter des Textes par Exploration Contextuelle Base de textes bruts Base de textes annotés 1 4 2 3 Base de textes segmentés Ressources linguistiques de segmentation automatique

64 Machine à annoter des textes (1)
La modélisation de la machine repose sur : Une technique linguistique d’exploration contextuelle (EC); Une Indépendance des ressources et du traitement par rapport aux domaines; La constitution de ressources linguistiques légères et réutilisables pour les différents domaines; Un transfert multilingue relativement rapide (à partir des « cartes sémantiques »)… Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

65 Machine à annoter des textes (2)
Pas d’analyses morphologiques et syntaxiques préalables => nouvelle conception du TAL; Pas nécessairement des entités nommées préalables déterminées => coût plus réduit; Pas de recours à des d’ontologies (générales ou régionales) préalables; Pas de dictionnaires de synonymes (type : Wordnet) => Ressources lourdes à constituer et à maintenir => coût élevé, fragilité Pas d’apprentissage préalable Mais compatibilité avec des bases d’entités nommées, des ontologies de domaines, des analyses morphologiques et syntaxiques auxiliaires, des dictionnaires de synonymie, des traitements statistiques … Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

66 Machines à indexer et SRI en exploitant les annotations discursives
Recherche d’informations - par des notions discursives liées à des points de vue d’interrogation, captées par les annotations automatiques; Applications au Web-sémantique, à la construction d’ontologies Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

67 relations sémantiques
MOCXE : Machine à Indexer selon des « points de vue » (relations sémantiques discursives) BASE de TEXTES ANNOTES automatiquement selon des points de vue Questions posées sous forme de relations sémantiques SRI Textes Indexés selon des points de vue TEXTES ANNOTES manuellement (travail coopératif) Réponses sous forme de segments textuels

68 Recherche d’informations par « relations sémantiques »
Point de vue : « rencontre » Questions Qui rencontre qui ? Qui rencontre qui ? où ? Quand ? Point de vue : «  citation » Questions Qui a dit quoi ? Qui a dit quoi ? Comment ? Dans quel but ? Point de vue : «  causalité » Point de vue : «  définition » Questions Quoi est la cause de quoi ? Comment ? Dans quel but ? Questions Comment est défini quoi ? Qui a défini quoi ?

69 Questions selon un point de vue
SRI selon des « points de vue » sémantiques Rencontre ? Chirac rencontre Qui ? Qui a rencontré Poutine ? Chirac a-t-il rencontré Poutine ? Où ? Quand ? Réponses obtenues par des segments textuels extraits de documents Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

70 Une Application de l’indexation : l’interrogation multilingue
Questions posées en français selon « un point de vue » Questions « équivalentes » posées en coréen (arabe) TAO Base de documents annotés en coréen en arabe EXCOM + SRI en coréen (en arabe) Traduction des réponses Traduction Automatique des réponses en français T humaine Réponses par des segments textuels en coréen , en arabe … TAO

71 6. Un exemple d’annotations discursives d’un texte pour le résumer
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

72 Un texte La préface par Maurice Gross de
Notes du cours de syntaxe de Zellig Harris (Ed. du Seuil, Paris, 1976) Extraire les informations « les plus pertinentes » qui donnent « une idée sur le contenu » du document Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

73 Annotations discursives
Annotations qui donnent des informations interprétatives sur certains segments d’un texte Ces annotations sont sémantiques (indications sur le « contenu » du texte) Elles correspondent à des points de vue de « lecture » d’un humain qui annote (mentalement) ou physiquement (soulignement) un texte Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

74 Structurations dans un texte
Métadonnées : Où est piublié le texte ? Quand ? genre textuel ? Structuration physique ou formelle : segmentation Titres, section Paragraphes, phrases, sections Propositions Enumértations Images, diagrammes, photos Structuration discursive : - citations, définitions, exemples, - annonces thématiques, conclusives - soulignements de l’auteur - rappels de connaissances - appel au lecteur - … Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

75 Premières opérations « Nettoyer » le texte s’il vient du Web
enlever la publicité, isoler les métadonnées garder la structure HTML ? Segmenter le texte en identifiant : titres, sections, paragraphes, phrases, propositions … Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

76 Fouille sémantique « selon des points de vue » discursifs
Annonces thématiques - Conclusions - Signatures des auteurs Appel au lecteur Exemples (extraction) Définitions (extraction) Organisation discursive - Annonce de plan - Enchaînement discursif - Annonce de marqueurs d’intégration linéaire (MIL) Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

77 Exemple de Règle d’exploration contextuelle
pour l’annotation sémantique Annonce thématique Dans une phrase on identifie un déclencheur de la liste des déclencheurs « annonces thématiques » + une position [premier paragraphe] Annoter la phrase : thématique … @annonce thématique\ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

78 + indice de position : [premier paragraphe, première phrase]
 / annonce thématique Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe annonce thématique (Harris) \ + indice de position : [premier paragraphe, première phrase]  => Indice de position déclencheur : [premier paragraphe, seconde phrase] => recherche d’indices complémentaires  / annonce thématique Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de annonce thématique (Harris) \  => Indice de position déclencheur : [premier paragraphe, troisième phrase ] avec des indices complémentaires : chaînage au nom d’auteur Harris par des candidats pronoms. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

79 / annonce thématique Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en , Harris livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est annonce thématique (Harris) \  / Signature de l’auteur Nous ne nous sommes pas contenté de traduire les notes que Harris a lui-même rédigées, mais nous nous sommes efforcé d’adapter la majorité de ses analyses au Signature de l’auteur \  / signature des auteurs Nous remercions Z.S. Harris qui nous a guidé à travers cette adaptation, ainsi que Mlle Yannick Gheerbrandt et M. Amr Helmy Ibrahim qui, par leur présentation dans un séminaire consacré à ce cours, ont contribué à éclaircir certains signature des auteurs (Harris) \  / appel au lecteur Le lecteur, peut-être plus familier avec les présentations de la grammaire générative, ne retrouvera pas immédiatement l’outillage de formalisation développé par Chomsky à la suite des premiers travaux de appel au lecteur (Harris) \ / annonce thématique Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur d’une grammaire annonce thématique (Harris) \

80 + Indice complémentaire : [dernière phrase d’un paragraphe]
/ annonce thématique Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours annonce thématique (Harris) \ + Indice complémentaire : [dernière phrase d’un paragraphe] / annonce thématique La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très annonce thématique (Harris) \ + Indice complémentaire : [première phrase d’un paragraphe]  / annonce thématique L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au annonce thématique (Harris) \  / annonce thématique Les analyses présentées par Harris sont entièrement formalisées, mais in ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer annonce thématique (Harris) \ / annonce thématique Harris a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de annonce thématique (Harris) \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

81 + indice complémentaire : dernière phrase de paragraphe
/ annonce thématique / appel au lecteur / Enchaînement : - D’ailleurs, Harris aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsqu’il est conduit à les annonce thématique \appel au lecteur \ Enchaînement : - (Harris) \  / annonce thématique Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement annonce thématique (Harris) \  / conclusion On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont (Harris) \ Harris ne nie pas l’intérêt de ces parties du discours, simplement il les retrouve comme conséquences de processus grammaticaux généraux appliqués à des mots particuliers de chaque \ + indice complémentaire : dernière phrase de paragraphe / annonce thématique / organisation discursive - Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : @ annonce thématique \ organisation discursive (Harris) \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

82 / annonce thématique / conséquences (Harris) / organisation Harris utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type \ annonce thématique \ conséquences \ organisation discursive (Harris) \  / Exemple Il est un autre exemple qui illustre bien le caractère abstrait des représentations de base de Harris, et qui peut-être apparaît mieux en français qu’en Exemple illustratif \  / Cet exemple nous a d’ailleurs posé un problème d’adaptation des analyses de Harris au Exemple \ Annonce Harris a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment thématique \  / Annonce S’efforçant de construire une théorie minimale du point de vue formel, Harris a constamment cherché à restreindre l’introduction des notions Annonce thématique \  / Appel au Harris accepte ainsi comme grammaticales des phrases qu’un lecteur soucieux de pureté stylistique rejettera comme totalement Appel au lecteur \  / Enchaînement / Annonce C’est ainsi que, dans son analyse de la phrase, Harris sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase Enchaînement \ Annonce thématique/ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

83 + Position [dernier paragraphe, avent dernière phrase]
/ Signature de Pour pouvoir rester le plus près possible de la présentation de Harris, nous avons donc dû transposer certains de ses exemples en les Signature de l’auteur \  / Marqueur d’Intégration linéaire :- / Annonce thématique: D’une part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre d’ailleurs Marqueur d’Intégration linéaire :- \ Annonce thématique \  / Signature de Dans toute la mesure du possible, nous avons vérifié que ces modifications n’introduisaient pas d’incohérence dans l’analyse des phrases françaises présentées , et nous espérons qu’ainsi l’esprit des solutions de Harris aura été Signature de l’auteur \ + Position [dernier paragraphe, avent dernière phrase]   / Signature de l’auteur / Appel au Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de l’essentiel des phénomènes Signature de l’auteur / Appel au lecteur \ + Position : [dernier paragraphe, dernière phrase] ; problème du temps grammatical : passé composé Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

84 Bilan de la réduction (phrases annotées)
En retenant toutes les phrases annotées on obtient : 65 lignes / 255 lignes => rapport ¼ Trop important pour un résumé => trouver une « stratégie de résumé » Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

85 Premières stratégies Introduire des poids
poids forts accordés à certains mots - fréquences dans le texte - mots liés à un thesaurus, mais nécessité d’en avoir un => logiciel Pertinence (Lehmann) => résultats assez mauvais ! Privilégier les règles avec beaucoup d’indices « plus il y a d’indices, plus la règle est pertinente » Privilégier les segments avec des occurrences des termes du domaine étudié (travail spécifique à un domaine) Privilégier les segments avec plusieurs annotations discursives => beaucoup d’informations Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

86 Seconde stratégie, plus linguistique
Ordonner les points de vue d’annotations discursives annonce thématique - 2. conclusions (soulignement) - 3. organisation discursive - 4. remarques d’auteur - 5. exemples - 6. appel au lecteur Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

87 Stratégie de « réduction » (condensation)
On retient les annonces thématiques On retient les remarques conclusives d’auteur = remarques d’auteurs dans certaines positions du texte (fin de paragraphe, dernier paragraphe) Organisation discursive Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

88 / annonce thématique (Harris) @ Z. S
/ annonce thématique Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe annonce thématique (Harris) \ + indice de position : [premier paragraphe, première phrase] => Indice de position déclencheur : [premier paragraphe, seconde phrase] avec des indices complémentaires : chaînage au nom d’auteur Harris par des candidats pronoms + recherche d’indices complémentaires / annonce thématique Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de annonce thématique (Harris) \ => Indice de position déclencheur : [premier paragraphe, troisième phrase ] Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

89 + Indice complémentaire : [dernière phrase d’un paragraphe]
=> Indice de position déclencheur : [premier paragraphe, troisième phrase ] avec des indices complémentaires : chaînage au nom d’auteur Harris par des candidats pronoms. / annonce thématique Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en , Harris livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est annonce thématique (Harris) \ / annonce thématique Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur d’une grammaire annonce thématique (Harris) \ / annonce thématique Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en génral non commutatives, et pas toujours annonce thématique (Harris) \ + Indice complémentaire : [dernière phrase d’un paragraphe] Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

90 + Indice complémentaire : [première phrase d’un paragraphe]
/ annonce thématique La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très annonce thématique (Harris) \ + Indice complémentaire : [première phrase d’un paragraphe] / annonce thématique L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au annonce thématique (Harris) \ / annonce thématique Les analyses présentées par Harris sont entièrement formalisées, mais in ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer annonce thématique (Harris) \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

91 @ annonce thématique \ organisation discursive (Harris) \
/ annonce thématique Harris a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de annonce thématique (Harris) \ / annonce thématique / appel au lecteur / Enchaînement discursif : - D’ailleurs, Harris aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsqu’il est conduit à les annonce thématique \appel au lecteur \ Enchaînement : - (Harris) \ / annonce thématique Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement annonce thématique (Harris) \  / conclusion On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont (Harris) \ / annonce thématique / organisation discursive Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - @ annonce thématique \ organisation discursive (Harris) \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

92 / annonce thématique / conséquences (Harris) / organisation Harris utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type conséquences \ annonce thématique \ organisation discursive (Harris) \ / Annonce Harris a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment thématique \ / Annonce S’efforçant de construire une théorie minimale du point de vue formel, Harris a constamment cherché à restreindre l’introduction des notions Annonce thématique \ / Enchaînement / Annonce C’est ainsi que, dans son analyse de la phrase, Harris sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase Enchaînement \ Annonce thématique \ / Marqueur d’Intégration linéaire / Annonce thématique: D’une part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre d’ailleurs Marqueur d’Intégration linéaire : Marqueur d’Intégration linéaire - \ Annonce thématique \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

93 Texte obtenu en enlevant les balises
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

94 Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de l’anglais. Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en , Harris livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est universelle. Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur d’une grammaire algébrique. Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours associatives. La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très détaillée. L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

95 Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer lui-même. Harris a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. D’ailleurs, Harris aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsqu’il est conduit à les préciser. Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

96 Harris utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type suivant . Harris a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment l’expérience. S’efforçant de construire une théorie minimale du point de vue formel, Harris a constamment cherché à restreindre l’introduction des notions abstraites. C’est ainsi que, dans son analyse de la phrase, Harris sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. D’une part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre d’ailleurs ici. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

97 « Nettoyage final » du texte :
Remplacer certaines occurrences de « Harris » par l’anaphore « il » : Règles d’EC : Substituer aux occurrences de « Harris », le terme « il » Règle positive :  (1) SI « Harris » précède un verbe, ALORS lui substituer « il »  Règles négatives : (2) SI Harris suit « N de » ALORS ne pas substituer (3) SI « Harris » suivi par « par », ALORS ne pas substituer. (4) SI « Harris » précède « qui », ALORS ne pas substituer. SI « Harris » a une première occurrence dans la première phrase d’un paragraphe, ALORS ne pas substituer Autre règle de nettoyage Substituer au signe « il » dans le contexte d’un point « . » de fin de phrase qui le précède de façon contiguë, par « Il ». Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

98 Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de l’anglais. Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en , il livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est universelle. Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur d’une grammaire algébrique. Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours associatives. La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très détaillée. L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

99 Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer lui-même. Il [->Il] a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. D’ailleurs, il aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsqu’il est conduit à les préciser. Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

100 il [->Il] utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type suivant . il [->Il] a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment l’expérience. S’efforçant de construire une théorie minimale du point de vue formel, il a constamment cherché à restreindre l’introduction des notions abstraites. C’est ainsi que, dans son analyse de la phrase, il sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. D’une part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre d’ailleurs ici. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

101 Réduction supplémentaire : Suppression : - des phrases avec MIL par introducteurs - enchaînements discursifs Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

102 Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de l’anglais. Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en , il livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est universelle. [[Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur d’une grammaire algébrique. Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours associatives. ]] La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très détaillée. L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

103 Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer lui-même. Il [->Il] a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. [[ [[ D’ailleurs, Il aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsqu’il est conduit à les préciser. ]] Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. [[ Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - - ]] Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

104 il [->Il] utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type suivant . il [->Il] a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment l’expérience. S’efforçant de construire une théorie minimale du point de vue formel, il a constamment cherché à restreindre l’introduction des notions abstraites. [[ C’est ainsi que, dans son analyse de la phrase, il sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. ]] [[D’une part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre d’ailleurs ici. ]] Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

105 Mis en œuvre par effacement
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

106 Résumé obtenu par extraction, après nettoyage
Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de l’anglais. Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en , il livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est universelle. La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très détaillée. L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

107 Réduction : 25 lignes / 255 lignes = 10 /100
Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer lui-même. Il [->Il] a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. Il utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type suivant . Il a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment l’expérience. S’efforçant de construire une théorie minimale du point de vue formel, il a constamment cherché à restreindre l’introduction des notions abstraites.. Réduction : 25 lignes / 255 lignes = 10 /100 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

108 Jean-Pierre Desclés, Catégories discursives,
ENS, Lyon, 4 avril 2008

109 Jean-Pierre Desclés, Catégories discursives,
ENS, Lyon, 4 avril 2008

110 Signature de l’auteur Appel au lecteur Exemples
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

111 / Signature de l’auteur Nous ne nous sommes pas contenté de traduire les notes que Harris a lui-même rédigées, mais nous nous sommes efforcé d’adapter la majorité de ses analyses au Signature de l’auteur \ / Signature de l’auteur Nous remercions Z.S. Harris qui nous a guidé à travers cette adaptation, ainsi que Mlle Yannick Gheerbrandt et M. Amr Helmy Ibrahim qui, par leur présentation dans un séminaire consacré à ce cours, ont contribué à éclaircir certains Signature de l’auteur (Harris) \   / Signature de Pour pouvoir rester le plus près possible de la présentation de Harris, nous avons donc dû transposer certains de ses exemples en les Signature de l’auteur \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

112 / Signature de Dans toute la mesure du possible, nous avons vérifié que ces modifications n’introduisaient pas d’incohérence dans l’analyse des phrases françaises présentées , et nous espérons qu’ainsi l’esprit des solutions de Harris aura été Signature de l’auteur \ / Signature de l’auteur / Appel au Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de l’essentiel des phénomènes Signature de l’auteur / Appel au lecteur \  + Position : [dernier paragraphe, dernière phrase] ; problème du temps grammatical : passé composé. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

113 Appel au lecteur / Appel au lecteur Le lecteur, peut-être plus familier avec les présentations de la grammaire générative, ne retrouvera pas immédiatement l’outillage de formalisation développé par Chomsky à la suite des premiers travaux de Appel au lecteur (Harris) \ / Appel au Harris accepte ainsi comme grammaticales des phrases qu’un lecteur soucieux de pureté stylistique rejettera comme totalement Appel au lecteur \  / Signature de l’auteur / Appel au Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de l’essentiel des phénomènes Signature de l’auteur / Appel au lecteur \  + Position : [dernier paragraphe, dernière phrase] ; problème du temps grammatical : passé composé. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

114 Appel au lecteur / appel au lecteur Le lecteur, peut-être plus familier avec les présentations de la grammaire générative, ne retrouvera pas immédiatement l’outillage de formalisation développé par Chomsky à la suite des premiers travaux de appel au lecteur (Harris) \ / Signature de l’auteur / Appel au Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de l’essentiel des phénomènes Signature de l’auteur / Appel au lecteur \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

115 Exemples / Exemple Il est un autre exemple qui illustre bien le caractère abstrait des représentations de base de Harris, et qui peut-être apparaît mieux en français qu’en Exemple illustratif \ / Cet exemple nous a d’ailleurs posé un problème d’adaptation des analyses de Harris au Exemple \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

116 7. Comment construire les règles ?
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

117 Comment construire des ressources linguistiques
Comment construire des ressources linguistiques ? Une méthodologie nouvelle ? Comment trouver les indices (déclencheurs et complémentaires) ? Comment trouver les règles ? Comment les écrire ? Comment les présenter ? Comment les valider ? Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

118 Premier cas : lever l’indétermination d’une forme identifiée => valeurs sémantiques connues
Forme grammaticale = Indice déclencheur 1. Chercher un indice complémentaire pour déterminer une des valeurs sémantiques possibles d’une occurrence ; 2. Une valeur étant déterminée, chercher d’autres indices complémentaires pour confirmer ou infirmer la décision ; 3. Constituer une classe d’équivalence d’indices complémentaires pour une même valeur ; 4. Interpréter sémantiquement la classe. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

119 Indice déclencheur => valeurs
Valeur V1 IC IC IC => Indice déclencheur Valeur V2 IC => Valeur V3 IC IC IC => Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

120 Une valeur => indices associées
KIC1 Forme Grammaticale = Indicateur avec valeur déterminée IC IC KIC2 IC KIC3 IC IC IC KIC4 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

121 Base de données : Indices - Valeurs
Classe KIC1d’indices complémentaires Indicateur1 Valeur i Classe KIC2 d’indices complémentaires Valeur i Classe KIC3d’indices complémentaires Valeurj Classe KIC4 d’indices complémentaires Valeur j Classe KIC5 d’indices complémentaires Valeur j Classe KIC1d’indices complémentaires indicateur 2 Valeur k Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

122 Règle pour lever l’indétermination d’une forme grammaticale
Indice complémentaire appartenant à une classe K i Forme analysée = indice déclencheur sont des indices en faveur de la Valeur sémantique V j + Indentification d’une occurrence d’une forme comme Indice Déclencheur SI on a une occurrence d’un indice complémentaire d’une classe K i ALORS ce sont des indices en faveur de la valeur sémantique V j Action : assigner la valeur V j au segment linguistique contenant la forme Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

123 Second cas : résoudre une tâche à partir de notions discursives
Tâche (exemples : résumer, filtrer des informations saillantes, construire des fiches catégorisées, commenter un diagramme, …) Résoudre la tâche, c’est identifier des notions discursives et annoter les textes selon des points de vue correspondant à la tâche à effectuer. Exemple : pour résumer, il faut trouver : les annonces thématiques ; les hypothèses de travail ; les conclusions ; les méthodes ; les résultats Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

124 Notion => expressions linguistiques
Notion discursive (exemples « citation », « définition », « annonce thématique ») 1. identifier les expressions discursives qui sont les marqueurs (indicateurs principaux) de cette notion ; 2. trouver dans le contexte de ces marqueurs des indices complémentaires qui renforcent les indices déclencheurs ; 3. pour chaque indice déclencheur, classer les indices complémentaires dans des classes d’équivalence et écrire des règles d’exploration contextuelle ; 4. donner une interprétation sémantique aux classes d’équivalence; 5. donner une spécification sémantique aux indices déclencheurs. 6. Dresser la « carte sémantique » de la notion. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

125 Notion -Indices IC IC ID IC Notion IC ID IC IC ID IC IC
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

126 Notion : regroupement en classes
Indices complémentaires Indicateur 1 KIC 1 Notion Indices complémentaires KIC 2 Indicateur 2 Indices complémentaires KIC 3 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

127 Base de données : Indices - Notions
Classe KIC1d’indices complémentaires Indicateur 1 Notion i Classe KIC2 d’indices complémentaires Notion i Classe KIC1d’indices complémentaires Indicateur 2 Notion i Classe KIC2 d’indices complémentaires Notion i Classe KIC3 d’indices complémentaires Notion i Classe KIC1d’indices complémentaires Indicateur 3 Notion j

128 Règle pour déterminer une notion
Indice complémentaire associé à une notion N j Indice Déclencheur appartenant à une classe K i sont des indices en faveur de la Notion j + Identification d’une occurrence d’une forme comme Indice Déclencheur d’une notion Nj SI on a une occurrence d’indices complémentaires d’une classe K i ALORS ce sont des indices en faveur de la notion sémantique N j Action : assigner au segment linguistique l’annotation N j Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

129 Quelques références bibliographiques
Desclés Jean-Pierre, Langages applicatifs, langues naturelles et cognition, Hermès, Paris, 1990. Desclés Jean-Pierre, “Systèmes d’exploration contextuelle”, Co-texte et calcul du sens, (Claude Guimier), Presses de l’universitaires de Caen, 1997 pp Descles J.-P., Soh (Éditeurs) Langage, cognition et textes, tome 1, tome 2, Université de Hankuk et Université de Paris-Sorbonne, Paris, Séoul, avril 1997, 1998. Desclés Jean-Pierre, « Polysémie verbale, un exemple : le verbe avancer », Colloque international « Polysémie », Université de Paris-Sorbonne, Paris, décembre 2001. Desclés Jean-Pierre, Jean-Luc Minel, « Résumé automatique et filtrage sémantique des textes », Ingénierie des langues, sous la direction de Jean-Marie Pierrel, Paris : Hermès, 2000, pp Desclés Jean-Pierre, Jean-Luc Minel, « Interpréter par exploration contextuelle », sous la direction de Francis Corblin, Claire Gardent, Interpréter en contexte, Hermès, Paris, pp Desclés Jean-Pierre, Flageul Valérie, Kerenbosh Chritiane, Meunier Jean-Marc, Richard Jean-François, “Sémantique cognitive de l’action , I. Contexte théorique”, Langages, n° 132 décembre 1998 pp Minel, Jean-Luc, Desclés, Jean-Pierre, Fouille sémantique des textes, TSI, 2002 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

130 Thèses Thèses soutenues : Thèses en cours : Antoine Blais
C. Jouis, J. Berri, D. Reppert, Y. Oh, A. Jackiewicz, D. Garcia, G. Mourad, J.L. Minel, S. Ben Hazes, S., Benthami, G. Crispino, D. Wonsever … Thèses en cours : Antoine Blais Montacem Alrahabi Marc Bertin Iana Atanassova …. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

131 Merci pour votre attention !
Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008


Télécharger ppt "Université de Lyon, ENS, vendredi 4 avril 2008"

Présentations similaires


Annonces Google