Université de Lyon, ENS, vendredi 4 avril 2008

Slides:



Advertisements
Présentations similaires
Comment annoter un texte
Advertisements

MOT Éditeur de modèles de connaissances par objets typés
La compréhension en lecture
Présentation des programmes de terminale STG Juin 2006.
Olivier Kraif, Agnès Tutin LIDILEM
XML - Henry Boccon-Gibod 1 XML, Langage de description La question du choix de formalismes Les entités et leur représentations modalités de modèles et.
Urbanisation de Systèmes d'Information
Entre construction théorique et mise en œuvre opérationnelle
Exemple : Itinéraire de lecture.
Construction d’une séquence pédagogique
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
METHODOLOGIE.
Indexation textuelle : Systèmes de recherche d’informations
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Le point sur les nouvelles épreuves du baccalauréat
Le logiciel CMAP Tools : ce qu’il est, ses fonctionnalités
Traitement de données socio-économiques et techniques d’analyse :
Pour un système formel de description linguistique
Analyses des situations didactiques
Initiation à la conception de systèmes d'information
RÉSOLUTION DE PROBLÈMES
UE : 3.4. S4 Initiation à la démarche de recherche
FICHE METHODOLOGIQUE DE LA DISSERTATION
Algorithmique et Programmation
Entre construction théorique et mise en œuvre opérationnelle
Etude globale de système.
Académie de Versailles - Inspection pédagogique régionale de lettres
MOT Éditeur de modèles de connaissances par objets typés
Définir des caractéristiques chercher de linformation? sur un support électronique? Élaborer un cadre théorique pour comprendre les enjeux et proposer.
Introduction à la recherche en science politique
Baccalauréat en relations internationales et droit international
Discours explicatif.
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Chapitre 2 La description du langage
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
La compréhension en lecture
Portée, arrimages et intervenants Évolution des méthodes
Programmation non procédurale Le projet ECOLE 2000
Sensibilisation a la modelisation
Technique du résumé de synthèse de l’exposé écrit
la maîtrise de la langue française Inspection Pédagogique Régionale
Formation utilisateurs CMS. 16/01/20082 Plan 1)Présentation 2)Espace contributeur 3)Plan du site 4)Créer des pages 5)Edition en ligne 6)Les ressources.
LA TECHNIQUE DU RÉSUMÉ Résumer un texte, c'est réduire un énoncé selon un certain nombre de mots imposé, en en restituant l'essentiel des idées et la structure.
L’observation réfléchie de la langue
Algorithmes et Programmation
Rédaction d’un dossier SVT 3eme.
Théories, formalismes, modèles Sylvain Kahane Modyco, Université Paris 10 - Nanterre Mosaïque, Paris, 1/12/2006.
PRESENTATION D'OUTILS POUVANT ACCOMPAGNER DES APPRENTISSAGES.
Le langage Racket (Lisp)
Extrait du Referentiel BTS Systèmes numériques Options : Informatique et réseaux et Électronique et communication S1 à S9 Définition des savoirs et savoir-faire.
Explorer le texte 2.
1 Management des unités commerciales Management des unités commerciales LANGUE VIVANTE ÉTRANGÈRE I - coefficient 3 L’usage d’un dictionnaire bilingue est.
ÉPREUVES ÉCRITES D'ADMISSIBILITÉ bonne maîtrise des savoirs scientifiques, du programme du concours compréhension synthétique et cohérente des concepts.
Recherche d’information
Structures de données avancées : LH (Hachage linéaire) D. E ZEGOUR Institut National d ’Informatique.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
( ) Collège de Maisonneuve
TEXT MINING Fouille de textes
Video.
Progression/Programmation – Français (1/3)
STRATÉGIES EN LECTURE PLANIFIER MA LECTURE
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
LES TEXTES ET LES SHADOKS (Docs d’application et d’accompagnement)
Structure (Plan) d’un mémoire
Démarche d’enseignement de l’APL : analyser
Comment faire un résumé d’article ?
Les bases de données Séance 3 Construction du Modèle Conceptuel de Données.
MES STRATÉGIES DE LECTURE
Comment réaliser un résumé? Section BAC instituteur préscolaire.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
Transcription de la présentation:

Université de Lyon, ENS, vendredi 4 avril 2008 Catégories discursives et de « mise en texte » (vers une « sémantique discursive » et son traitement automatique) Jean-Pierre Desclés LaLIC « Langages, Logiques, Informatique, Cognition» Université de Paris-Sorbonne Jean-Pierre.descles@paris.sorbonne.fr Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Plan de l’exposé 1. Cadre théorique de référence 2. Trois composantes d’une langue 3. Un exemple de structuration discursive 4. Terchnique linguistico-computationnelle d’Exploration Contextuelle 5. Machine à annoter automatiquement, la machine EXCOM 6. Un exemple d’annotations discursives d’un texte : un texte de Maurice Gross 7. Comment construire les règles ? Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

I. Cadre théorique de référence Le langage et les langues Modèles formels et computationnels Théorie / Applications Concepts aux fondements de la démarche : dialogisme, abduction, catégorisation … Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Quelques idées fortes Trois composantes d’une langue : lexicale; grammaticale; discursive. Le grammatical est le squelette d’une langue, le lexique en est la chair. La composante discursive est structurante ; elle permet une annotation sémantique automatique de textes, ce qui conduit à de nouveaux modes d’exploitation des informations textuelles. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Le grammatical structure les langues La distinction « mots pleins » (le lexique) et « mots vides » (les unités grammaticales) n’est pas opératoire pour l’analyse des langues. => Traitements statistiques Le grammatical (à ne pas réduire au syntaxique !) est le support de significations hautement structurantes. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Structures discursives signifiantes dans les textes (discours) Un texte possède : - une structure physique (cf. SegaText); - une structure discursive qui a une portée sémantique. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Découpages d’une langue Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Découpage hiérarchique «classique » : Traduction automatique, Linguistique structurale, Grammaire générative 1. Phonique 2. Morphologique 3. Syntaxique 4. Sémantique -> « quelle sémantique » ? 5. Pragmatique 6. Rhétorique -> Discours, Textes Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Autre découpage : Kurylowicz, Jakobson, Vendryès, Guillaume, Benveniste, Pottier, Shaumyan, Desclés … Lexique Grammaire Discours Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Interactions entre découpages Morphologie Syntaxe Sémantique Pragmatique (énonciation) Lexique Grammaire Discours Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Grammaire Formes catégories morphologiques catégories syntaxiques Opérations prédication détermination quantification énonciation Contexte Exploration contextuelle types Grammaires Catégorielles opérateurs Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Modèle de la Grammaire Applicative et Cognitive (GAC) Représentations sémantico-cognitives (schèmes; objets catégorisés) Interprétation et construction sémantique Analyse lexicale Synthèse lexicale Représentations logico-grammaticales (schémas grammaticaux et actanciels) Grammaire Catégorielle Combinatoire Applicative Analyse catégorielle Synthèse catégorielle Configurations morpho-syntaxiques d’une langue

Qu’est-ce qu’une langue ? Mise en relation entre : Un système sémantico-énonciatif (non directement observable) et 2. Un système sémiotique expressif (plus directement observable). Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Organisation sémantico-cognitive Primitives et schèmes sémantico-cognitifs Schèmes énonciatifs ; schèmes de diathèses … Opérateurs d’intégration des schèmes en prédicats; Opérateurs de composition (prédication, détermination, thématisation, quantification …) Synthèse Analyse Langue comme un système sémiotique d’expressions catégorisées (morphèmes, mots, syntagmes, phrases, énoncés) Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Langue comme un ensemble d’énoncés, de textes, de discours => Insertion dans un référentiel pragmatico-énonciatif Schèmes énonciatifs ; relations dia-logiques Organisation sémantico-cognitive Primitives et schèmes sémantico-cognitifs; schèmes diathétiques (transitivité, moyen …) Opérateurs d’intégration des schèmes en prédicats; Opérateurs de composition (prédication, détermination, quantification, thématisation, connexion …); => Opérations de « mise en texte », en discours Langue comme un ensemble d’énoncés, de textes, de discours Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

2. Trois composantes d’une langue Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Trois composantes d’une langue Composante lexicale (mots, morphèmes). Composante grammaticale (mots, morphèmes, phrases, énoncés). Composante discursive (phrases, propositions, textes, discours) Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Unités linguistiques Nominales (orientées « objet ») Opérateurs (orientés propriétés, relations) Noms Unités lexicales (mots lexicaux) Verbes Prépositions Adjectifs Unités grammaticales Morphèmes Phrases Enoncés Textes Discours Unités discursives Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Dépendance / Indépendance par rapport aux domaines d’utilisation Le lexical (en particulier nominal) est fortement dépendant des domaines d’utilisation => construction d’ontologies spécifiques aux domaines. Le grammatical et le discursif sont fortement indépendants des domaines d’utilisation. Cette deuxième caractéristique (indépendance) doit / peut être exploitée pour la recherche d’informations et la construction, l’utilisation et la transmission (aspect didactique) de connaissances. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

- + TEXTE (DISCOURS) PHRASE (ENONCE) MOT Nominales (orientées objet) Opératives (orientées relations) Unités lexicales Indépendance par rapport aux domaines et aux genres Unités grammaticales Unités discursives + Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Catégories - lexicales - grammaticales - discursives Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Catégorie lexicale Une forme lexicale Un réseau polysémique Relation entre une forme et un réseau de valeurs avec un éventuel invariant (« signifié de puissance ») (4) Règles d’exploration contextuelle pour associer une valeur à une occurrence de forme Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Catégorie grammaticale Paradigme de formes (conjugaisons, déclinaisons, oppositions formelles …) une forme grammaticale = marqueur d’opérations Carte (réseau) de concepts (opérateurs, traits …) Relations (non biunivoques) entre (1) et (2) Règles d’exploration contextuelle (aspects discursifs) Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Catégorie discursive Instances = indicateurs formels de notions discursives => classes d’indicateurs (2) « Cartes sémantiques » de notions (3) Relations (non biunivoques) entre (1) et (2) (4) Règles d’exploration contextuelle Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Catégories discursives « Mise en texte » Points de vue de fouille Organisation discursive Organisation du contenu Organisation dia-logique Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Catégories discursives de « mise en texte » Organisation discursive Organisation d’un contenu Organisation dia-logique Titres, sous-titres Annonce de plan Références bibliographiques Annonce de figures Annonce de formules Annonce d’exemples Annonce d’une preuve Annonce d’énumérations Navigation textuelle Navigation hyper-textuelle Annonce des objectifs Annonces thématiques Changements thématiques Conclusions Résultats Résumé d’un propos Reformulation d’un propos Enoncé d’un problème Commentaires d’une figure Soulignement de l’auteur Adresse au lecteur Renvoi à des citations Point de vue personnel Point de vue médiatisé Prises en charge Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Points de vue de fouille Positionnements énonciatifs Argumentation Extraction NOTIONS discursives : Relations causales Enchaînements temporels Localisation spatiale Rencontres-connexions Définitions Citations : qui dit quoi ? Comment on fait une référence à un auteur (bibliosémantique)? Justifier une proposition Cause d’une proposition Explication d’une proposition Contredire une proposition Argument d’autorité argument par « citation » « Prise en charge énonciative » Affirmation Assertion Constat Discours rapporté Prise en charge médiatisée Prise en charge modalisée => Carte sémantique Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

3. Un Exemple de structuration discursive Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Un exemple de structuration discursive (1) Cet article a pour objectif de montrer que … est un … très important dans …. L’article est divisé en quatre parties. La première partie présentera le problème de …; la seconde tentera de répondre à la question de …; la troisième partie dévelopera les concepts relatifs à …; enfin, la dernière partie traitre de certaines applications et des modes d’évaluation de …. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Un exemple de structuration discursive (1’) Cet article a pour objectif de montrer que l’exploration contextuelle est un processus très important dans l’activité de compréhension. L’article est divisé en quatre parties. La première partie présentera le problème de l’indétermination sémantique; la seconde tentera de répondre à la question de « comment lever l’indétermination sémantique ? »; la troisième partie développera les concepts relatifs à la technique linguistico-informatique de l’exploration contextuelle; enfin, la dernière partie traitre de certaines applications et des modes d’évaluation de cette nouvelle approche opératoire du contexte dans la recherche des informations. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Un exemple de structuration discursive (2) Il est important de noter que … Le lecteur remarquera que la distinction entre … et … est inopérante, contrairement à …. L’approche que nous préconisons est essentiellement …. Mon hypothèse, explicitée dans [X, 2007], est que …. «  …, comme l’affirme … , …. ». Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Un exemple de structuration discursive (2’) Il est important de noter que l’EC est indépendante des domaines et des genres. Le lecteur remarquera que la distinction entre mots peins et mots vides est inopérante contrairement à ce qui a été souvent affirmé. L’approche que nous préconisons ici est essentiellement linguistique. Mon hypothèse, explicitée dans [Desclés, 2007], est que la syntaxe est utile mais non indispensable aux processus de compréhension des textes. «  La bonne compréhension, comme l’affirme Culioli , est un cas particulier du malentendu ». Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Un exemple de structuration discursive (3) Par définition, … est une composante de … . Elle comprend … parties : la première est un ensemble … ; la seconde un ensemble structuré de …; la troisième une relation entre … et … ; la quatrième un ensemble de règles …. Selon …., la …. est une des parties les plus essentielles de la ….. Mais pour nous, c’est la composante … qui est la plus fondamentale pour l’étude des propriétés … dans …. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Un exemple de structuration discursive (3’) Par définition, une catégorie grammaticale est une composante de la grammaire. Elle comprend quatre parties : la première est un ensemble de formes; la seconde un ensemble structuré de significations; la troisième une relation entre formes et significations; la quatrième un ensemble de règles d’exploration contextuelle. Selon la Grammaire Générative, la syntaxe est une des parties les plus essentielles de la langue. Mais pour nous, c’est la composante grammaticale qui est la plus fondamentale pour l’étude des propriétés stucturantes dans la langue. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Un exemple de structuration discursive (4) Dans [U, 2001], le lecteur trouvera toutes les explications … sur la démarche par …., développée par [X,1999; Y, 2001; Z,1997, 1999 ] en réponse aux propos tenus par [V, 1998]. En effet, l’approche par … risque d’entraîner une augmentation du …. entre les … et …. C’est du moins l’opinion de la plupart des experts du …. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Un exemple de structuration discursive (4’) Dans [Desclés, 2001], le lecteur trouvera toutes les explications complémentaires et détaillées sur la démarche par exploration contextuelle, développée par [X,1999; Y, 2001; Z,1997, 1999 ] en réponse aux propos tenus par [V, 1998]. En effet, l’approche par ontologies trop régionales risque d’entraîner une augmentation du fossé numérique entre les pays pauvres de l’Afrique et les pays riches de l’Europe et des Etats Unis d’Amérique. C’est du moins l’opinion de la plupart des experts du numérique. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

4. Technique linguistico-computationnelle de l’Exploration Contextuelle Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Abduction : remonter vers une hypothèse plausible HYPOTHESE : p Indice q1 Indice q2 Indice q3 Indice q4 Les indices q1,q2,q3,q4 sont en faveur de l’hypothèse p : Si p => q1, q2, q3, q4 or q1,q2,q3,q4 --------------------------------- l’hypothèse p est plausible Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Exploration contextuelle L’exploration contextuelle est destinée à résoudre un problème et à prendre des décisions. On ne sait pas a priori où trouver les indices pertinents dans le contexte. Par conséquent, il faut : déclencher la recherche d’indices; définir l’espace de recherche; prendre une décision comme : - lever une indétermination sémantique - retenir une information pertinente… distinguer les indices qui sont des déclencheurs d’une exploration et les indices complémentaires qui vont confirmer, affiner ou infirmer une hypothèse Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Décision di à partir de l’occurrence de l’unité analysée en fonction de son contexte Espace des décisions possibles d1 di dn unité analysée V1 V2 Wp Wk Contexte gauche Contexte droit Espace de recherche Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Règle d’exploration contextuelle Signification de l’occurrence de ‘U’ Unité U V1 V2 V3 … … … W1 W2 … … Contexte avec unités non contiguës Contexte avec unités non contiguës L’unité U est analysée dans un contexte discontinu Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Une hypothèse d’exploration contextuelle Les indices sont hiérarchisés. Certains indices sont plus importants que d’autres. Il y a des indices saillants (les indicateurs) et des indices complémentaires qui renforcent, spécifient, infirment ce qu’indique l’indice saillant (l’indicateur). C’est l’indicateur qui déclenche et organise un processus d’exploration contextuelle. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Exemple : lever l’indétermination d’une forme polysémique Une occurrence d’une forme (grammaticale, lexicale) polysémique contient en elle-même plusieurs significations plus spécifiques et déterminables par le contexte. Une forme indéterminée a donc - une potentialité de significations, - un « invariant de signification » - un « signifié de puissance » (Guillaume) Le recours au contexte lève l’indétermination en permettant de spécifier la valeur qu’elle acquiert en contexte. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Un problème de « compréhension » pour le Traitement Automatique Cinq minutes plus tard, le train déraillait Un problème de décision : peut-on en inférer que « Le train a déraillé ? » « Le train n’a pas déraillé ? » Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Valeurs irréelle et de nouvel état Valeur de nouvel état : « le train a déraillé » Cinq minutes plus tard, le train déraillait ? Valeur irréelle : « le train n’a pas déraillé » Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Cinq minutes plus tard, le train déraillait. Le train roulait à 150 km/h, le conducteur a bien vu le feu passer au rouge ; sans sa rapide réaction, cinq minutes plus tard, le train déraillait => « le train n’a pas déraillé » Valeur de l’irréel Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Cinq minutes plus tard, le train déraillait … Le train roulait à cent cinquante km/h, le conducteur a bien vu le feu passer au rouge mais, malgré sa rapide réaction, cinq minutes plus tard, le train déraillait .... => « le train a déraillé » Valeur de « nouvel état » Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Encore : itération ou continuité ? Invariant de Encore ? Valeur itérative Nouvelle occurrence Valeur continue Il y est resté plus longtemps ? Luc est encore au bureau Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Encore Luc est encore au bureau => itération ou continuité Luc va encore au bureau => itération ou continuité A six heure du soir, Luc est encore au bureau => 1. Continuité ; 2. Itération ? Il est huit heure du soir : Luc est encore au bureau, tu peux l’y trouver et faire signer ton papier => 1. Continuité C’est dimanche, et Luc est encore au bureau ! => 1. Itération Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Méthodes d’analyse linguistique 1. Analyse distributionnelle 2. Analyses transformationnelles 2.1. entre niveaux (Chomsky, Shaumyan, Mel’chuk) niveau de surface => niveau profond 2.2. horizontale (Z.S. Harris) 2.3. Grammaire Applicative et Cognitive 3. Représentations logiques (Montague, Kamp…) 4. Analyses contextuelles 4.1. automates markoviens, langages réguliers, motifs : Intex, Nooj 4.2. règles contextuelles 4.3. exploration contextuelle Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Règle d’exploration contextuelle Règles associées à l’indicateur R1 (indice 11, …., indice 1n) => décision : annotation A1 R2 (indice 21, ….., indice 2p) => décision : annotation A2 Rk (indice k1, …., indice kr) => décision : annotation Ak Indicateur d’une notion Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Indicateur discursif (déclencheur) L’indicateur déclenche une exploration contextuelle. Un indicateur est un indice saillant, c’est une expression discursive d’une notion (donc une forme identifiable); Les notions plus spécifiques d’une notion de fouille (« point de vue de fouille ») forment une catégorie organisée comme une « carte sémantique »; A chaque notion plus spécifique sont associées une classe d’instances (les indicateurs saillants qui expriment la notion) + une classe de règles d’explorations contextuelles (impliquant des indices complémentaires). A chaque Indicateur est associée une classe de règles d’exploration contextuelles : l’indicateur identifié appelle des règles pour déclencher l’exploration contextuelle => l’Indicateur est un Indice déclencheur. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Carte sémantique (en intension) de la notion Notion 1 Notion 2 Notion 1.1. Notion 1.2. EC pour la notion 1 Classe de marqueurs de la notion 1 Classe de marqueurs de la notion 2 Classe de marqueurs de la notion 1.1. Classe de marqueurs de la notion 1.2. EC pour la notion 1.1. EC pour la notion 1.1. EC pour la notion 1.1.

Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Carte sémantique de « la rencontre » Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Carte sémantique du repérage abstrait : analyse des valeurs sémantiques de « est » (Desclés, 1987) Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Annotations discursives par exploration contextuelle La technique par exploration contextuelle est utilisée pour annoter automatiquement les textes à partir de « point de vue de fouille discursifs ». Les décisions à prendre par l’exploration contextuelle sont : - annoter (ou non) à partir de la carte sémantique en fonction des indices contextuels trouvés; - approfondir éventuellement l’exploration contextuelle par un appel récursif à d’autres règles. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

5. Machine à annoter automatiquement : EXCOM (« Exploration Contextuelle Multilingue ») Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Texte annoté automatiquement Le texte est annoté à partir des traces des opérations de « mise en texte », d’indications discursives conduit à un enrichissement endogène, sans faire appel à des connaissances externes (par exemple des ontologies de domaines ou une classification par genres). Le texte contient en lui-même des indications sur sa propre structure et sur son contenu. Le texte annoté automatiquement permet de procéder à des applications avec des ressources linguistiques relativement économiques. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Texte annoté = texte auto-enrichi à la source d’applications Texte extrait d’une base de textes Texte nettoyé Texte segmenté (organisation physique) APPLICATIONS Texte + annotations Résumé automatique Constitution de fiches thématiques Fouille sémantique par points de vue Navigation textuelle Recherche d’informations à partir de relations exprimant des « points de vue de fouille »

Ressources linguistiques de segmentation automatique Points de vue de fouille sémantique Ressources linguistiques des points de vue Point de vue « rencontre » Point de vue « citations » Point de vue « causalité » Point de vue « définition » Nouveau Point de vue …. EXCOM : Machine à annoter des Textes par Exploration Contextuelle Base de textes bruts Base de textes annotés 1 4 2 3 Base de textes segmentés Ressources linguistiques de segmentation automatique

Machine à annoter des textes (1) La modélisation de la machine repose sur : Une technique linguistique d’exploration contextuelle (EC); Une Indépendance des ressources et du traitement par rapport aux domaines; La constitution de ressources linguistiques légères et réutilisables pour les différents domaines; Un transfert multilingue relativement rapide (à partir des « cartes sémantiques »)… Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Machine à annoter des textes (2) Pas d’analyses morphologiques et syntaxiques préalables => nouvelle conception du TAL; Pas nécessairement des entités nommées préalables déterminées => coût plus réduit; Pas de recours à des d’ontologies (générales ou régionales) préalables; Pas de dictionnaires de synonymes (type : Wordnet) => Ressources lourdes à constituer et à maintenir => coût élevé, fragilité Pas d’apprentissage préalable Mais compatibilité avec des bases d’entités nommées, des ontologies de domaines, des analyses morphologiques et syntaxiques auxiliaires, des dictionnaires de synonymie, des traitements statistiques … Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Machines à indexer et SRI en exploitant les annotations discursives Recherche d’informations - par des notions discursives liées à des points de vue d’interrogation, captées par les annotations automatiques; Applications au Web-sémantique, à la construction d’ontologies Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

relations sémantiques MOCXE : Machine à Indexer selon des « points de vue » (relations sémantiques discursives) BASE de TEXTES ANNOTES automatiquement selon des points de vue Questions posées sous forme de relations sémantiques SRI Textes Indexés selon des points de vue TEXTES ANNOTES manuellement (travail coopératif) Réponses sous forme de segments textuels

Recherche d’informations par « relations sémantiques » Point de vue : « rencontre » Questions Qui rencontre qui ? Qui rencontre qui ? où ? Quand ? Point de vue : «  citation » Questions Qui a dit quoi ? Qui a dit quoi ? Comment ? Dans quel but ? Point de vue : «  causalité » Point de vue : «  définition » Questions Quoi est la cause de quoi ? Comment ? Dans quel but ? Questions Comment est défini quoi ? Qui a défini quoi ?

Questions selon un point de vue SRI selon des « points de vue » sémantiques Rencontre ? Chirac rencontre Qui ? Qui a rencontré Poutine ? Chirac a-t-il rencontré Poutine ? Où ? Quand ? Réponses obtenues par des segments textuels extraits de documents Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Une Application de l’indexation : l’interrogation multilingue Questions posées en français selon « un point de vue » Questions « équivalentes » posées en coréen (arabe) TAO Base de documents annotés en coréen en arabe EXCOM + SRI en coréen (en arabe) Traduction des réponses Traduction Automatique des réponses en français T humaine Réponses par des segments textuels en coréen , en arabe … TAO

6. Un exemple d’annotations discursives d’un texte pour le résumer Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Un texte La préface par Maurice Gross de Notes du cours de syntaxe de Zellig Harris (Ed. du Seuil, Paris, 1976) Extraire les informations « les plus pertinentes » qui donnent « une idée sur le contenu » du document Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Annotations discursives Annotations qui donnent des informations interprétatives sur certains segments d’un texte Ces annotations sont sémantiques (indications sur le « contenu » du texte) Elles correspondent à des points de vue de « lecture » d’un humain qui annote (mentalement) ou physiquement (soulignement) un texte Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Structurations dans un texte Métadonnées : Où est piublié le texte ? Quand ? genre textuel ? Structuration physique ou formelle : segmentation Titres, section Paragraphes, phrases, sections Propositions Enumértations Images, diagrammes, photos Structuration discursive : - citations, définitions, exemples, - annonces thématiques, conclusives - soulignements de l’auteur - rappels de connaissances - appel au lecteur - … Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Premières opérations « Nettoyer » le texte s’il vient du Web enlever la publicité, isoler les métadonnées garder la structure HTML ? Segmenter le texte en identifiant : titres, sections, paragraphes, phrases, propositions … Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Fouille sémantique « selon des points de vue » discursifs Annonces thématiques - Conclusions - Signatures des auteurs Appel au lecteur Exemples (extraction) Définitions (extraction) Organisation discursive - Annonce de plan - Enchaînement discursif - Annonce de marqueurs d’intégration linéaire (MIL) Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Exemple de Règle d’exploration contextuelle pour l’annotation sémantique Annonce thématique Dans une phrase on identifie un déclencheur de la liste des déclencheurs « annonces thématiques » + une position [premier paragraphe] Annoter la phrase : /@annonce thématique … @annonce thématique\ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

+ indice de position : [premier paragraphe, première phrase]  / annonce thématique (Harris) @ Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. @ annonce thématique (Harris) \ + indice de position : [premier paragraphe, première phrase]  => Indice de position déclencheur : [premier paragraphe, seconde phrase] => recherche d’indices complémentaires  / annonce thématique (Harris) @ Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de l’anglais. @ annonce thématique (Harris) \  => Indice de position déclencheur : [premier paragraphe, troisième phrase ] avec des indices complémentaires : chaînage au nom d’auteur Harris par des candidats pronoms. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

/ annonce thématique (Harris) @ Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en 1973-1974, Harris livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est universelle. @ annonce thématique (Harris) \  / Signature de l’auteur (Harris) @ Nous ne nous sommes pas contenté de traduire les notes que Harris a lui-même rédigées, mais nous nous sommes efforcé d’adapter la majorité de ses analyses au français. @ Signature de l’auteur (Harris) @ \  / signature des auteurs (Harris) @ Nous remercions Z.S. Harris qui nous a guidé à travers cette adaptation, ainsi que Mlle Yannick Gheerbrandt et M. Amr Helmy Ibrahim qui, par leur présentation dans un séminaire consacré à ce cours, ont contribué à éclaircir certains passages. @ signature des auteurs (Harris) \  / appel au lecteur (Harris) @ Le lecteur, peut-être plus familier avec les présentations de la grammaire générative, ne retrouvera pas immédiatement l’outillage de formalisation développé par Chomsky à la suite des premiers travaux de Harris. @ appel au lecteur (Harris) \ / annonce thématique (Harris) @ Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur d’une grammaire algébrique @ annonce thématique (Harris) \

+ Indice complémentaire : [dernière phrase d’un paragraphe] / annonce thématique (Harris) @ Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours associatives. @ annonce thématique (Harris) \ + Indice complémentaire : [dernière phrase d’un paragraphe] / annonce thématique (Harris) @ La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très détaillée. @ annonce thématique (Harris) \ + Indice complémentaire : [première phrase d’un paragraphe]  / annonce thématique (Harris) @ L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. @ annonce thématique (Harris) \  / annonce thématique (Harris) @ Les analyses présentées par Harris sont entièrement formalisées, mais in ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer lui-même. @ annonce thématique (Harris) \ / annonce thématique (Harris) @ Harris a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. @ annonce thématique (Harris) \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

+ indice complémentaire : dernière phrase de paragraphe / annonce thématique / appel au lecteur / Enchaînement : - (Harris) @ D’ailleurs, Harris aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsqu’il est conduit à les préciser. @ annonce thématique \appel au lecteur \ Enchaînement : - (Harris) \  / annonce thématique (Harris) @ Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement linguistiques. @ annonce thématique (Harris) \  / conclusion (Harris) @ On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. @conclusion (Harris) \  /@ Harris ne nie pas l’intérêt de ces parties du discours, simplement il les retrouve comme conséquences de processus grammaticaux généraux appliqués à des mots particuliers de chaque langue @ \ + indice complémentaire : dernière phrase de paragraphe / annonce thématique / organisation discursive (Harris) @ - Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - - - - @ annonce thématique \ organisation discursive (Harris) \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

/ annonce thématique / conséquences (Harris) / organisation discursive @ Harris utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type suivant : @ \ annonce thématique \ conséquences \ organisation discursive (Harris) \  / Exemple illustratif @ Il est un autre exemple qui illustre bien le caractère abstrait des représentations de base de Harris, et qui peut-être apparaît mieux en français qu’en anglais. @ Exemple illustratif \  / Exemple @ Cet exemple nous a d’ailleurs posé un problème d’adaptation des analyses de Harris au français. @ Exemple \ Annonce thématique @ Harris a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment l’expérience. @annonce thématique \  / Annonce thématique @ S’efforçant de construire une théorie minimale du point de vue formel, Harris a constamment cherché à restreindre l’introduction des notions abstraites. @ Annonce thématique \  / Appel au lecteur @ Harris accepte ainsi comme grammaticales des phrases qu’un lecteur soucieux de pureté stylistique rejettera comme totalement inacceptables.@ Appel au lecteur \  / Enchaînement / Annonce thématique @ C’est ainsi que, dans son analyse de la phrase, Harris sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. @ Enchaînement \ Annonce thématique/ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

+ Position [dernier paragraphe, avent dernière phrase] / Signature de l’auteur @ Pour pouvoir rester le plus près possible de la présentation de Harris, nous avons donc dû transposer certains de ses exemples en les déformant.@ Signature de l’auteur \  / Marqueur d’Intégration linéaire :- / Annonce thématique: - @ D’une part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre d’ailleurs ici. @ Marqueur d’Intégration linéaire :- \ Annonce thématique \  / Signature de l’auteur @ Dans toute la mesure du possible, nous avons vérifié que ces modifications n’introduisaient pas d’incohérence dans l’analyse des phrases françaises présentées , et nous espérons qu’ainsi l’esprit des solutions de Harris aura été respecté. @ Signature de l’auteur \ + Position [dernier paragraphe, avent dernière phrase]   / Signature de l’auteur / Appel au lecteur @ Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de l’essentiel des phénomènes syntaxiques. @ Signature de l’auteur / Appel au lecteur \ + Position : [dernier paragraphe, dernière phrase] ; problème du temps grammatical : passé composé Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Bilan de la réduction (phrases annotées) En retenant toutes les phrases annotées on obtient : 65 lignes / 255 lignes => rapport ¼ Trop important pour un résumé => trouver une « stratégie de résumé » Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Premières stratégies Introduire des poids poids forts accordés à certains mots - fréquences dans le texte - mots liés à un thesaurus, mais nécessité d’en avoir un => logiciel Pertinence (Lehmann) => résultats assez mauvais ! Privilégier les règles avec beaucoup d’indices « plus il y a d’indices, plus la règle est pertinente » Privilégier les segments avec des occurrences des termes du domaine étudié (travail spécifique à un domaine) Privilégier les segments avec plusieurs annotations discursives => beaucoup d’informations Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Seconde stratégie, plus linguistique Ordonner les points de vue d’annotations discursives - 1. annonce thématique - 2. conclusions (soulignement) - 3. organisation discursive - 4. remarques d’auteur - 5. exemples - 6. appel au lecteur Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Stratégie de « réduction » (condensation) On retient les annonces thématiques On retient les remarques conclusives d’auteur = remarques d’auteurs dans certaines positions du texte (fin de paragraphe, dernier paragraphe) Organisation discursive Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

/ annonce thématique (Harris) @ Z. S / annonce thématique (Harris) @ Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. @ annonce thématique (Harris) \ + indice de position : [premier paragraphe, première phrase] => Indice de position déclencheur : [premier paragraphe, seconde phrase] avec des indices complémentaires : chaînage au nom d’auteur Harris par des candidats pronoms + recherche d’indices complémentaires / annonce thématique (Harris) @ Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de l’anglais. @ annonce thématique (Harris) \   => Indice de position déclencheur : [premier paragraphe, troisième phrase ] Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

+ Indice complémentaire : [dernière phrase d’un paragraphe] => Indice de position déclencheur : [premier paragraphe, troisième phrase ] avec des indices complémentaires : chaînage au nom d’auteur Harris par des candidats pronoms. / annonce thématique (Harris) @ Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en 1973-1974, Harris livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est universelle. @ annonce thématique (Harris) \ / annonce thématique (Harris) @ Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur d’une grammaire algébrique @ annonce thématique (Harris) \   / annonce thématique (Harris) @ Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en génral non commutatives, et pas toujours associatives. @ annonce thématique (Harris) \ + Indice complémentaire : [dernière phrase d’un paragraphe] Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

+ Indice complémentaire : [première phrase d’un paragraphe] / annonce thématique (Harris) @ La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très détaillée. @ annonce thématique (Harris) \ + Indice complémentaire : [première phrase d’un paragraphe]   / annonce thématique (Harris) @ L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. @ annonce thématique (Harris) \ / annonce thématique (Harris) @ Les analyses présentées par Harris sont entièrement formalisées, mais in ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer lui-même. @ annonce thématique (Harris) \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

@ annonce thématique \ organisation discursive (Harris) \ / annonce thématique (Harris) @ Harris a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. @ annonce thématique (Harris) \ / annonce thématique / appel au lecteur / Enchaînement discursif : - (Harris) @ D’ailleurs, Harris aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsqu’il est conduit à les préciser. @ annonce thématique \appel au lecteur \ Enchaînement : - (Harris) \ / annonce thématique (Harris) @ Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement linguistiques. @ annonce thématique (Harris) \  / conclusion (Harris) @ On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. @conclusion (Harris) \ / annonce thématique / organisation discursive (Harris) @ Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - @ annonce thématique \ organisation discursive (Harris) \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

/ annonce thématique / conséquences (Harris) / organisation discursive @ Harris utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type suivant : @ conséquences \ annonce thématique \ organisation discursive (Harris) \ / Annonce thématique @ Harris a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment l’expérience. @annonce thématique \ / Annonce thématique @ S’efforçant de construire une théorie minimale du point de vue formel, Harris a constamment cherché à restreindre l’introduction des notions abstraites. @ Annonce thématique \ / Enchaînement / Annonce thématique @ C’est ainsi que, dans son analyse de la phrase, Harris sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. @ Enchaînement \ Annonce thématique \ / Marqueur d’Intégration linéaire / Annonce thématique: - @ D’une part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre d’ailleurs ici. @ Marqueur d’Intégration linéaire : Marqueur d’Intégration linéaire - \ Annonce thématique \   Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Texte obtenu en enlevant les balises Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de l’anglais. Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en 1973-1974, Harris livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est universelle. Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur d’une grammaire algébrique. Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours associatives. La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très détaillée. L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer lui-même. Harris a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. D’ailleurs, Harris aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsqu’il est conduit à les préciser. Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Harris utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type suivant . Harris a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment l’expérience. S’efforçant de construire une théorie minimale du point de vue formel, Harris a constamment cherché à restreindre l’introduction des notions abstraites. C’est ainsi que, dans son analyse de la phrase, Harris sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. D’une part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre d’ailleurs ici.   Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

« Nettoyage final » du texte : Remplacer certaines occurrences de « Harris » par l’anaphore « il » : Règles d’EC : Substituer aux occurrences de « Harris », le terme « il » Règle positive :  (1) SI « Harris » précède un verbe, ALORS lui substituer « il »  Règles négatives : (2) SI Harris suit « N de » ALORS ne pas substituer (3) SI « Harris » suivi par « par », ALORS ne pas substituer. (4) SI « Harris » précède « qui », ALORS ne pas substituer. SI « Harris » a une première occurrence dans la première phrase d’un paragraphe, ALORS ne pas substituer Autre règle de nettoyage Substituer au signe « il » dans le contexte d’un point « . » de fin de phrase qui le précède de façon contiguë, par « Il ». Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de l’anglais. Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en 1973-1974, il livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est universelle. Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur d’une grammaire algébrique. Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours associatives. La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très détaillée. L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer lui-même. Il [->Il] a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. D’ailleurs, il aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsqu’il est conduit à les préciser. Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

il [->Il] utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type suivant . il [->Il] a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment l’expérience. S’efforçant de construire une théorie minimale du point de vue formel, il a constamment cherché à restreindre l’introduction des notions abstraites. C’est ainsi que, dans son analyse de la phrase, il sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. D’une part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre d’ailleurs ici.   Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Réduction supplémentaire : Suppression : - des phrases avec MIL par introducteurs - enchaînements discursifs Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de l’anglais. Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en 1973-1974, il livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est universelle. [[Par contre, Harris, après quelques tentatives anciennes dans la même direction, a abandonné cette hypothèse en faveur d’une grammaire algébrique. Les grammaires de Harris sont des algèbres complexes, en fait des compositions de morphismes entre divers ensembles dotés de structures en général non commutatives, et pas toujours associatives. ]] La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très détaillée. L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer lui-même. Il [->Il] a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. [[ [[ D’ailleurs, Il aide beaucoup le lecteur en opérant des retours aux définitions initiales lorsqu’il est conduit à les préciser. ]] Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. [[ Quant aux transformations qui sont utilisées pour appliquer les structures de base sur les séquences de mots constituant les discours, Harris les a considérablement simplifiées en ne retenant que quatre types : - - ]] Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

il [->Il] utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type suivant . il [->Il] a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment l’expérience. S’efforçant de construire une théorie minimale du point de vue formel, il a constamment cherché à restreindre l’introduction des notions abstraites. [[ C’est ainsi que, dans son analyse de la phrase, il sépare nettement la phrase sans temps (dont le verbe est un opérateur), du temps grammatical opérateur constituant lui-même une autre phrase simple. ]] [[D’une part, la nominalisation suffixale peut entraîner un changement de sens (souvent aspectuel) par rapport à sa phrase source, Harris le montre d’ailleurs ici. ]]   Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Mis en œuvre par effacement Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Résumé obtenu par extraction, après nettoyage Z.S. Harris donne ici pour la première fois de façon détaillée une image globale de sa conception de la syntaxe transformationnelle. Jusqu’aujourd’hui, il n’avait présenté ses théories que sous des éclairages particuliers, par exemple en en dégageant les seuls aspects susceptibles d’être mathématisés, ou bien encor en donnant des analyses de phénomènes particuliers de l’anglais. Dans les présentes notes du cours qu’il a professé à l’université de Paris-Vincennes en 1973-1974, il livre sa description complète d’une grammaire, celle de l’anglais, mais il est clair que son point de vue est qu’une telle forme de grammaire possède une grande généralité, voire qu’elle est universelle. La grammaire de Harris est donc particulièrement abstraite dans son formalisme, mais il est important de garder à l’esprit que cette conception a été empiriquement motivée d’une façon méthodique et très détaillée. L’exposé de Harris ne reflète pas la chronologie de ses recherches, la présentation de son système est en effet entièrement axiomatique au départ. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Réduction : 25 lignes / 255 lignes = 10 /100 Les analyses présentées par Harris sont entièrement formalisées, mais il ne fournit pas toujours les argumentations linguistiques détaillées qui motiveraient l’adoption des solutions qu’il a choisies par rapport à d’autres que le lecteur a rencontrées ailleurs ou qu’il pourrait aisément imaginer lui-même. Il [->Il] a réservé cette discussion pour un autre ouvrage, une grammaire raisonnée des phénomènes de détail qui est en cours de rédaction. Le système de Harris n’est pas seulement abstrait de point de vue formel, il l’est également par la nature des analyses proprement linguistiques. On voit donc que la grammaire de Harris, bien que présentée comme induite à partir de l’anglais, possède des caractéristiques universelles qui, de toute façon, seraient imposées par le description de langues « exotiques » pour lesquelles les parties du discours de la grammaire traditionnelle sont inadéquates. Il utilise largement les conséquences logiques de cette observation, ce qui l’amène à procéder à des analyses du type suivant . Il a élaboré graduellement sa théorie et, plus que tout autre, il l’a confrontée à constamment l’expérience. S’efforçant de construire une théorie minimale du point de vue formel, il a constamment cherché à restreindre l’introduction des notions abstraites.. Réduction : 25 lignes / 255 lignes = 10 /100 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Signature de l’auteur Appel au lecteur Exemples Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

/ Signature de l’auteur (Harris) @ Nous ne nous sommes pas contenté de traduire les notes que Harris a lui-même rédigées, mais nous nous sommes efforcé d’adapter la majorité de ses analyses au français. @ Signature de l’auteur (Harris) @ \ / Signature de l’auteur (Harris) @ Nous remercions Z.S. Harris qui nous a guidé à travers cette adaptation, ainsi que Mlle Yannick Gheerbrandt et M. Amr Helmy Ibrahim qui, par leur présentation dans un séminaire consacré à ce cours, ont contribué à éclaircir certains passages. @ Signature de l’auteur (Harris) \   / Signature de l’auteur @ Pour pouvoir rester le plus près possible de la présentation de Harris, nous avons donc dû transposer certains de ses exemples en les déformant.@ Signature de l’auteur \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

/ Signature de l’auteur @ Dans toute la mesure du possible, nous avons vérifié que ces modifications n’introduisaient pas d’incohérence dans l’analyse des phrases françaises présentées , et nous espérons qu’ainsi l’esprit des solutions de Harris aura été respecté. @ Signature de l’auteur \   / Signature de l’auteur / Appel au lecteur @ Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de l’essentiel des phénomènes syntaxiques. @ Signature de l’auteur / Appel au lecteur \  + Position : [dernier paragraphe, dernière phrase] ; problème du temps grammatical : passé composé. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Appel au lecteur / Appel au lecteur (Harris) @ Le lecteur, peut-être plus familier avec les présentations de la grammaire générative, ne retrouvera pas immédiatement l’outillage de formalisation développé par Chomsky à la suite des premiers travaux de Harris. @ Appel au lecteur (Harris) \ / Appel au lecteur @ Harris accepte ainsi comme grammaticales des phrases qu’un lecteur soucieux de pureté stylistique rejettera comme totalement inacceptables.@ Appel au lecteur \    / Signature de l’auteur / Appel au lecteur @ Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de l’essentiel des phénomènes syntaxiques. @ Signature de l’auteur / Appel au lecteur \  + Position : [dernier paragraphe, dernière phrase] ; problème du temps grammatical : passé composé. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Appel au lecteur / appel au lecteur (Harris) @ Le lecteur, peut-être plus familier avec les présentations de la grammaire générative, ne retrouvera pas immédiatement l’outillage de formalisation développé par Chomsky à la suite des premiers travaux de Harris. @ appel au lecteur (Harris) \ / Signature de l’auteur / Appel au lecteur @ Le principal avantage que nous avons vu dans cette présentation est que le lecteur pourra juger immédiatement des compatibilités et incompatibilités sémantiques que Harris place à la source de l’essentiel des phénomènes syntaxiques. @ Signature de l’auteur / Appel au lecteur \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Exemples / Exemple illustratif @ Il est un autre exemple qui illustre bien le caractère abstrait des représentations de base de Harris, et qui peut-être apparaît mieux en français qu’en anglais. @ Exemple illustratif \   / Exemple @ Cet exemple nous a d’ailleurs posé un problème d’adaptation des analyses de Harris au français. @ Exemple \ Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

7. Comment construire les règles ? Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Comment construire des ressources linguistiques Comment construire des ressources linguistiques ? Une méthodologie nouvelle ? Comment trouver les indices (déclencheurs et complémentaires) ? Comment trouver les règles ? Comment les écrire ? Comment les présenter ? Comment les valider ? Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Premier cas : lever l’indétermination d’une forme identifiée => valeurs sémantiques connues Forme grammaticale = Indice déclencheur 1. Chercher un indice complémentaire pour déterminer une des valeurs sémantiques possibles d’une occurrence ; 2. Une valeur étant déterminée, chercher d’autres indices complémentaires pour confirmer ou infirmer la décision ; 3. Constituer une classe d’équivalence d’indices complémentaires pour une même valeur ; 4. Interpréter sémantiquement la classe. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Indice déclencheur => valeurs Valeur V1 IC IC IC => Indice déclencheur Valeur V2 IC => Valeur V3 IC IC IC => Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Une valeur => indices associées KIC1 Forme Grammaticale = Indicateur avec valeur déterminée IC IC KIC2 IC KIC3 IC IC IC KIC4 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Base de données : Indices - Valeurs Classe KIC1d’indices complémentaires Indicateur1 Valeur i Classe KIC2 d’indices complémentaires Valeur i Classe KIC3d’indices complémentaires Valeurj Classe KIC4 d’indices complémentaires Valeur j Classe KIC5 d’indices complémentaires Valeur j Classe KIC1d’indices complémentaires indicateur 2 Valeur k Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Règle pour lever l’indétermination d’une forme grammaticale Indice complémentaire appartenant à une classe K i Forme analysée = indice déclencheur sont des indices en faveur de la Valeur sémantique V j + Indentification d’une occurrence d’une forme comme Indice Déclencheur SI on a une occurrence d’un indice complémentaire d’une classe K i ALORS ce sont des indices en faveur de la valeur sémantique V j Action : assigner la valeur V j au segment linguistique contenant la forme Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Second cas : résoudre une tâche à partir de notions discursives Tâche (exemples : résumer, filtrer des informations saillantes, construire des fiches catégorisées, commenter un diagramme, …) Résoudre la tâche, c’est identifier des notions discursives et annoter les textes selon des points de vue correspondant à la tâche à effectuer. Exemple : pour résumer, il faut trouver : les annonces thématiques ; les hypothèses de travail ; les conclusions ; les méthodes ; les résultats Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Notion => expressions linguistiques Notion discursive (exemples « citation », « définition », « annonce thématique ») 1. identifier les expressions discursives qui sont les marqueurs (indicateurs principaux) de cette notion ; 2. trouver dans le contexte de ces marqueurs des indices complémentaires qui renforcent les indices déclencheurs ; 3. pour chaque indice déclencheur, classer les indices complémentaires dans des classes d’équivalence et écrire des règles d’exploration contextuelle ; 4. donner une interprétation sémantique aux classes d’équivalence; 5. donner une spécification sémantique aux indices déclencheurs. 6. Dresser la « carte sémantique » de la notion. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Notion -Indices IC IC ID IC Notion IC ID IC IC ID IC IC Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Notion : regroupement en classes Indices complémentaires Indicateur 1 KIC 1 Notion Indices complémentaires KIC 2 Indicateur 2 Indices complémentaires KIC 3 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Base de données : Indices - Notions Classe KIC1d’indices complémentaires Indicateur 1 Notion i Classe KIC2 d’indices complémentaires Notion i Classe KIC1d’indices complémentaires Indicateur 2 Notion i Classe KIC2 d’indices complémentaires Notion i Classe KIC3 d’indices complémentaires Notion i Classe KIC1d’indices complémentaires Indicateur 3 Notion j

Règle pour déterminer une notion Indice complémentaire associé à une notion N j Indice Déclencheur appartenant à une classe K i sont des indices en faveur de la Notion j + Identification d’une occurrence d’une forme comme Indice Déclencheur d’une notion Nj SI on a une occurrence d’indices complémentaires d’une classe K i ALORS ce sont des indices en faveur de la notion sémantique N j Action : assigner au segment linguistique l’annotation N j Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Quelques références bibliographiques Desclés Jean-Pierre, Langages applicatifs, langues naturelles et cognition, Hermès, Paris, 1990. Desclés Jean-Pierre, “Systèmes d’exploration contextuelle”, Co-texte et calcul du sens, (Claude Guimier), Presses de l’universitaires de Caen, 1997 pp. 215-232. Descles J.-P., Soh (Éditeurs) Langage, cognition et textes, tome 1, tome 2, Université de Hankuk et Université de Paris-Sorbonne, Paris, Séoul, avril 1997, 1998. Desclés Jean-Pierre, « Polysémie verbale, un exemple : le verbe avancer », Colloque international « Polysémie », Université de Paris-Sorbonne, Paris, décembre 2001. Desclés Jean-Pierre, Jean-Luc Minel, « Résumé automatique et filtrage sémantique des textes », Ingénierie des langues, sous la direction de Jean-Marie Pierrel, Paris : Hermès, 2000, pp. 232-253. Desclés Jean-Pierre, Jean-Luc Minel, « Interpréter par exploration contextuelle », sous la direction de Francis Corblin, Claire Gardent, Interpréter en contexte, Hermès, Paris, pp. 306-328 Desclés Jean-Pierre, Flageul Valérie, Kerenbosh Chritiane, Meunier Jean-Marc, Richard Jean-François, “Sémantique cognitive de l’action , I. Contexte théorique”, Langages, n° 132 décembre 1998 pp 28-47. Minel, Jean-Luc, Desclés, Jean-Pierre, Fouille sémantique des textes, TSI, 2002 Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Thèses Thèses soutenues : Thèses en cours : Antoine Blais C. Jouis, J. Berri, D. Reppert, Y. Oh, A. Jackiewicz, D. Garcia, G. Mourad, J.L. Minel, S. Ben Hazes, S., Benthami, G. Crispino, D. Wonsever … Thèses en cours : Antoine Blais Montacem Alrahabi Marc Bertin Iana Atanassova …. Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008

Merci pour votre attention ! Jean-Pierre Desclés, Catégories discursives, ENS, Lyon, 4 avril 2008