TRAITEMENT INSTRUMENTÉ DE CORPUS

Slides:



Advertisements
Présentations similaires
Qu’est-ce qu’une problématique ? (1)
Advertisements

Les principes généraux Les objectifs du dispositif Le b2i et les défis sur Internet Une visite concrète.
La préparation à linsertion professionnelle dans les universités Rhône-Alpes : des actions, un bilan Observatoire Universitaire Régional de l Insertion.
introduction à la sociologie générale, cours 3
Plan la séance 4 La problématique d’une recherche
Développer et évaluer l’oral en classe
LE DISCOURS PHILOSOPHIQUE
ÉPREUVE - ÉCONOMIE DROIT
Préparer son orientation – Niveau 5e
MISSIONS VIRTUELLES Par Marie-France Laberge C.S. Marie-Victorin Adapté du document de Ron Mastine C.S. Des Sommets.
Comment mettre en place un défi? La démarche expérimentale
Passage à l’écrit en sciences
1. Représentation des informations
printemps des sciences
L’apprentissage situé : approche épistémologique
« On apprend bien que ce qui répond aux questions que l’on se pose »
Sociologie : Les méthodes
Présentation de l’étude
2.1 Le sujet et la question de recherche
LE DISCOURS SCIENTIFIQUE
FORMATION DES FORMATEURS UNIVERSITE DE TEHERAN
Séance: Introduction et processus global d’une évaluation
Les activités de langue .
ANALYSE METHODE & OUTILS
L’ÉPREUVE COMPOSÉE.
Résoudre une situation-problème : composantes Résoudre une situation- problème Décoder les éléments qui se prêtent à un traitement mathématique Représenter.
enseignement des sciences
L’eau sur Terre, une source d’inégalités.
Paradigmes des Langages de Programmation
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
LE POUVOIR. Le pouvoir est la capacité d’influencer avec efficacité le comportement d’autrui.
De la scientificité des théories à la scientificité de la didactique
Atelier de formation Animation: CEMIS Québec - Chaudière-Appalaches Avril - Mai 2000 Les TIC dans la réforme: qu'en est-il vraiment?
Carte des compétences Présentation d’une cartographie des compétences Jean-Marc REYDET SNDEC Marie-Claire CLERC CTDEC La démarche de cartographie des.
RESEAU.
A propos des unités de la langue et du concept de l’arbitraire Estanislao Sofía – Université de Paris X – Nanterre.
Le programme du cycle d’orientation
Méthodologie de recherche
Epreuve anticipée d’étude de gestion en première STMG
Les principes de la modélisation de systèmes
Contenus riches et logique d'industrialisation Contenus riches et logique d'industrialisation Modélisation, production, génération, gestion Stéphane Crozat.
 Ne pas se limiter à proposer un seul type de situation, mais varier les situations problèmes  Limiter l’utilisation de fiches pour apprendre.
Master 1 – Sciences du Langage –
Rencontre des écoles ciblées du secondaire 22 mars 2004
Méthodologie du Mémoire
Une pédagogie de l’activité pour développer des compétences transversales Claire Herviou Alain Taurisson Juin 2003.
Notions fondamentales en linguistique
Vocabulaire La polysémie
La TECHNOLOGIE en 3 ème.
Etude de cas, une recherche participative au pays des écovillages Quand l’anthropologie s’invite à l’ENITA, ouverture vers l’interdisciplinarité.
Animation pédagogique de circonscription – Aulnay 2 – 10 décembre Dominique PLANKEELE Enseignante en cycle 3 à l’école ORMETEAU Maître-formateur.
Algorithmes et Programmation
Animation Pédagogique FRANCHEVILLE – LYON – S te -FOY 10 Janvier 2007.
Mise en forme efficace d’un document Logiciel Microsoft Word
LA DEMARCHE DE RECHERCHE
ÉPREUVES ÉCRITES D'ADMISSIBILITÉ bonne maîtrise des savoirs scientifiques, du programme du concours compréhension synthétique et cohérente des concepts.
BACCALAUREAT PROFESSIONNEL
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Correspondance - Équivalence
ETAPE III : LA PROBLEMATIQUE
EC 251 : Initiation a la recherche dans l’enseignement
Initiation à des recherches dans le domaine de l’enseignement
UE 5 EC 1 INITIATION A LA RECHERCHE DANS LE DOMAINE DE L’ENSEIGNEMENT
But : avoir un regard réflexif sur le métier d’enseignant
Initiation a des recherches dans domaine de l’enseignement
INITIATION DES RECHERCHES DANS LE DOMAINE DES ENSEIGNEMENTS
Présentation du système
D’après le travail de Cyril Naudin (Royan) Circonscription de Jonzac - Décembre 2015 Construire le nombre du C1 au C3.
Comment faire un résumé d’article ?
CONSEILS POUR LA REDACTION NA 2012/ Le mémoire de M2 n’est pas un rapport de stage: il doit développer une problématique en liaison avec vos missions.
Transcription de la présentation:

TRAITEMENT INSTRUMENTÉ DE CORPUS Hakim HESSAS TRAITEMENT INSTRUMENTÉ DE CORPUS

LE TRAITEMENT INSTRUMENTÉ DE CORPUS…

LE TRAITEMENT INSTRUMENTÉ DE CORPUS… Un traitement de corpus de textes par des logiciels qui a révolutionné de fond en comble la linguistique et les disciplines des sciences humaines, depuis l’accès numérique à l’écrit.

Le renouvellement tient principalement en deux points :

Le renouvellement tient principalement en deux points : Le fait de travailler sur des corpus de textes numériques ;

Le renouvellement tient principalement en deux points : Le fait de travailler sur des corpus de textes numériques ; L’assistance qu’apportent les logiciels.

Le traitement instrumenté de corpus n’est pas le traitement de corpus.

Le traitement instrumenté de corpus n’est pas le traitement de corpus. Il en constitue une partie nécessaire mais non suffisante.

Le traitement instrumenté de corpus n’est pas le traitement de corpus. Il en constitue une partie nécessaire mais non suffisante. Celle-ci doit se compléter, à chaque fois, par une autre aussi importante, à savoir l’interprétation des DONNÉES –

Le traitement instrumenté de corpus n’est pas le traitement de corpus. Il en constitue une partie nécessaire mais non suffisante. Celle-ci doit se compléter, à chaque fois, par une autre aussi importante, à savoir l’interprétation des DONNÉES – passer des chaînes de caractères à des formes sémantiques.

Les données sont celles que l’on se donne pour construire des parcours thématiques précis, à partir d’hypothèses…

Les données sont celles que l’on se donne pour construire des parcours thématiques précis, à partir d’hypothèses… Ces hypothèses peuvent être posées lors de la conception de corpus ou lors de la détermination des tâches.

Les données sont celles que l’on se donne pour construire des parcours thématiques précis, à partir d’hypothèses… Ces hypothèses peuvent être posées lors de la conception de corpus ou lors de la détermination des tâches. Elles déterminent le choix des textes qui entrent dans la composition du corpus.

Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre :

Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre : L’importance du corpus

Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre : L’importance du corpus La constitution du corpus

Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre : L’importance du corpus La constitution du corpus Connaissance des instruments de connaissance

L’IMPORTANCE DU CORPUS DE TEXTES

L’IMPORTANCE DU CORPUS DE TEXTES L’objet d’étude de la linguistique ce sont les textes que l’on peut organiser en CORPUS – non les mots ou les phrases isolés.

L’IMPORTANCE DU CORPUS DE TEXTES L’objet d’étude de la linguistique ce sont les textes que l’on peut organiser en CORPUS – non les mots ou les phrases isolés. Un mot ne se laisse comprendre que par ses multiples emplois et ses rapports divers à d’autres mots (contexte et récurrence).

2. LA CONSTITUTION DE CORPUS

2. LA CONSTITUTION DE CORPUS Toute compilation de textes ne peut constituer un corpus.

2. LA CONSTITUTION DE CORPUS Toute compilation de textes ne peut constituer un corpus. Un corpus doit être construit à partir d’un point de vue bien clair.

2. LA CONSTITUTION DE CORPUS Toute compilation de textes ne peut constituer un corpus. Un corpus doit être construit à partir d’un point de vue bien clair. Ce point de vue correspond à un choix théorique et méthodologique.

… LE CONCEPT DE CORPUS

… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel

… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte

… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits sémantiques

… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits sémantiques Le sens est également fait de différences

… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits sémantiques Le sens est également fait de différences Il est nécessaire d’avoir un contexte plus large

… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits sémantiques Le sens est également fait de différences Il est nécessaire d’avoir un contexte plus large Le contexte c’est tous les textes

… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits sémantiques Le sens est également fait de différences Il est nécessaire d’avoir un contexte plus large Le contexte c’est tous les textes L’objectif n’est pas d’avoir une grande masse de textes (du texte) mais (des textes)

L’IMPORTANCE DU POINT DE VUE

L’IMPORTANCE DU POINT DE VUE Un point de vue n’est pas un point d’observation.

L’IMPORTANCE DU POINT DE VUE Un point de vue n’est pas un point d’observation. Mais un point à partir duquel on construit un corpus comme objet scientifique exploitable.

B. SPÉCIFICATION DES GENRES

B. SPÉCIFICATION DES GENRES Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus.

B. SPÉCIFICATION DES GENRES Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus. La meilleure interprétation se fait au sein d’un corpus de textes qui partagent le même genre.

B. SPÉCIFICATION DES GENRES Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus. La meilleure interprétation se fait au sein d’un corpus de textes qui partagent le même genre. Principe :

B. SPÉCIFICATION DES GENRES Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus. La meilleure interprétation se fait au sein d’un corpus de textes qui partagent le même genre. Principe : si le sens est fait de différence ce n’est pas pour comparer l’incomparable (les montagnes et les petits pois).

3. LES LOGICIELS: INSTRUMENTS DE CONNAISSANCE DU CORPUS Les logiciels permettent de traiter le lexique comme des choses (Durkheim) ; Ce sont des instruments transcendant qui permettent une totalisation (P. Bourdieu, 2012 : 338) ; Accéder immédiatement dans le corpus ; Choisir des points d’entrée intéressants dans le corpus ; Trouver autre chose que ce l’on cherche.

CONCLUSION

CONCLUSION Les statistiques que permettent les logiciels n'ont pas de sens et de portée en elles-mêmes; elles doivent être exploitées et surtout interprétées ;

CONCLUSION Les statistiques que permettent les logiciels n'ont pas de sens et de portée en elles-mêmes; elles doivent être exploitées et surtout interprétées ; L'existence de lexèmes n'est guère une garantie sur l'existence d'un thème ;

CONCLUSION Les statistiques que permettent les logiciels n'ont pas de sens et de portée en elles-mêmes; elles doivent être exploitées et surtout interprétées ; L'existence de lexèmes n'est guère une garantie sur l'existence d'un thème ; des mots absents peuvent tout autant signifier que les mots présents ;

La force théorique de la linguistique de corpus ne consiste pas à offrir des instruments qui permettent de résoudre toutes les énigmes textuelles, mais de pouvoir donner à des hypothèses pertinemment posées des possibilités de confirmation ou d'infirmation ;

La force théorique de la linguistique de corpus ne consiste pas à offrir des instruments qui permettent de résoudre toutes les énigmes textuelles, mais de pouvoir donner à des hypothèses pertinemment posées des possibilités de confirmation ou d'infirmation ; Si la mesure ne se suffit pas a elle-même, l'interprétation des données ne peut se faire que si l'on prend connaissance du discours, du genre du texte en question. La grammaticalité d'une phrase suit les mêmes critères ;

La force théorique de la linguistique de corpus ne consiste pas à offrir des instruments qui permettent de résoudre toutes les énigmes textuelles, mais de pouvoir donner à des hypothèses pertinemment posées des possibilités de confirmation ou d'infirmation ; Si la mesure ne se suffit pas a elle-même, l'interprétation des données ne peut se faire que si l'on prend connaissance du discours, du genre du texte en question. La grammaticalité d'une phrase suit les mêmes critères ; Le sens d'un mot - ou d'un texte - dépend donc des parcours interprétatifs construits à chaque fois, que les logiciels ne font que suggérer.

Qui a vu un monument n'en a vu aucun ; qui en a vu mille en a vu un. Édouard Gérard