Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
TRAITEMENT INSTRUMENTÉ DE CORPUS
Hakim HESSAS TRAITEMENT INSTRUMENTÉ DE CORPUS
2
LE TRAITEMENT INSTRUMENTÉ DE CORPUS…
3
LE TRAITEMENT INSTRUMENTÉ DE CORPUS…
Un traitement de corpus de textes par des logiciels qui a révolutionné de fond en comble la linguistique et les disciplines des sciences humaines, depuis l’accès numérique à l’écrit.
4
Le renouvellement tient principalement en deux points :
5
Le renouvellement tient principalement en deux points :
Le fait de travailler sur des corpus de textes numériques ;
6
Le renouvellement tient principalement en deux points :
Le fait de travailler sur des corpus de textes numériques ; L’assistance qu’apportent les logiciels.
7
Le traitement instrumenté de corpus n’est pas le traitement de corpus.
8
Le traitement instrumenté de corpus n’est pas le traitement de corpus.
Il en constitue une partie nécessaire mais non suffisante.
9
Le traitement instrumenté de corpus n’est pas le traitement de corpus.
Il en constitue une partie nécessaire mais non suffisante. Celle-ci doit se compléter, à chaque fois, par une autre aussi importante, à savoir l’interprétation des DONNÉES –
10
Le traitement instrumenté de corpus n’est pas le traitement de corpus.
Il en constitue une partie nécessaire mais non suffisante. Celle-ci doit se compléter, à chaque fois, par une autre aussi importante, à savoir l’interprétation des DONNÉES – passer des chaînes de caractères à des formes sémantiques.
11
Les données sont celles que l’on se donne pour construire des parcours thématiques précis, à partir d’hypothèses…
12
Les données sont celles que l’on se donne pour construire des parcours thématiques précis, à partir d’hypothèses… Ces hypothèses peuvent être posées lors de la conception de corpus ou lors de la détermination des tâches.
13
Les données sont celles que l’on se donne pour construire des parcours thématiques précis, à partir d’hypothèses… Ces hypothèses peuvent être posées lors de la conception de corpus ou lors de la détermination des tâches. Elles déterminent le choix des textes qui entrent dans la composition du corpus.
14
Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre :
15
Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre : L’importance du corpus
16
Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre : L’importance du corpus La constitution du corpus
17
Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre : L’importance du corpus La constitution du corpus Connaissance des instruments de connaissance
18
L’IMPORTANCE DU CORPUS DE TEXTES
19
L’IMPORTANCE DU CORPUS DE TEXTES
L’objet d’étude de la linguistique ce sont les textes que l’on peut organiser en CORPUS – non les mots ou les phrases isolés.
20
L’IMPORTANCE DU CORPUS DE TEXTES
L’objet d’étude de la linguistique ce sont les textes que l’on peut organiser en CORPUS – non les mots ou les phrases isolés. Un mot ne se laisse comprendre que par ses multiples emplois et ses rapports divers à d’autres mots (contexte et récurrence).
21
2. LA CONSTITUTION DE CORPUS
22
2. LA CONSTITUTION DE CORPUS
Toute compilation de textes ne peut constituer un corpus.
23
2. LA CONSTITUTION DE CORPUS
Toute compilation de textes ne peut constituer un corpus. Un corpus doit être construit à partir d’un point de vue bien clair.
24
2. LA CONSTITUTION DE CORPUS
Toute compilation de textes ne peut constituer un corpus. Un corpus doit être construit à partir d’un point de vue bien clair. Ce point de vue correspond à un choix théorique et méthodologique.
25
… LE CONCEPT DE CORPUS
26
… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel
27
… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel
Un mot n’a de sens que dans un contexte
28
… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel
Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits sémantiques
29
… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel
Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits sémantiques Le sens est également fait de différences
30
… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel
Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits sémantiques Le sens est également fait de différences Il est nécessaire d’avoir un contexte plus large
31
… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel
Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits sémantiques Le sens est également fait de différences Il est nécessaire d’avoir un contexte plus large Le contexte c’est tous les textes
32
… LE CONCEPT DE CORPUS Il n’existe pas de corpus naturel
Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits sémantiques Le sens est également fait de différences Il est nécessaire d’avoir un contexte plus large Le contexte c’est tous les textes L’objectif n’est pas d’avoir une grande masse de textes (du texte) mais (des textes)
33
L’IMPORTANCE DU POINT DE VUE
34
L’IMPORTANCE DU POINT DE VUE
Un point de vue n’est pas un point d’observation.
35
L’IMPORTANCE DU POINT DE VUE
Un point de vue n’est pas un point d’observation. Mais un point à partir duquel on construit un corpus comme objet scientifique exploitable.
36
B. SPÉCIFICATION DES GENRES
37
B. SPÉCIFICATION DES GENRES
Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus.
38
B. SPÉCIFICATION DES GENRES
Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus. La meilleure interprétation se fait au sein d’un corpus de textes qui partagent le même genre.
39
B. SPÉCIFICATION DES GENRES
Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus. La meilleure interprétation se fait au sein d’un corpus de textes qui partagent le même genre. Principe :
40
B. SPÉCIFICATION DES GENRES
Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus. La meilleure interprétation se fait au sein d’un corpus de textes qui partagent le même genre. Principe : si le sens est fait de différence ce n’est pas pour comparer l’incomparable (les montagnes et les petits pois).
41
3. LES LOGICIELS: INSTRUMENTS DE CONNAISSANCE DU CORPUS
Les logiciels permettent de traiter le lexique comme des choses (Durkheim) ; Ce sont des instruments transcendant qui permettent une totalisation (P. Bourdieu, 2012 : 338) ; Accéder immédiatement dans le corpus ; Choisir des points d’entrée intéressants dans le corpus ; Trouver autre chose que ce l’on cherche.
42
CONCLUSION
43
CONCLUSION Les statistiques que permettent les logiciels n'ont pas de sens et de portée en elles-mêmes; elles doivent être exploitées et surtout interprétées ;
44
CONCLUSION Les statistiques que permettent les logiciels n'ont pas de sens et de portée en elles-mêmes; elles doivent être exploitées et surtout interprétées ; L'existence de lexèmes n'est guère une garantie sur l'existence d'un thème ;
45
CONCLUSION Les statistiques que permettent les logiciels n'ont pas de sens et de portée en elles-mêmes; elles doivent être exploitées et surtout interprétées ; L'existence de lexèmes n'est guère une garantie sur l'existence d'un thème ; des mots absents peuvent tout autant signifier que les mots présents ;
46
La force théorique de la linguistique de corpus ne consiste pas à offrir des instruments qui permettent de résoudre toutes les énigmes textuelles, mais de pouvoir donner à des hypothèses pertinemment posées des possibilités de confirmation ou d'infirmation ;
47
La force théorique de la linguistique de corpus ne consiste pas à offrir des instruments qui permettent de résoudre toutes les énigmes textuelles, mais de pouvoir donner à des hypothèses pertinemment posées des possibilités de confirmation ou d'infirmation ; Si la mesure ne se suffit pas a elle-même, l'interprétation des données ne peut se faire que si l'on prend connaissance du discours, du genre du texte en question. La grammaticalité d'une phrase suit les mêmes critères ;
48
La force théorique de la linguistique de corpus ne consiste pas à offrir des instruments qui permettent de résoudre toutes les énigmes textuelles, mais de pouvoir donner à des hypothèses pertinemment posées des possibilités de confirmation ou d'infirmation ; Si la mesure ne se suffit pas a elle-même, l'interprétation des données ne peut se faire que si l'on prend connaissance du discours, du genre du texte en question. La grammaticalité d'une phrase suit les mêmes critères ; Le sens d'un mot - ou d'un texte - dépend donc des parcours interprétatifs construits à chaque fois, que les logiciels ne font que suggérer.
49
Qui a vu un monument n'en a vu aucun ; qui en a vu mille en a vu un.
Édouard Gérard
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.