La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

corpus spéciale et spécialisée

Présentations similaires


Présentation au sujet: "corpus spéciale et spécialisée"— Transcription de la présentation:

1 corpus spéciale et spécialisée
Corpus spécialisés se caractérise par être homogène plus petits et sont faits avec un but précis. Meyer et Mackintosh Browker (1996) et Pearson (1998); les caractéristiques que nous devons prendre en considération pour développer un corpus d'espécialisée sont:

2 Corpus d'espécialisée 1. Taille du corpus 3. chronologie des textes
2. domaine de spécialisation 1. Taille du corpus 3. chronologie des textes 10. type de texte et récepteurs Corpus d'espécialisée 4. Mode de production 9. degré de technicité 5. factualité 8. les éléments relatifs à la publication 7. auteur et caractéristiques 6. qualité des textes

3 Pearson établit une classification des situations de communication divers textes nature
Entre experts entre les experts et les initiés entre les demi experts et non-initiés entre l'enseignant et l'élève

4 corpus de textes en différentes langues corpus bilingue ou multilingue
Les textes sont sélectionné selon critères de natures différentes Disponibilité des textes, genre et temps corpus bilingue ou multilingue corpus qui rassemble des textes originaux et des traductions originaux dans une langue d'autres textes similaires corpus comparable corpus parallèle textes dans une langue et traduit en une ou plusieurs langues.

5 Traitements corpus: texte d'annotation et outils d'analyse
sont des groupements textuelles qui peuvent être: Nus (collections textuelles en format électronique) Enregistré (sont collections textuelles dans laquelle ajoutent une série de notes de diverse nature)

6 Leech (1993) les caractéristiques général de las annotations du corpus peuvent être résumé en sept points: 1. élimination facile d'étiquettes pour obtenir la version originale du texte 4. Indication du système d'entrée de las annotations et les auteurs 2. extraction des annotations pour établir un base de données indépendante du texte 5. Indication de la possible existence d'erreurs dans l'annotation. 6. Utilisation des systèmes d'annotation neutre et largement acceptée 3. utilisation des normes utilisées pour les annotations afin qu'elles peuvent être connus par l'utilisateur et interpréter sans problème 7. accepter l'existence d'autres normes et systèmes annotation

7 Type d’ annotations possible différencier en deux groupes principaux:
avec information extralinguistique linguistique l'information dans l'en-tête du corpus intra-textuelle et peut être de diffèrent type Origène du texte (langue, date, auteur, domaine à laquelle il appartient morphologique Syntactique Structurel Lemmatisation Aliénation données que permet classer le texte (genre fonction, etc)


Télécharger ppt "corpus spéciale et spécialisée"

Présentations similaires


Annonces Google