Analyse lexicométrique de l’autodéfinition du rap - Corentin Roquebert « Faire du rap de » Analyse lexicométrique de l’autodéfinition du rap - Corentin Roquebert
Peut-on cartographier, par des techniques d’analyse des données, un espace discursif du rap via l’usage par les rappeurs de catégories réflexives ?
I/ Constitution du corpus (logiciel R) Connexion à l’API Genius Requêtes à partir de mots-clés Vérification qu’il s’agit de rap francophone Extraction de l’artiste, du titre et du texte Vérification que le texte contient bien la requête Elimination des doublons Nettoyage des textes
Les requêtes 1. Des expressions : « Rap conscient », « rap hardcore », « rap indépendant », « rap alternatif », « rap gangsta », « rap game », « rap authentique », « rap engagé », « rap commercial » 2. Des structures : « rap de », « rap du », « rap pour », « fais du rap », « fais pas du rap » 1564 textes
II/ Approche descriptive du corpus Que dit-on autour de « rap » ?
III/ Explorer les mots du rap
Préparation du corpus (dernière étape) Création de deux corpus : Un corpus avec les textes entiers : 1 200 000 mots (sur 1564 textes) Un corpus centré sur les occurrences du terme rap : 37 000 mots (sur 4 000 occurrences) Lemmatisation Séparation entre les mots pleins et les mots outils
Nuage de mots Corpus global Autour de rap (cinq mots)
Nombre de mots autour de rap / nombre de mots dans le corpus Si indépendance Nombre d’occurrences autour de rap / nombre d’occurrences dans le corpus = Nombre de mots autour de rap / nombre de mots dans le corpus C’est-à-dire 3% (37 000 / 1 200 000)
Les mots surreprésentés autour de rap (5 mots avant et après) Les requêtes : conscient (53% des occurrences dans le corpus sont situées autour de « rap »), français (48%), game (47%), hardcore (35%) et gangsta (34%) Les mots pleins : fuck (10%), arrêter (8%), jeu, battre (7%), écouter, niquer, rue (6%), faire, mort, vrai, sale, baiser (5%). Les mots outils : « du » (16%), « le » (8%), « mon » (6%) et « pour » (6%). Les mots sous-représentés (moins de 2% des occurrences) : voir, pouvoir, savoir, passer, rester, la, les.
IV/ L’analyse de données : trouver les thèmes, comparer les mots
L’analyse de données textuelles Est-ce que, quand les rappeurs utilisent le terme rap, ils développent des thématiques particulières ? Est-ce que, quand les rappeurs parlent de tel type de rap plutôt que de tel autre, ils en parlent d’une manière spécifique ? Logiciel Iramuteq Méthodes : Classification de Reinert (classification descendante hiérarchique) Analyse de spécificité
Classification hiérarchique descendante – Corpus entier
AFC sur les classes – Corpus entier
Classification hiérarchique descendante – Autour de « rap »
AFC sur les classes – Corpus entier
Les termes les plus spécifiques des sous-corpus Sous corpus Conscient Egotrip Hardcore Gangsta Authentique Game Formes banales (exemples) Lien positif raison accuser tort morceau 16 freestyle camp mic écrire j style kicker rime kery rohff 9 génération mafia james banlieue 93 lyrics disque attaque violent rue représenter balancer bonhomme guerre hood thug and gang gangster taire vrai côté revendiquer kick fois service blues fuck boss bitch pis tuer negro/nigga life je vous punchline boule braquer trou flic crever vice art rage bâtard keuf prod salope dalle daron pays star cité crise Lien négatif authentique équipe comme monnaie mère nique nous game ces bête mes peur sur gangsta conscient (hardcore) que miens pourquoi parce que
Merci de votre écoute !