Données massives, nouvelles méthodes pour l'historien.ne? Frédéric Clavert
Vivre dans un monde de données: une minute sur les réseaux sociaux numériques en août 2015 …manquent les données engendrées par l’Internet of Things (les objets connectés), par les moteurs de recherche, dont Google et ses diverses applications, par les téléphones portables (dont les traces GPS), par de très nombreux services et entreprises moins connues. Source: « Infographie : une minute sur Internet et les réseaux sociaux en août 2015 », Le blog du modérateur, 17 août 2015.
Quelle Histoire à (de) l’ère numérique? Sources massives (big data) seront (sont déjà) des sources pour l’historien⋅ne Que peut faire l’historien⋅ne quand il⋅elle est confrontée à une mer de données? Historien contemplant une mer de données Caspar David Friedrich, Der Wanderer über dem Nebelmeer
Collecte de tweets sur la Grande Guerre et son Centenaire Un exemple: #ww1 – traces du Centenaire de la Grande Guerre sur Twitter Collecte de tweets sur la Grande Guerre et son Centenaire Depuis le 1er avril 2014 Collecte toujours en cours (jusqu’au Centenaire du Traité de Versailles) Trois langues: anglais, français, allemand Dispositif technique: API streaming de Twitter Fin novembre 2016 3,5 millions de tweets Dont 2,4 millions de retweets Plus de 840 000 utilisateurs Qui ont utilisé 140 000 hashtags
Lecture distante […] what we really need is a little pact with the devil: we know how to read texts, now let’s learn how not to read them. Moretti, “Conjectures on World Literature,” New Left Review 1 (Jan-Feb 2000): 57.
Nombre de tweets par jour
Répartition linguistique
Grandes thématiques discutées (corpus francophone)
Evolution des grandes thématiques évoquées sur Twitter (corpus francophone)
Risques et limites méthodologiques We define Big Data as a cultural, technological, and scholarly phenomenon that rests on the interplay of: (1) Technology: maximizing computation power and algorithmic accuracy to gather, analyze, link, and compare large data sets. (2) Analysis: drawing on large data sets to identify patterns in order to make economic, social, technical, and legal claims. (3) Mythology: the widespread belief that large data sets offer a higher form of intelligence and knowledge that can generate insights that were previously impossible, with the aura of truth, objectivity, and accuracy. (3) Mythology: the widespread belief that large data sets offer a higher form of intelligence and knowledge that can generate insights that were previously impossible, with the aura of truth, objectivity, and accuracy. Boyd Danah et Crawford Kate, « CRITICAL QUESTIONS FOR BIG DATA: Provocations for a cultural, technological, and scholarly phenomenon », Information, Communication & Society 15 (5), 06.2012, pp. 662‑679.
www.c2dh.uni.lu Stay connected with us! @C2DH_LU https://www.facebook.com/c2dh.lu/ www.c2dh.uni.lu