Données, corpus numérisés et humanités numériques

Les corpus et ressources documentaires numérisés et mis en ligne n’ont jamais été si nombreux et l’accès à l’information n’a jamais été plus facile et plus immédiate qu’aujourd’hui. Cette profusion et cette disponibilité ont-elles des répercussions sur le mouvement des Humanités numériques ? Quels sont les rapports entre les programmes de numérisation menés par les institutions culturelles et patrimoniales − bibliothèques et archives − et les programmes de recherche associant Humanités et informatique ?


Les Humanités numériques (Digital humanities) visent à intégrer la culture et les technologies numériques dans les pratiques de recherche en SHS1. Elles sont nées de la numérisation et de la mise à disposition des ressources. Les problématiques abordées par les grands acteurs de ce mouvement comme le TGE Adonis et Corpus-IR s’apparentent aux préoccupations des grands acteurs de la numérisation en France que sont les archives et les bibliothèques : sélection, numérisation, visualisation, navigation et navigabilité, préservation,  interopérabilité, accessibilité, valorisation… La recherche y ajoute le traitement et la fouille des données. Pourtant au regard des programmes menés, il semblerait que les cultures professionnelles de ces acteurs soient encore éloignées. Le lien entre les données (souvent brutes) et les ressources mises à disposition sur le web et les publications des résultats de la recherche est assez ténu. Certains historiens font même le constat du décalage entre la numérisation de masse ou de niche effectuée par les bibliothèques et les services d’archives et le travail fait dans les laboratoires de recherche dans le cadre des Humanités numériques. Hormis l’impact très fort de l’océrisation sur les travaux de recherche, la mise en ligne du patrimoine archivistique numérisé aurait peu d’influence sur l’évolution de l’historiographie2.

Digital Humanities Wordle par nicomachus (Flickr)
Digital Humanities Wordle par nicomachus (Flickr)

Les technologies numériques permettent de traiter des ensembles de données importants. et de travailler sur des corpus. Sans évoquer en détail le cas du programme de Google en faveur des Humanités numériques3 ni les programmes importants menés à l’étranger, on peut citer quelques projets français menés en collaboration par un ou des centres de recherche et des établissements patrimoniaux et culturels : Telma, centre de ressources numériques porté par l’Ecole des chartes et l’Institut de recherche et d’histoire des textes, Les Bibliothèques virtuelles humanistes (BVH) pilotées par le Centre d’Études Supérieures de la Renaissance (Université François-Rabelais, Tours – UMR 7323 du CNRS) en partenariat avec la section Humanisme de l’Institut de Recherche et d’Histoire des Textes qui numérisent et valorisent des ouvrages anciens conservés dans des bibliothèques de la région Centre , Manioc : bibliothèque numérique, Caraïbe, Amazonie, Plateau des Guyanes piloté par le Service commun de documentation de l’université des Antilles et de la Guyane en lien avec le Centre de Recherches Interdisciplinaires en Lettres, Langues, Arts et Sciences humaines (CRILLASH), responsable scientifique du projet auquel collaborent de nombreux chercheurs, Les Manuscrits de Stendhal, projet mené en collaboration entre la bibliothèque municipale de Grenoble, l’université Stendhal-Grenoble 3 et la MSH Alpes, le projet Usines 3D : histoire industrielle et reconstitution virtuelle, mené par des équipes de recherche du CNRS et le Ministère de la culture et de la communication et visant à proposer au grand public une histoire des grands sites de la construction automobile en France.  Ce dernier exemple permet aux  Humanités numériques de prendre toute leur dimension, en favorisant le lien entre culture, recherche et société4. Les programmes scientifiques sont amenés à être diffusés par de nouveaux modes d’écritures et de communication, souvent issus du web 2.0, visant à rendre les résultats plus accessibles. Le mouvement des carnets de recherche sur la plateforme Hypothèses participe de cet objectif.

Trois grands domaines5 soutiennent et conditionnent la réussite de ces projets : la recherche, les données (les plus complètes possible) et les ressources et enfin les standards, les formats et les guides des bonnes pratiques. Les bibliothèques et les services d’archives possèdent une expertise avérée sur ces derniers sujets et peuvent désormais servir de socles et de prestataires de services (gestion de données, diffusion, valorisation) à des laboratoires de recherche qui expriment le besoin d’avancer dans des perspectives de données ouvertes, de web sémantique et de données liées (linked data). L’ouverture du site data.bnf.fr est un exemple probant d’ouverture et de mise à disposition de données complètes et validées au service de la communauté6. Les collaborations entre la recherche et la documentation permettraient aussi aux établissements documentaires de comprendre et de mieux répondre aux besoins des chercheurs. Les cultures professionnelles sont à mêler dans un souci de compréhension mutuelle et d’approches croisées.

Bibliographie

Pierre Mounier, dir., Read/Write Book 2. Une introduction aux humanités numériques, OpenEdition, 2012. http://press.openedition.org/226

Collectif, THATCamp Paris 2012. Nouvelle édition [en ligne]. Paris: Éditions de la Maison des sciences de l’homme, 2012, Disponible sur Internet. <http://books.openedition.org/editionsmsh/278>. ISBN 9782821818798.

Crédits photographiques

Lien à la photographie « Digital Humanities Wordle » sur Flickr par nicomachus.

  1. Voir les différentes définitions dans Benjamin Caraco, « Les digital humanities et les bibliothèques », BBF, 2012, n° 2, p. 69-73 [en ligne] <http://bbf.enssib.fr/> []
  2. Yann Potin, « Institutions et pratiques d’archives face à la « numérisation ». Expériences et malentendus », Revue d’histoire moderne et contemporaine, 2011/5, n° 58-4bis, p. 57 et p. 67. []
  3. http://googleblog.blogspot.fr/2010/07/our-commitment-to-digital-humanities.html []
  4. http://blog.homo-numericus.net/articlecategory/dh/sdh []
  5. On peut citer le programme Dariah visant à promouvoir les services autour des données : http://www.tge-adonis.fr/article/journee-de-presentation-de-dariah-30-janvier-2013 []
  6. Cf. l’expérimentation OpenCat présentée officiellement le 25 mars 2013 au Salon du Livre sur le stand de la BnF : http://www.bnf.fr/fr/professionnels/modelisation_ontologies/a.opencat.html []

Lire aussi sur Insula :

Citer ce billet

Isabelle Westeel, « Données, corpus numérisés et humanités numériques », Insula [En ligne], ISSN 2427-8297, mis en ligne le 9 avril 2013. URL : <https://insula.univ-lille.fr/2013/04/09/donnees-corpus-numerises/>. Consulté le 21 November 2024.