Publié le 5 décembre 2025 Mis à jour le 5 décembre 2025

Cette formation propose une initiation à OpenRefine, logiciel de traitement des données textuelles (tableaux, fichiers texte ou encodés, extractions de bases de données). Souvent présenté comme "Excel sous hormones", c’est un outil dont les multiples fonctionnalités sont essentielles au travail de recherche.

Avec lui, vous pouvez nettoyer vos jeux de données, les transformer, les enrichir pour faciliter leur exploration, leur analyse et leur réutilisation. Pour mener à bien ces manipulations, une grammaire spécifique est nécessaire : les expressions régulières. Grâce à elle, il est possible de réaliser des recherches et des transformations avancées, dans OpenRefine mais aussi de nombreux autres outils !


Objectifs

  • Comprendre le fonctionnement de l’interface du logiciel OpenRefine et maîtriser son utilisation
  • Nettoyer, transformer, normaliser et enrichir vos données avec le logiciel OpenRefine
  • Identifier et déchiffrer des expressions régulières simples, et les appliquer dans OpenRefine

Programme

  • Présentation du logiciel OpenRefine et de son interface : créer des projets et les gérer
  • Utilisation d’OpenRefine pour explorer un jeu de données : facettes, filtres et tri
  • Utilisation d’OpenRefine pour traiter des données : fonctionnalités simples
  • Initiation aux expressions régulières : principes de la grammaire et application dans OpenRefine