
Tout le monde s’entend pour dire que la gestion des données est importante.
Pourtant, dans la pratique, elle est souvent vécue comme un fardeau : les fichiers se retrouvent dispersés dans des dossiers personnels, les métadonnées (les données sur les données) sont incomplètes, et répondre aux exigences administratives devient une course contre la montre à la fin d’un projet.
Après des années de collaboration avec des équipes universitaires, des organismes gouvernementaux, des partenaires industriels et des organisations autochtones, nous observons toujours les mêmes tendances.
Voici six principes qui distinguent les infrastructures de données qui fonctionnent de ceux qui se dégradent peu à peu.
1. La gestion des données est un problème comportemental
La gestion des données est souvent traitée comme un problème technique.
En réalité, c’est surtout un problème comportemental.
Une gestion des données efficace exige que les personnes accomplissent régulièrement de petites tâches essentielles :
- nommer clairement les fichiers
- organiser les dossiers
- documenter les jeux de données
- consigner les métadonnées
- assurer le suivi des versions
Ces tâches sont pourtant nécessaires pour que les données demeurent utilisables dans le temps.
Maintenir ces habitudes demande de la discipline et de la constance, un peu comme faire de l’exercice régulièrement ou bien manger : on sait que c’est bénéfique, même si cela peut sembler fastidieux et peu motivant.
Comprendre cela change notre manière de concevoir les infrastructures de données.
L’objectif n’est pas simplement de bâtir une infrastructure, même si cette composante demeure essentielle.
L’objectif est de soutenir des comportements durables.
2. Réduire la charge mentale
Le principe de conception clé pour une gestion des données efficace est simple : réduire la charge cognitive.
Si un système de gestion des données exige trop d’étapes, de formulaires ou de décisions, les gens finiront par le contourner.
Le même phénomène se produit avec des politiques de mot de passe trop complexes. Quand les procédures de sécurité deviennent trop lourdes, les gens cherchent des façons de les contourner.
Les infrastructures qui réussissent font l’inverse. Ils simplifient les pratiques de travail en :
- minimisant les informations à saisir
- utilisant des conventions claires
- automatisant les tâches répétitives
- s’intégrant aux pratiques existantes
Autrement dit, les bons systèmes minimisent les frictions plutôt que d’en ajouter.
Lorsque la gestion des données devient plus simple que de ne pas le faire, l’adoption suit naturellement.
3. Les outils ne sont pas la solution
Beaucoup de discussions sur la gestion des données portent surtout sur le choix d’outils ou de plateformes.
Mais les outils règlent rarement le problème de fond.
Sans pratiques claires et habitudes constantes, même les plateformes les plus sophistiquées deviennent vite désorganisées.
À l’inverse, plusieurs infrastructures de données efficaces reposent sur des outils relativement simples :
- des dossiers partagés
- des gabarits structurés
- des tableaux de métadonnées légers
- des dépôts avec contrôle de versions
Ce qui compte, ce n’est pas la complexité de l’outil.
Ce qui compte, c’est que le système soutienne de bonnes pratiques que les gens peuvent maintenir dans le temps.
La technologie doit faciliter une bonne gestion des données, pas la remplacer.
4. Commencer plus tôt qu’on le pense. Non, encore plus tôt.
De nombreuses discussions sur la gestion des données commencent après le démarrage d’un projet.
À ce stade, les structures de données sont souvent déjà incohérentes, des éléments de contexte importants manquent, et tout réorganiser devient difficile.
Les stratégies les plus efficaces commencent beaucoup plus tôt, souvent dès l’étape de la proposition.
Cela ne nécessite pas de mettre en place d’emblée une infrastructure complexe. Il s’agit plutôt de s’entendre rapidement sur quelques principes de base :
- comment les données seront organisées
- quelles métadonnées minimales seront enregistrées
- comment les jeux de données seront éventuellement archivés ou partagés
De petites décisions stratégiques prises tôt permettent d’éviter de gros problèmes plus tard.
5. Les métadonnées sont un actif stratégique
Les métadonnées sont souvent considérées comme de la documentation qu’on pourra rédiger plus tard.
En réalité, les métadonnées sont l’actif clé qui permet de découvrir, de comprendre et de réutiliser les jeux de données.
Sans métadonnées, les jeux de données deviennent vite difficiles à interpréter, même pour les personnes qui les ont initialement collectés.
Dans les projets collaboratifs en particulier, les métadonnées jouent un rôle encore plus important. Elles permettent d’indexer, de relier et d’explorer des jeux de données variés à travers les projets, un peu comme les étiquettes ou les catégories rendent l’information repérable sur le web.
En pratique, cela consiste généralement à saisir un petit ensemble de descripteurs partagés, par exemple qui a collecté les données, où et quand elles ont été collectées, quelles variables ont été mesurées et comment les données peuvent être consultées.
Cette couche minimale d’information partagée permet la coordination sans imposer une standardisation complète et crée les bases de l’interopérabilité des données entre disciplines.
6. Coordonner sans rigidité
Plusieurs équipes tentent de résoudre la gestion des données en construisant un système centralisé unique dans lequel tout doit entrer.
Cette approche fonctionne rarement.
Les équipes collectent des types de données différents, utilisent des outils différents et travaillent à des échelles différentes. Forcer l’ensemble dans une structure rigide a tendance à créer plus de friction que de coordination.
Des systèmes trop complexes ou trop rigides peuvent aussi engendrer un autre problème : une dépendance envers un petit nombre de personnes qui comprennent leur fonctionnement. Lorsque ces personnes quittent le projet, une grande partie de la mémoire institutionnelle peut disparaître avec elles.
Les systèmes plus efficaces permettent l’autonomie des projets tout en rendant possible la coordination à l’échelle de l’équipe ou du réseau.
Cela passe souvent par une infrastructure modulaire, des conventions partagées et des infrastructures de métadonnées qui relient les jeux de données sans les forcer dans un format unique.
Les systèmes plus simples et plus transparents sont plus faciles à maintenir collectivement pour les équipes.
L’objectif n’est pas l’uniformité.
L’objectif est l’interopérabilité.
Concevoir des infrastructures que les gens utiliseront réellement
Dans tous les secteurs, la même leçon revient : les infrastructures de gestion des données réussissent lorsqu’ils sont conçus autour des personnes plutôt qu’autour de la technologie.
L’infrastructure compte, mais les habitudes, les incitatifs et la charge cognitive comptent aussi. Les infrastructures qui exigent trop d’étapes, trop de formulaires ou trop de décisions survivent rarement longtemps dans des contextes réels.
Les approches les plus efficaces prennent le chemin inverse. Elles simplifient les pratiques de travail, réduisent les frictions et rendent les bonnes pratiques plus faciles à maintenir dans le temps.
Dans les prochains billets, nous approfondirons ces idées et partagerons des approches concrètes que les équipes peuvent adopter pour rendre la gestion des données plus simple et plus durable, des hubs de métadonnées et des infrastructures de données interopérables jusqu’aux pratiques légères qui réduisent les frictions pour les chercheurs et les équipes de projet.
Parce qu’au final, une gestion des données efficace ne consiste pas à construire le système le plus sophistiqué.
Il s’agit de construire des systèmes que les gens utiliseront réellement.
Vous avez un sujet en tête ou souhaitez rester informé de notre travail?
Faites-nous signe!