Lignes directrices relatives au plan de gestion des données
Introduction
Les plans de gestion des données (PGD) varient grandement en fonction du contexte entourant les domaines de recherche, les méthodes de recherche et les projets qu'ils touchent. Cela dit, chaque PGD doit traiter des considérations relatives à plusieurs sujets clés : collecte de données; documentation et métadonnées; stockage, dépôt et préservation; partage et réutilisation; responsabilités et ressources; conformité éthique et juridique. Consultez la page suivante afin d'obtenir plus d'orientations sur chacune de ces sections.
Généralement, le PGD idéal est complet, précis et conforme aux pratiques exemplaires propres à sa discipline. Les causes des lacunes d'un PGD sont habituellement les suivantes : le PGD ne détaille pas le dépôt des données (incomplet); il ne précise pas où seront conservées les données (imprécis); le dépôt sélectionné se prête mal au type de données (non conforme aux pratiques exemplaires propres à la discipline du projet). Les IRSC reconnaissent néanmoins que dans plusieurs domaines de recherche, les pratiques en matière de gestion des données sont en cours d'élaboration et les pratiques exemplaires n'ont pas encore été établies (c.-à-d. dépôts préconisés, normes de métadonnées, etc.).
Un PGD doit en outre décrire comment les données adhèreront aux principes FAIR – Findable (facile à trouver), Accessible (accessible), Interoperable (interexploitable) et Reusable (réutilisable). Toutefois, cela ne signifie pas qu'il doit comprendre une section dédiée à la conformité des données aux principes FAIR; un PGD complet, précis et conforme aux pratiques exemplaires, le cas échéant, décrira adéquatement l'adhérence des données à ces principes. Les IRSC reconnaissent que les défauts en matière d'infrastructure (p. ex. absence de dépôt convenable) et les pratiques propres à la discipline du projet (p. ex. absence de normes de métadonnées) peuvent limiter l'adhérence des données aux principes FAIR. Les IRSC reconnaissent également la différence entre des données « accessibles » et « ouvertes ». Dans beaucoup de cas, en raison d'obligations éthiques, commerciales ou juridiques, les données doivent être assujetties à un accès contrôlé et, dans certains cas, l'accès aux données ne peut pas être fourni. Voyez les conseils des IRSC sur l'application de ces principes.
Pour la recherche réalisée par ou avec une communauté métisse, inuite ou des Premières Nations, le PGD doit être élaboré conjointement avec cette communauté, conformément aux principes de gestion des données de recherche qu'elle accepte, comme les principes CARE (en anglais seulement) – Collective Benefit (avantage collectif), Authority to Control (autonomie décisionnelle), Responsibility (responsabilisation) et Ethics (éthique) – ou PCAP® – propriété, contrôle, accès et possession. Lorsqu'une telle collaboration est impossible, le PGD doit respecter la souveraineté des données des Autochtones, comprendre des clauses relatives à la gestion des données de recherche des Autochtones et reconnaître qu'il pourrait être révisé conformément aux valeurs et principes de la communauté.
Instructions pour les différentes sections du plan de gestion des données
Collecte de données
- Décrivez quelles données seront recueillies, produites ou utilisées et de quelle manière – p. ex. au moyen d'études observationnelles, d'expériences, de simulations, de logiciels ou d'outils en particulier (p. ex. REDCap).
Exemple de lacunes à combler dans cette section :
- Le plan indique quelles données seront produites, mais il ne précise pas quel logiciel ou quelle plateforme seront utilisés pour les produire.
Documentation et métadonnées
- Expliquez si des informations seront fournies aux autres pour aider à la compréhension et à la réutilisation des données – p. ex. fichier de texte « readme », cahier de code, cahier de laboratoire, etc. Idéalement, la documentation du jeu de données est fournie dans un format lisible par machine et librement accessible – p. ex. en formats « .csv » ou « .txt ».
- Indiquez quelle norme de métadonnées sera utilisée, lorsque possible et pertinent. La norme peut être générale (p. ex. Dublin Core [en anglais seulement]), mais elle est idéalement propre au domaine du projet (le cas échéant, elle peut être soutenue par le dépôt dans lequel vous prévoyez stocker les données). Une telle indication est particulièrement pertinente pour les équipes de recherche qui prévoient établir une plateforme ou un centre de données.
Exemples de lacunes à combler dans cette section :
- Le plan prévoit la documentation adéquate des données, mais il n'explique pas quelle méthode sera employée – p. ex. au moyen d'un fichier de texte « readme ».
- Le plan ne précise pas si une norme de métadonnées sera utilisée et n'apporte pas de justification à cet effet.
Stockage, dépôt et préservation
- Expliquez où et comment les données seront stockées et sauvegardées au cours du projet de recherche. L'emplacement de stockage est souvent fourni par votre établissement, ou parfois par des fournisseurs externes, surtout si vous prévoyez collaborer avec l'industrie ou d'autres partenaires non universitaires.
- Expliquez où les données seront déposées lorsque le projet de recherche sera terminé et pendant combien de temps elles seront conservées. Les chercheurs peuvent décider de conserver les données dans le dépôt de leur établissement, de les déposer dans un dépôt externe, ou bien d'en conserver une partie au sein de leur établissement et de déposer le reste dans un dépôt externe. Il est important de prévoir ces éléments dès le début du projet, afin qu'un plan clair puisse être suivi dans l'éventualité où le CPD quitterait ses fonctions ou changerait d'établissement.
Exemples de lacunes à combler dans cette section :
- Le plan indique que les données seront stockées et sauvegardées au cours du projet, mais il manque de précision quant aux détails du lieu et des procédures d'entreposage.
- Le plan indique que les données seront déposées, mais il ne précise pas où ni pendant combien de temps; le plan mentionne un dépôt, mais celui-ci est inadéquat ou non conforme aux pratiques exemplaires propres à la discipline du projet.
Partage et réutilisation
- Expliquez quelles données seront partagées et sous quelle forme (c.-à-d. brutes ou traitées). Expliquez, s'il y a lieu, si les données sont assujetties à des contrôles d'accès ou à des limites pour des raisons de confidentialité, de protection de la vie privée ou de propriété intellectuelle.
- Décrivez les procédures d'accès aux données s'il y a lieu.
Exemples de lacunes à combler dans cette section :
- Le plan mentionne que les données ne peuvent pas être partagées afin de respecter des exigences de protection de la vie privée ou d'un comité d'éthique de la recherche, mais les explications à ce sujet sont manquantes ou peu convaincantes.
- Le plan n'explique pas comment les données seront rendues accessibles aux autres – p. ex. le dépôt rendra les données disponibles à tous sur le Web ou en contrôlera l'accès, un identifiant pérenne à ajouter aux publications sera assigné aux données, etc.
Responsabilités et ressources
- Établissez qui sera responsable de la gestion des données pendant et après le projet, ainsi que les principales tâches de gestion des données associées à ces responsabilités.
- Fournissez une estimation des coûts liés à la gestion des données – p. ex. coordination des données, stockage et sauvegarde des fichiers, archivage.
Exemples de lacunes à combler dans cette section :
- Le plan n'établit pas qui sera responsable de la gestion des données du projet (c.-à-d. responsabilité générale ou responsabilité de tâches en particulier); ces responsabilités ne sont pas mentionnées dans d'autres documents relatifs à la candidature (p. ex. dans le tableau des participants).
- Le plan fournit une estimation des coûts, mais elle n'est pas comprise dans le budget total du projet (soumis dans un document distinct) ou ne concorde pas avec le budget.
Conformité éthique et juridique
- Décrivez toutes les obligations éthiques ou juridiques auxquelles les données sont assujetties. Si le projet comprend des données sensibles, expliquez comment elles seront gérées de façon sécuritaire.
- Expliquez, s'il y a lieu, les risques associés à la gestion et au partage de données sensibles – p. ex. protection de la vie privée, consentement, etc. – ainsi que la façon dont ces risques seront atténués.
Exemples de lacunes à combler dans cette section :
- Le plan indique que les données sensibles seront assujetties à un accès contrôlé, mais les procédures d'accès à ces données ne sont pas détaillées.
- Le plan énonce les risques associés à la protection de la vie privée, mais il n'explique pas comment ceux-ci seront atténués.
Cinq étapes essentielles pour appliquer les principes FAIR à vos données
Les principes FAIR sont le reflet des meilleures pratiques internationales pour garantir que les données de recherche diffusées sont faciles à trouver, accessibles, interexploitables et réutilisables. Le présent document vise à vous fournir des indications pour adhérer à ces principes.
Les principes FAIR et le présent document n'offrent pas d'indications quant aux questions et aux approches éthiques qui doivent être prises en compte pour déterminer les paramètres d'accès aux données à mettre en place. Pour obtenir plus de renseignements et de conseils sur les questions éthiques liées au partage de données, veuillez communiquer avec les bibliothécaires de données ou les agents d'éthique de la recherche de votre établissement.
En ce qui concerne la recherche réalisée par ou avec une communauté métisse, inuite ou des Premières Nations, les principes FAIR ne doivent être appliqués qu'après en avoir informé la communauté autochtone concernée, après avoir obtenu son consentement et conformément aux principes de gestion des données de recherche qu'elle accepte, comme les principes CARE (en anglais seulement) – Collective Benefit (avantage collectif), Authoriy Control (autonomie décisionnelle), Responsibility (responsabilisation) et Ethics (éthique) – ou PCAP© – propriété, contrôle, accès et possession.
Dans l'encadré ci-dessous, vous trouverez un résumé des cinq étapes à suivre pour appliquer les principes FAIR à vos données. Pour obtenir des directives techniques et détaillées, veuillez consulter la page FAIR Principles (en anglais seulement) sur le site Web de GOFAIR.
Cinq étapes essentielles pour appliquer les principes FAIR à vos données
- Créez ou enregistrez une version de vos données dans un format de fichier couramment compris et non exclusif (p. ex. .txt, .csv). Si des normes de données ou des attentes quant au format des données sont établies pour votre domaine de recherche, respectez-les.
- Déposez vos données dans un dépôt reconnu par votre domaine de recherche. S'il n'existe aucun dépôt propre à votre domaine, choisissez un dépôt général (p. ex. DFDR, Zenodo [en anglais seulement], Dryad [en anglais seulement]). Le dépôt doit être indexé dans un agrégateur de bases de données de premier plan (p. ex. OpenAIRE [en anglais seulement], Dataset Search de Google, DataMed [en anglais seulement]).
- Une norme de métadonnées doit être établie pour le dépôt; suivez cette norme lorsque vous remplissez la fiche de métadonnées du jeu de données. Vous pouvez utiliser des outils en ligne comme CEDAR Workbench (en anglais seulement) pour vous aider à remplir la fiche de métadonnées sans commettre d'erreur.
- Choisissez une licence appropriée (en anglais seulement) pour la réutilisation de vos données.
- Le dépôt doit permettre d'attribuer un identifiant pérenne (PID) au jeu de données ou à la fiche de métadonnées, comme un identificateur d'objet numérique (DOI) (en anglais seulement). Lorsque vous publiez un article qui se fonde sur ces données, veillez à ce qu'il comporte un énoncé sur l'accès aux données comprenant un PID.
- Date de modification :