Hébergement de données

Un guide rapide pour prendre de bonnes décisions sur la façon d'héberger les données partagées avec le GBIF

wikimedia-servers
Wikimedia Foundation servers. Photo 2012 Victor Grigas, Wikimedia Foundation, licensed under CC BY-SA 3.0.

GBIF.org est un index de données sur la biodiversité publié par l'intermédiaire d'un réseau mondial d'infrastructures nationales, thématiques et de projets. Dans ce système interconnecté, il est essentiel pour les fournisseurs de données de s'assurer que les données qu'ils partagent disposent d'un point d'accès stable et persistant. Cette exigence est un défi pour de nombreuses institutions, en particulier celles qui sont nouvelles sur le GBIF et peuvent ne pas avoir les installations pour héberger et maintenir des données sur des serveurs toujours en ligne.

Une manière de commencer à résoudre le défi est de distinguer entre la publication de données et l'hébergement de données. Bien que ces activités sont connectées, il n'y a pas d'exigence formelle ou technique au fait que la même institution doive accomplir les deux tâches (même si c'est généralement le cas).

La publication de données est l'acte d'organiser et de partager des données standardisées pour être utilisées à travers le réseau GBIF. Une institution devient un fournisseur de données GBIF en remplissant un formulaire d'inscription en ligne et en recevant une approbation, soit par le biais de l'un des Participants nationaux et organisationnels du réseau GBIF ou du Comité Directeur des Noeuds (Nodes Steering Group).

L'hébergement de données est l'acte de stocker les données sur une plateforme web stable et accessible. Bien qu'il n'y ait pas d'arrangement standard pour la fourniture de ce service, l'hébergement de données représente un engagement significatif qui nécessite un engagement dévoué et une capacité à long terme de maintenir une plateforme persistante et hautement fiable connectée à Internet.

Quel que soit l'hébergeur des jeux de données, le GBIF s'emploie à créditer à la fois l'institution qui publie les données et son pays d'enregistrement. Ce qui suit est un guide rapide permettant de prendre des décisions éclairées sur la façon d'héberger les données partagées avec le GBIF.


Étapes d'hébergement

Une fois que vos données ont été organisées dans un format de données pris en charge, procédez comme suit :

  1. Devenez un fournisseur de données GBIF en complétant le formulaire d'inscription du fournisseur
  2. Choisissez un hébergement de données et une plateforme de publication. Le Integrated Publishing Toolkit du GBIF peut être self-hosted, hosted by a national or thematic node (y compris l'un ou l'autre trusted data-hosting centres disponible, ou hébergé par un des cloud-based regional IPTs du secrétariat du GBIF.
  3. Accédez au manuel IPT et ressources de formation
  4. Commencez à publier vos jeux de données


Introduction à l'IPT : Outil de Publication Intégré (Integrated Publishing Toolkit)

L'IPT est un logiciel libre développé et soutenu par le Secrétariat du GBIF que les organisations du monde entier utilisent pour publier et partager des jeux de données sur la biodiversité via le réseau GBIF. L'IPT peut également fonctionner comme dépôt pour les données référencées dans un article, comme dans cet exemple d'une installation IPT hébergée par le réseau Canadensys.

En savoir plus sur les exigences techniques pour l'hébergement d'un IPT

Mode test

L'IPT peut être installé en mode test, ce qui signifie que ses ressources hébergées ne seront pas indexées ou accessibles au public en effectuant une recherche sur GBIF.org. Si vous décidez d'installer votre propre IPT, GBIF vous recommande d'essayer d'abord le mode test afin de comprendre le processus d'inscription. Le mode test est conçu pour évaluer l'IPT ou l'utiliser dans un contexte de formation. Les inscriptions réalisées en mode test seront dirigées auprès d'un registre GBIF de test et les données ne seront jamais indexées.

Une fois que vous êtes sûr que l'IPT fonctionne comme vous le souhaitez, vous devrez réinstaller le logiciel en mode Production pour que les données puissent être découvertes via le GBIF. Le mode production enregistre les jeux de données et les publie afin qu'ils soient indexés et accessibles publiquement via GBIF.org.

L'instance IPT et son organisation associée doivent tous deux être enregistrés auprès du GBIF. Si votre organisation n'est pas encore enregistrée, il vous sera demandé de compléter cette étape et de fournir des informations de base via un court formulaire dans l'IPT. Apprenez en plus sur comment cela fonctionne dans le Manuel de l'Utilisateur de l'IPT


Conditions d'utilisation

L'utilisation d'un hébergeur de données externe par un fournisseur de données devrait être négociée entre les parties concernées, idéalement avec un accord de service qui décrit les conditions et les obligations à la fois pour le fournisseur de données et l'hébergeur des données. L'utilisation de l'IPT du GBIF hébergé sur le cloud sera régie par le Contrat de Publication de Données du GBIF.