Données ouvertes (open data)

Définition

Les données ouverte sont des données dont l'accès, et éventuellement la réutilisation, sont laissés libres, sans restriction technique et sans restriction juridique (grâce à une licence libre).

MéthodeLes principes FAIR pour l'Open Data

  • Findable : entrepôt, identification, description...

  • Accessible : accès libre, métadonnées libres...

  • Interoperable: formats ouverts, standards...

  • Reusable : licence libre, documentation...

FondamentalLes données publiques naissent libres

En France, la loi pour une république numérique de 2016 pose que les données produites par les administrations publiques sont ouvertes par défaut : elle sont librement accessibles et réutilisables.

AttentionRGPD

La publication des données doit tenir compte des contraintes légales ou éthiques, comme le RGPD.

ComplémentDonnées de la recherche

La Loi pour une République numérique assimile les données de recherche à des données publiques. A l'instar des données produites par l'administration en France, elles sont désormais incluses « par défaut » dans le principe de données ouvertes. En principe, les données de recherche doivent être publiées sur Internet et rendues librement réutilisables.

Passeport pour la science ouverte : Guide pratique à l'usage des doctorant(e)s. 2020. https://www.ouvrirlascience.fr/passeport-pour-la-science-ouverte-guide-pratique-a-lusage-des-doctorants (p25)

ComplémentFAIR

Findable / Facile à trouver :

  • Déposer les données dans un entrepôt

  • Attribuer un identifiant unique et pérenne aux données

  • Décrire les données par des métadonnées riches

Accessible :

  • Définir les conditions d'accès aux données

  • Si possible, rendre les données accessibles librement

  • Si les données doivent rester en accès restreint, rendre accessibles les métadonnées pour signaler l'existence des données

Interopérable :

  • Privilégier des formats ouverts ou largement utilisés

  • Mettre à disposition le code source du logiciel nécessaire pour lire, traiter, analyser les données s'il a été développé en interne

  • Privilégier les standards de métadonnées et les vocabulaires standards

  • Si possible, indiquer des liens vers d'autres ressources (autres données, publication...)

Reusable / Réutilisable :

  • Associer une licence de diffusion aux jeux de données

  • Associer de la documentation pour décrire les données de façon détaillée, les contextualiser, les rendre compréhensibles...

Les principes FAIR : Findable, Accessible, Interoperable, Reusable. 2020. https://openscience.pasteur.fr/2020/10/05/les-principes-fair-findable-accessible-interoperable-reusable/