Données ouvertes (open data)
Définition :
Les données ouverte sont des données dont l'accès, et éventuellement la réutilisation, sont laissés libres, sans restriction technique et sans restriction juridique (grâce à une licence libre).
Méthode : Les principes FAIR pour l'Open Data
Findable : entrepôt, identification, description...
Accessible : accès libre, métadonnées libres...
Interoperable: formats ouverts, standards...
Reusable : licence libre, documentation...
Fondamental : Les données publiques naissent libres
En France, la loi pour une république numérique de 2016 pose que les données produites par les administrations publiques sont ouvertes par défaut : elle sont librement accessibles et réutilisables.
Attention : RGPD
La publication des données doit tenir compte des contraintes légales ou éthiques, comme le RGPD.
Complément : Données de la recherche
La Loi pour une République numérique assimile les données de recherche à des données publiques. A l'instar des données produites par l'administration en France, elles sont désormais incluses « par défaut » dans le principe de données ouvertes. En principe, les données de recherche doivent être publiées sur Internet et rendues librement réutilisables.
Passeport pour la science ouverte : Guide pratique à l'usage des doctorant(e)s. 2020. https://www.ouvrirlascience.fr/passeport-pour-la-science-ouverte-guide-pratique-a-lusage-des-doctorants (p25)
Complément : FAIR
Findable / Facile à trouver :
Déposer les données dans un entrepôt
Attribuer un identifiant unique et pérenne aux données
Décrire les données par des métadonnées riches
Accessible :
Définir les conditions d'accès aux données
Si possible, rendre les données accessibles librement
Si les données doivent rester en accès restreint, rendre accessibles les métadonnées pour signaler l'existence des données
Interopérable :
Privilégier des formats ouverts ou largement utilisés
Mettre à disposition le code source du logiciel nécessaire pour lire, traiter, analyser les données s'il a été développé en interne
Privilégier les standards de métadonnées et les vocabulaires standards
Si possible, indiquer des liens vers d'autres ressources (autres données, publication...)
Reusable / Réutilisable :
Associer une licence de diffusion aux jeux de données
Associer de la documentation pour décrire les données de façon détaillée, les contextualiser, les rendre compréhensibles...
Les principes FAIR : Findable, Accessible, Interoperable, Reusable. 2020. https://openscience.pasteur.fr/2020/10/05/les-principes-fair-findable-accessible-interoperable-reusable/