Newsletter IST n°17, Janvier 2019
Direction de la documentation
Pôle Information Scientifique et Technique

École des Ponts ParisTech

 
Ce 17ème numéro de la newsletter IST est consacré aux données, ce qui tombe très bien puisque vous avez des données.


À l’occasion de l’enquête que nous avons réalisée auprès de vous en 2018 et à laquelle vous avez été nombreux à répondre (218, merci), nous cernons mieux vos besoins en matière de traitement et de management de données. Ils portent sur :
  • les aspects techniques, autrement dit où déposer ? dans quel format ? quel lien avec les publications associées ? Les pages dédiées de l’Espace chercheurs pourront vous apporter de précieuses informations ; et nous aussi, n'hésitez pas à nous solliciter et nous organisons aussi régulièrement des ateliers dans vos labos...
  • les aspects juridiques, autrement dit ce que vous pouvez et devez faire de vos données. Sur ces questions-là, nous étions moins à l’aise, mais nous avons étudié longuement les textes juridiques concernés, nous avons reçu l’aide d’un cabinet d’avocats spécialisé (financement DR), nous avons consacré énormément de temps à comprendre le contexte et… nous sommes désormais en capacité de répondre à vos questions et surtout de vous proposer une vue simplifiée.

En effet, en plus de la page dédiée sur l'Espace chercheurs, le Pôle IST met à votre disposition un outil d’aide à la décision en matière de partage des données de la recherche. Il se trouve sous la forme d’un logigramme à plat (à suivre avec son doigt…) et aussi en version dynamique (en répondant à une série de questions) :

 
Pour les curieux et ceux qui aiment comprendre, pour vous chercheurs donc, les paragraphes suivants de la newsletter sont consacrés au raisonnement qui permet de déterminer qui est titulaire des droits sur les données de la recherche et quelles sont les possibilités et obligations de diffusion.
Titularité des droits et diffusion
Le code de la propriété intellectuelle indique que les œuvres de l’esprit ne sont protégées par le droit d’auteur que lorsqu’elles sont formalisées et porteuses d’originalité. Les idées, les concepts, ainsi que les algorithmes ne sont donc pas protégés par le droit d’auteur : c’est leur formalisation qui le devient (texte, logiciel…). On peut donc considérer que certaines données sont protégées par le droit d’auteur, d’autres non.
 
Mais dans tous les cas, sauf convention stipulant l’inverse,
c’est l’École des Ponts qui est titulaire des droits.

En effet, les agents de l’État n’ont pas de droits sur les œuvres produites dans l’exercice de leurs fonctions, sauf si de par leur statut ils ne sont soumis à aucun contrôle préalable de l’autorité hiérarchique ; cette exception ne s’applique explicitement qu’aux enseignants-chercheurs. Ce statut n’existe pas à l’École des Ponts. Il existe bien sûr des chercheurs qui enseignent, mais il ne s’agit pas à proprement parler d’enseignants-chercheurs au sens administratif du terme.
Heureusement, dans un souci d’efficience, pour rester en adéquation avec les pratiques scientifiques, et afin d’encourager au partage des données, l’École des Ponts a délégué à ses chercheurs la mise en œuvre de la diffusion des données et du code informatique dans le respect de la loi.                                                                                                                        
 
Obligation de diffusion et exceptions
 
Il n’existe pas de droit unifié de la donnée. Il faut se référer aux éventuels contrats ou conventions et bien sûr à différents textes juridiques. Heureusement nous avons lu tous ces textes pour vous et ils sont signalés avec précision dans l'analyse synthétique téléchargeable ici.
 
Pour commencer, il faut intégrer que les données et le code sont considérés comme des documents administratifs : cela implique un droit d’accès sur demande, une obligation de diffusion gratuite et une libre réutilisation (même commerciale). L'École ne peut donc pas les commercialiser.
 
2 choses à retenir :             
  • l’obligation de diffusion ne concerne que les données achevées ; autrement dit, cela ne concerne pas vos carnets de labos, ni vos fichiers de données éparses qui alimentent votre recherche.
  • la diffusion est obligatoire si au moins l’un des 4 critères suivants est rempli :
    • Les données ont fait l’objet d’une demande de communication selon la procédure CADA.
    • Elles sont signalées dans le répertoire des principaux documents administratifs que doit tenir l'École.
    • Il s’agit d’une base de données.
    • Les données ont un intérêt environnemental, social, sanitaire ou économique.
Ce dernier critère est sûrement celui qui l’emporte sur tous les autres car il est tout de même très fréquent qu’un travail de recherche revête un intérêt environnemental, sanitaire ou économique et en tout cas impossible qu’il n’ait aucun intérêt social dans la mesure où il est supposé faire avancer la connaissance...

Il existe évidemment quelques exceptions :
  • les données personnelles
Si la demande émane de la personne concernée par ces données personnelles, ces données doivent être communiquées à cette personne uniquement. Dans le cas contraire, les données peuvent être diffusées mais après avoir été anonymisées ou pseudonymisées ou encore si la ou les personnes ont donné leur consentement préalable.
  • les données géographiques
La directive européenne INSPIRE vise à établir une infrastructure d'information géographique dans l’Union Européenne pour favoriser la protection de l'environnement. Elle rend obligatoire la diffusion en ligne par les autorités publiques des données géographiques disponibles au format numérique, même inachevées.
  • les données environnementales
La convention d’Aarhus stipule que les données environnementales doivent être diffusées si elles ont fait l’objet d’une demande. Contrairement à la directive INSPIRE, les données doivent être achevées.
  • les données issues de text ou data-mining
Que ce soit pour gagner du temps dans l’exploration de la littérature scientifique ou plus souvent pour explorer un grand volume de textes ou de données, certains d’entre vous recourent à des outils automatisant ce travail (vous pouvez aussi nous demander). Les données issues de ce travail peuvent donc être diffusées, en revanche, les textes sources ne peuvent l’être que dans le respect du principe de la courte citation.
  • les photos
Avant de diffuser les photos que vous avez prises dans le cadre de vos travaux de recherche, il faut tout d’abord vérifier si des personnes reconnaissables y figurent. Si oui, c’est seulement avec le consentement de la personne que la diffusion pourra se faire. Dans le cas contraire, et même s’il y a des bâtiments ou oeuvres reconnaissables dessus, rien n'empêche la diffusion (“exception de panorama”).
  • les données scrapées
Scraper des données, c’est récupérer par des moyens plus ou moins sophistiqués et automatisés des données disponibles sur le web. Ces données collectées ne peuvent être diffusées que dans le respect des CGU et dans une part non substantielle, ou évidemment avec l’accord du producteur initial. Ceci étant dit, lorsque vous scrapez des données, vous les retravaillez pour les analyser avant de les publier dans le cadre de votre recherche. Le préjudice potentiel vis-à-vis du producteur des données est donc nul et le risque encouru aussi.
 
 
Notez que, dans toutes les situations, la possibilité ou l'obligation de diffuser signifie qu'il a été vérifié que cela ne portait pas atteinte à la protection de la vie privée, au secret médical, au secret des affaires d’une personne, au secret défense.
Enfin, dernier point très important : une fois diffusées en ligne, les données et les bases de données doivent être mises à jour régulièrement.

Spécificités de la titularité des droits pour le code
Rappelons que le code est considéré comme un document administratif au même titre que les données. Lorsque le code appartient à l’École, il est soumis aux mêmes obligations de diffusion que les données.
 
Il convient de se reporter à la fois aux licences appliquées sur les codes informatiques externes qui sont réutilisés et aux conventions, pour savoir ce qui peut être diffusé et selon quelle licence.
Au sein de l’École, c’est cette dernière qui est en principe titulaire des droits patrimoniaux, quel que soit le statut du chercheur.
Si le code fait l’objet d’une valorisation commerciale par l’École, les agents auteurs ne disposent que d’un droit de préférence et doivent bénéficier d’une prime d’intéressement. Enfin les éléments auxiliaires du logiciel (interface utilisateur, cahier des charges, documentation) sont protégés par le droit d’auteur commun, pour lequel il convient alors de vérifier la titularité des droits.
 
Quelle licence appliquer ?
Lors de la diffusion du code ou des données, s’il n’y a pas d’autre obligation légale (convention, réutilisation de briques de code ou de données avec une licence préexistante), la loi impose de choisir entre deux types de licences.
 
Des licences permissives : elles ne protègent que la paternité des auteurs et limitent leur responsabilité. Elles offrent toute liberté de réutilisation, rediffusion, exploitation même commerciale ou modification de licence. Elles sont à choisir de préférence :
 
Des licences avec obligation de réciprocité (ou copyleft) : elles obligent d’une part à conserver les conditions de la licence d’origine, et d’autre part à les propager à toute l’oeuvre dérivée. Elles peuvent donc restreindre l’utilisation commerciale des données et du code et ne doivent être utilisées que de façon proportionnée pour un motif d’intérêt général :

TL;DR: Vous n’êtes pas propriétaire
de vos données,

partagez-les !
 
 
Le Pôle IST est bien entendu à votre disposition pour plus de précisions sur ces questions juridiques, mais aussi pour vous accompagner dans le partage de vos données en vous indiquant les entrepôts les plus adaptés.
 
N’hésitez pas ! We are data librarians !
 
Pour rappel, voici comment sont répartis les laboratoires, entre les 3 documentalistes du Pôle IST :

Romain BOISTEL : CERMICS, LIGM, Navier
Frédérique BORDIGNON : CEREA, CIRED, HM&Co, LEESU
Delphine DU PASQUIER : LATTS, LVMT, Saint-Venant



 
 



Une question ?

Si vous souhaitez qu'un point particulier soit abordé dans cette newsletter, n'hésitez pas à nous en faire part.

 
Pôle IST de la Direction de la Documentation, des archives et du patrimoine
Frédérique Bordignon (01 64 15 34 62 -  @freddie2310)
Delphine Du Pasquier (01 64 15 34 68  -  @DelphParis)
Romain Boistel (01 64 15 34 73 -  @RomBoistel)