Newsletter n°5, Janvier 2012
   
 
Direction de la documentation
Pôle Information Scientifique et Technique

École des Ponts ParisTech
  
 
Dans ce numéro :
 
Comment optimiser
votre utilisation de HAL pour alimenter
vos rapports d’activités
et vos pages web
 

Une question ?

Si vous souhaitez qu'un point particulier soit abordé dans cette newsletter, n'hésitez pas à nous en faire part.


 
01 64 15 34 62

Pôle IST de la Direction de la Documentation, des Archives et du Patrimoine
 
 
 
 

 


 
Vous connaissez déjà la plate-forme HAL pour l’archivage pérenne de vos publications et pour leur valorisation sur Internet, nous souhaitons ici vous inciter à l’utiliser pour générer les bibliographies nécessaires à l’alimentation de vos documents, de vos rapports d’activités notamment, et aussi de vos sites web.
HAL peut alors servir à centraliser l’ensemble des publications d’un laboratoire pour être le point de départ de différents types d’exports et faire ainsi d’une pierre deux coups : valorisation et exportation de références. Par ailleurs, nous verrons que le Pôle IST de la Direction de la documentation de l'École a également travaillé dans le cadre de ParisTech à automatiser au maximum l’alimentation de HAL avec des imports par lot.
 
L’objectif de ce dossier est de vous montrer comment éviter le plus possible de saisir des références bibliographiques plusieurs fois dans des bases et documents différents et même de profiter des grandes bases bibliographiques pour récupérer l’existant.
Imports...
La méthode classique

La manière traditionnelle d’alimenter HAL est de procéder à des dépôts manuels en remplissant les champs des formulaires dédiés à chaque type de documents. Si chaque chercheur procède lui-même au fur et à mesure de leur parution au dépôt de ses publications et communications, ce n’est pas très long pour un impact immédiat immense en termes de valorisation. L’étape la plus longue est sans conteste celle de la saisie des différents co-auteurs. Des améliorations sont annoncées pour la version 3 de HAL attendue au printemps 2013, mais en attendant, il faut se souvenir que l’affiliation d’un seul des auteurs suffit pour le dépôt d’une référence bibliographique uniquement, les autres co-auteurs peuvent rester « orphelins ». Malgré tout, il est préférable de prendre un peu de temps pour signaler l’affiliation des chercheurs français dont les codes laboratoires sont connus de HAL. Pour gagner du temps, pensez à utiliser la fonction Ajouter une liste d’auteurs ou Sélectionner depuis mes auteurs pour minimiser le risque d’erreur dans les noms des auteurs et n’avoir plus qu’à saisir leur affiliation.
 
 
La récupération d’un dépôt effectué sur ArXiv.org                                                                                                           
Il faut à tout prix éviter la saisie multiple de données bibliographiques : si un dépôt a déjà été effectué sur ArXiv (archive ouverte de preprints en mathématiques et physique principalement), il est possible de l’intégrer dans HAL avec la fonction Récupération depuis ArXiv du menu déroulant Déposer.
Il suffit de copier-coller l’identifiant du document sur ArXiv dans le champ dédié sur HAL, les métadonnées bibliographiques sont ainsi automatiquement importées (auteur(s), titre, année, résumé) ; reste à compléter les affiliations des auteurs (au moins pour l’un d’entre eux).
 
 
La pré-saisie BibTex

Pour le dépôt d’une référence et du texte intégral, il existe aussi une fonctionnalité d’aide à la saisie qu’on utilise en récupérant une référence au format BibTex et en la collant dans le champ dédié dans HAL, à partir du menu Déposer, et Présaisie BibTex. Il faudra cette fois-ci saisir ensuite une affiliation pour tous les auteurs.
 
Exemple d’une référence au format BibTex :
@article{ ,
Author = {Swart, Rob and Bernstein, Lenny and Ha-Duong, Minh and Petersen, Arthur},
Title = {{Agreeing to disagree: uncertainty management in assessing climate change, impacts and responses by the IPCC}},
Journal = {{CLIMATIC CHANGE}},
Year = {{2009}},
Volume = {{92}},
Number = {{1-2}},
Pages = {{1-29}},
Month = {{JAN}},
Abstract = {{résumé retiré pour ne pas alourdir la newsletter}},
DOI = {{10.1007/s10584-008-9444-7}},
Keywords-Plus = {{CHANGE ASSESSMENTS; PROBABILITIES; LIKELIHOOD; SCENARIOS; SCIENCE}},
}
 
 
La méthode la plus efficace : l’import XML et l’aide des documentalistes

Dans les trois cas précédents, il s’agissait d’effectuer des dépôts un par un en évitant simplement la saisie des données bibliographiques. L’import XML permet l’injection en masse dans HAL de références seules avec leurs auteurs et leur(s) affiliation(s). La Direction de la Documentation de l'École a travaillé avec l'École des Mines et l'École Polytechnique afin de développer des macros Excel (programmes informatiques) qui permettent la génération des fichiers au format XML accepté par HAL.
 
      
Le processus
Le projet de départ était de récupérer des références depuis le Web of Science et Scopus en les exportant dans Excel, de leur faire subir la moulinette des macros Excel pour obtenir le fichier XML attendu. Cette étape de transformation peut être très longue puisqu’après un premier traitement de dédoublonnage des données, il faut inspecter l’affiliation des auteurs à partir de leur signature dans l’article publié. Dans la mesure où pour le dépôt de références seules il suffit qu’un auteur seulement ait une affiliation dans HAL, nous repérons les différentes formes des laboratoires de l’Ecole pour que l’association "chercheur de l’Ecole – identifiant HAL de son laboratoire" soit effectuée. Pour les autres laboratoires, leur nom est renseigné dans HAL mais les tutelles de ce dernier ne sont pas saisies.
 
Une fois la référence en ligne, si un chercheur ou un documentaliste d’un autre établissement veut en améliorer la qualité et/ou ajouter le texte intégral, il est toujours possible de lui transférer la propriété du dépôt.
Concrètement, pour procéder à une vague d’imports XML dans HAL, il faut demander une autorisation au CCSD. Pour mettre en place ce type d’opérations, il faut donc vous rapprocher du Pôle IST de la Direction de la Documentation.
C’est ainsi que l’équipe a pu charger plus de 580 dépôts pour le LEESU, le CIRED et le CEREA.
 
Parmi ces dépôts, certains ne sont pas des références repérées dans le Web of Science ou dans Scopus mais sont créés à partir de fichiers Excel. Par exemple pour le LEESU, ce sont les publications du laboratoire stockées dans une base (avec l’outil RefBase) qui ont été reprises et déposées dans HAL, grâce au travail en binôme d’une documentaliste et d’un chercheur. La quasi-totalité des références nécessaires à la bibliographie du rapport AERES sont ainsi dans HAL, valorisées par cette plateforme en Open Access mais aussi exportables très facilement dans le rapport comme nous le verrons ensuite.
 
Si vous souhaitez procéder à l’import de références, demandez à votre documentaliste référent le détail de la procédure. Celle-ci peut paraître longue au premier abord mais elle est plus rapide qu’une saisie manuelle et surtout bien moins fastidieuse. Elle n’est en tout cas pas plus chronophage que la mise en page dans un traitement de texte de données bibliographiques hétérogènes récupérées auprès de personnes différentes. Et, en dehors des possibilités d’export que nous allons aborder maintenant, cette procédure permet de valoriser les travaux d’un laboratoire et de dégager du temps pour les chercheurs qui n’ont plus qu’à procéder à la vérification des dépôts qui les concernent et à y joindre le texte intégral si cela est possible.
...exports !
Générer une bibliographie pour alimenter un rapport
 
Une fois que toutes les forces des laboratoires ont œuvré à la collecte des références et que celles-ci ont été déposées d’une manière ou d’une autre dans HAL, la génération de bibliographies propres est un jeu d’enfant.
Il est possible de générer la bibliographie directement depuis HAL, depuis le menu Services, puis Exporter une liste de publications. Après une requête pour identifier les bonnes références à intégrer, il suffit de choisir les métadonnées que l’on souhaite intégrer dans sa bibliographie et de les exporter, par exemple au format RTF pour les retravailler dans un traitement de texte. Celles-ci sont classées automatiquement par grands types de publications.
A noter d’ailleurs que la typologie des documents dans HAL-ENPC est parallèle à celle de l’AERES, ce qui constitue un argument supplémentaire pour utiliser HAL lors de la génération du rapport.

Pour affiner la requête de départ et distinguer en 2 lots les publications dans des revues nationales et celles dans des revues internationales pour le Rapport d’Activités Recherche de l’Ecole ou celui de l’AERES par exemple, il faut penser à moduler l’audience parmi la liste des champs interrogeables.
Par ailleurs, pour être encore plus efficace, il est possible d’exporter les références dans un outil de gestion de références bibliographiques, tel que Zotero, Mendeley ou encore EndNote (voir la Newsletter IST n°3 pour plus de détails sur ces outils). Grâce à ce type de logiciels, il sera possible d’organiser les références en différentes rubriques (ou collections) et surtout de générer une bibliographie très propre au format voulu et homogène : par exemple, auteurs en majuscules et en gras, année entre parenthèses, titre entre guillemets, afficher le DOI, afficher l’URL de la référence dans HAL (pour un preprint), etc.
 
Pour résumer, la combinaison gagnante pour limiter les saisies multiples, pour valoriser sa production et pour s’organiser pour la génération de bibliographies est indéniablement l’association de HAL et d’un outil de gestion de références bibliographiques.
N’hésitez pas à demander l’aide des documentalistes pour mettre en place cette stratégie.
 
 
Générer une bibliographie pour le web

Enfin, toujours dans l’idée de contribuer à la dissémination de l’information scientifique sans pour autant multiplier la saisie de données bibliographiques, HAL permet en quelques clics de générer la page web des publications d’un chercheur ou d’un laboratoire. Celle-ci peut être insérée sur le site du laboratoire à la rubrique Publications ou encore sur chaque page personnelle de chercheur. Et surtout, elle est mise à jour automatiquement avec le dépôt de nouvelles publications dans HAL.

Voici 4 exemples :
  • sur cette page, la production scientifique du LEESU, du CEREVE et du CERGRENE, mise à jour automatiquement
  • sur cette page, les publications d’un chercheur du laboratoire Saint-Venant
  • sur cette page, la production du laboratoire Navier
  • sur cette page d’une chercheuse du LVMT, le lien vers ses publications dans HAL (en haut de page)
Notez que le lien éventuel vers le texte intégral est proposé avec chaque référence concernée.
 
 
Pour créer ce type de pages :
  1. Il faut remplir le formulaire disponible dans le menu Services, rubrique Créer une page web sur HAL pour définir le périmètre des publications que l’on souhaite afficher (pour un auteur, pour un laboratoire, pour une équipe de recherche, pour quelle(s) année(s), pour quel(s) type(s) de publications, etc.) mais aussi sous quelle forme avec quelques options sur les champs à afficher, l’ordre et aussi la forme de la bibliographie finale (sous le menu déroulant CSS prédéfinie).
  2. Un aperçu du résultat final est proposé sur la droite de l’écran.
  3. Il suffit ensuite de récupérer l’URL proposée dans cette même zone et de la confier au webmaster du site sur lequel la bibliographie devra être affichée.
  4. Notez que cette URL peut aussi être insérée dans la signature de vos mails et vos correspondants auront accès directement à une liste à jour de vos publications. Elle peut aussi être récupérée pour alimenter un CV par exemple.
Action !
Si les arguments de la libre diffusion des travaux de la recherche, l’augmentation de leur visibilité et leur conservation pérenne n’avaient pas encore suffi à vous persuader du réel avantage d’un dépôt sur HAL, les possibilités de travail collaboratif et d’exports des données devraient cette fois-ci vous convaincre.
 
Les documentalistes de l'École sont à votre disposition pour vous renseigner et vous aider dans cette démarche.
 
Pôle IST de la Direction de la Documentation, des Archives et du Patrimoine
Frédérique Bordignon (01 64 15 34 62 -  @freddie2310)
Florence Rivière (01 64 15 34 14)