Interview : LODEX, un outil open-source au service de la recherche

Caroline SchneiderJérémie Grossetete
#reference#tech4good#oss

L’Inist CNRS a confié à Marmelab le développement de l’outil LODEX. Nous avons déjà écrit il y a quelques années un article technique sur ce beau projet open-source au service du bien commun. Depuis, le projet a continué d’évoluer et est maintenant un pilier important des acteurs de la recherche en France. Nous sommes heureux de vous présenter une interview de Camille de Salabert, utilisatrice et représentante des utilisateurs de Lodex et Nicolas Thouvenin, chargés du projet pour l’Inist CNRS.

Marmelab : Pour commencer, pourriez-vous nous faire une petite introduction et nous expliquer ce qu'est exactement l’INIST et ce que vous faites ?

Nicolas Thouvenin : L'Inist est une unité du CNRS qui compte environ cent cinquante agents et est basée à Nancy. Nous avons trois grandes missions au service de la recherche et principalement du CNRS :

  1. Fournir les moyens et les outils aux chercheurs pour accéder aux publications scientifiques du monde entier
  2. Aider la communauté scientifique à valoriser les données produites lors du processus de recherche
  3. Réaliser une analyse et une fouille du contenu textuel des productions scientifiques pour en extraire de la connaissance à destination du monde de la recherche, ou pour des besoins de pilotage scientifique ou simplement pour le suivi de la politique documentaire C'est cette dernière mission qui nous concerne, Camille et moi.

Camille et Nicolas

Marmelab : Pouvez-vous nous donner quelques exemples concrets de projets que vous menez dans le cadre de ces missions ?

Nicolas Thouvenin : Pour un public technique, nous avons mis en place des portails documentaires qui permettent d'accéder et de consulter des bibliothèques numériques. Nous avons également développé des extensions de navigateur qui permettent aux chercheurs d'accéder directement aux fichiers, quelle que soit la nature de l'abonnement et des négociations qu’il a fallu pour leur donner accès à ces documents. Nous avons des outils comme LODEX, qui permettent d'enregistrer et de signaler principalement des publications scientifiques.

Nous sommes également une bibliothèque numérique avec l’archive ISTEX, avec vingt-sept millions de documents et leurs métadonnées associées, qui sont stockés,traités et valorisés à Nancy pour être mis à la disposition de la communauté scientifique nationale.

Marmelab : Vous avez mentionné le projet LODEX, pourriez-vous nous en dire plus sur l'objectif du projet ?

Nicolas Thouvenin : L’objectif du projet Lodex est d'offrir un outil interne au département Analyse de l’information scientifique, capable de valoriser les données produites lors de projets de recherche. Concrètement, il existe deux cas d’utilisation principaux :

Les études bibliométriques qui correspondent à l’analyse pour un laboratoire des publications scientifiques d’une thématique précise. Lodex leur permet de créer un rapport dynamique des métadonnées des publications. Lodex remonte des métriques comme les auteurs, le nombre de publications par auteur, les domaines de publications des auteurs, etc.

Valorisation des corpus Dans la plateforme Istex, Lodex permet aux chercheurs de constituer des corpus bibliographiques, d’affiner le corpus, d’enrichir les données du corpus. De plus, il permet de mettre à disposition les corpus créés sur le web et de les explorer de manière dynamique. L’objectif est par exemple de savoir quels sont les principaux sujets présents dans le corpus ou de mettre en évidence l'émergence de thématiques scientifiques.

L'outil LODEX

Marmelab : Pourquoi avez-vous choisi de développer votre propre outil, alors qu'il existe des solutions alternatives proposées par des éditeurs ?

Nicolas Thouvenin : Nous avons choisi de développer notre propre outil pour deux raisons principales. Tout d'abord, l'utilisation d'un outil propriétaire risque d'emprisonner nos données, ce qui nous fait perdre une certaine maîtrise. Si on ne veut pas perdre la main sur les données, nous n’avons pas le choix que de maîtriser les outils qui les manipulent. Ensuite, les outils disponibles à l'époque étaient soit très bons pour la visualisation des données, soit très bons pour le traitement des données, mais pas les deux. Pour avoir le meilleur processus, nous aurions dû utiliser plusieurs outils, ce qui aurait augmenté le coût et compliqué le processus. Nous avons donc opté pour un outil plus simple et plus léger qui peut traiter les données de bout en bout.

Camille De Salabert: Ce que j'apprécie dans ce choix, c'est que notre outil est modulable. Nous pouvons le faire évoluer en fonction de nos besoins, ce qui n'aurait pas été possible avec un outil d'un éditeur. C'est un avantage majeur pour nous.

Marmelab : Quels sont les principaux obstacles rencontrés dans le développement du projet LODEX ?

Camille De Salabert : Le projet remonte à plusieurs années et la dette technique du code commence à se faire sentir. Nous avions parfois des lourdeurs qui apparaissaient par exemple lors du chargement de gros corpus de données. Jusqu'à très récemment, nous n’avions pas de technicien dans notre propre équipe capable de résoudre ces problèmes. Ceci donne une certaine pression pour ceux qui participent au projet car une fois la phase de développement terminée nous ne pouvions plus revenir dessus avant plusieurs mois. La souplesse de LODEX nous a toujours permis de trouver des solutions à ces problèmes mais ce n’est pas l’idéal.

Nicolas Thouvenin : Lodex est un outil qui a évolué depuis sa création. Ceci a induit beaucoup de changements dans son usage et donc également dans les interfaces.Ces changements rapides nécessitent un temps d’adaptation pour tous les utilisateurs. Il faut donc prendre en compte le facteur temps en plus du facteur technique.

L'INIST

Marmelab : Comment avez-vous réussi à contourner ces obstacles ?

Nicolas Thouvenin : Pour ce qui est de la complexité du code, nous travaillons à renforcer nos équipes internes afin qu'elles puissent intervenir et faire évoluer le code petit à petit. Nous avons également mis en place des "semaines de maintenance" après la fin des prestations, pour nous donner le temps de tester et d'explorer l'outil de manière plus approfondie.

Camille De Salabert : Ces semaines de maintenance ont été très bénéfiques. Elles nous ont permis de tester l'outil en profondeur, de découvrir des fonctionnalités que nous n'avions pas explorées auparavant, et de résoudre les petits problèmes que nous avons pu manquer.

Marmelab : LODEX est Open-Source. Quelle importance accordez-vous à l'open source à l’Inist CNRS?

Nicolas Thouvenin : Le CNRS a une politique orientée vers la science ouverte, qui vise à faciliter l'accès aux publications. Nous pensons que cette ouverture devrait également s'appliquer aux outils et aux développements informatiques qui soutiennent l’effort de recherche. Nous avons ouvert de nombreux codes sources pour promouvoir la transparence dans le traitement des données. Nos outils sont accessibles à tous et peuvent être réutilisés et audités par quiconque le souhaite.

Marmelab : Quel est votre retour d’expérience de travail avec Marmelab par rapport aux autres prestataires du marché ?

Nicolas Thouvenin : La manière dont nous travaillons avec Marmelab est unique. En effet, c'est la seule entreprise avec laquelle nous fonctionnons avec un facilitateur et une équipe de développeurs dédiés. Nous avons eu d’autres prestataires, avec des modalités différentes et il est assez difficile de comparer les méthodes de travail. Cependant, avec le recul, les prestations avec Marmelab sont celles qui donnent le meilleur résultat, ou du moins le moins de problèmes a postériori.

Camille De Salabert : Je suis d'accord avec cette évaluation. J'apprécie particulièrement votre professionnalisme et votre réactivité.

Did you like this article? Share it!