Après un an et demi de travaux, l’Inria lance les fondations d’une bibliothèque d’Alexandrie du logiciel open source. Le projet Software Heritage a vocation à rassembler scientifiques, industriels et sponsors du monde entier. Microsoft est le premier grand éditeur à se joindre à l’initiative.
Collecter, organiser, préserver et partager les codes sources de tous les logiciels disponibles publiquement. Tel est l’objet de la plateforme Software Heritage présentée le 30 juin 2016 par l’Inria, dans son siège à Paris. “C’est une sorte de Wikipedia du logiciel open source, explique Antoine Petit, président d’Inria (institut national de recherche en numérique). Nous avons travaillé en catimini sur le projet pendant un an et demi. Nous voulions en démontrer la faisabilité avant de le rendre public aujourd’hui.”
un Outil pour les développeurs de logiciel
Le projet est ambitieux puisqu’il vise à créer, selon son responsable Roberto Di Cosmo, une véritable bibliothèque d’Alexandrie du logiciel open source. “Le logiciel n’est plus juste un outil, justifie-t-il. C’est une connaissance précieuse sur laquelle on construit notre héritage culturel. Ce qui compte c’est le code source traduit ensuite en instructions compréhensibles par la machine. Ce code est conçu pour être compris, travaillé et partagé par l’homme.”
Pour favoriser le partage de codes open source, des plateformes en ligne fleurissent sur internet. “Le problème c’est qu’elles changent au gré de la mode et ont souvent la vie éphémère, déplore Roberto Di Cosmo. Même Google a fini par fermer la sienne. Car l’information numérique est fragile. On peut perdre des logiciels comme en perd des données. On veut éviter tous ces problèmes en créant un dépôt comme pour les archives. Le but n’est pas juste de préserver la mémoire. Nous voulons aussi tracer le code en précisant quand il a été développé, par qui, comment et pourquoi. Car l’objectif est aussi d’utiliser cette plateforme comme outil d’apprentissage pour améliorer le développement du logiciel.”
22,8 millions de projets et 2,7 milliards de fichiers
L’Inria a construit les fondations de cette plateforme. Le site web Software Heritage recense déjà 22,8 millions de projets logiciels et 2,7 milliards de fichiers de codes sources occupant un espace de stockage de 200 téraoctes. Les compteurs sont mis à jour quatre fois par jour. Ceci ne représente que 20% du logiciel libre disponible dans le monde, selon Roberto Di Cosmo. Des outils de recherche, d’importation et de partage seront ajoutés dans six mois.
une fondation qui cherche des partenaires
Antoine Petit lance un appel aux scientifiques, industriel et sponsors du monde entier pour se joindre à l’aventure. L’Inria s’est engagé à consacrer un budget annuel de 500 000 euros sur trois ans. Il appartiendra à une fondation dédiée de prendre ensuite le relais. Microsoft est le premier éditeur à se joindre au projet. L’éditeur héberge gratuitement dans son cloud Azure un miroir (sauvegarde de secours) de la plateforme hébergée à l’Inria.
Avec L’usine Digitale