Nubonyxia

Sécuriser et faciliter l'intelligence des données économiques et financières sensibles

  • Finance

  • Promotion 6

Secrétariat général des ministères économiques et financiers

Paris (75)

Data engineering, Data science

L’équipe

L’administration porteuse

Bercy Hub, l’incubateur des startups d’État issues des directions de Bercy

Rattaché aux services du numérique des ministères de l’Économie, des Finances et de la Relance, Bercy Hub est responsable de l’administration ministérielle des données et de l’incubation des startups d’État issues de Bercy. Sa feuille de route distingue trois axes : développer le capital humain, œuvrer pour la mise à disposition d’un catalogue de données techniques partagé au sein des directions de Bercy et valoriser la donnée.

Le défi aujourd’hui

La problématique identifiée

Beaucoup de data scientists de l’état ne disposent pas des outils adaptés pour valoriser des données sensibles

Lorsqu’il s’agit de données sensibles (telles que les données fiscales, les décisions de justice ou les archives de cabinet), la valorisation de ces données (data visualisation, algorithmes) par les agent(e)s est freinée voire bloquée pour des raisons de sécurité. Beaucoup de data scientists au sein de l’État n’ont pas d’outils de travail adaptés et ont recours à des ordinateurs hors inventaires et réseaux de l’administration sur lesquels elles et ils peuvent installer les outils nécessaires pour travailler. Un certain nombre utilise des solutions d’échanges de fichiers plus ou moins sécurisées (clés USB, disques durs, transfert numérique).

Les besoins confirmés

L’absence d’infrastructure actuelle est un frein à l’innovation

Les entretiens utilisateurs avec des ingénieur(e)s en sciences de la donnée ont fait émerger plusieurs besoins : mise à disposition d’outils de travail (logiciels, langages de programmation, librairies), ressources de calcul pour accélérer des traitements et/ou manipuler de larges volumes de données et avoir la possibilité de déployer des applications pour permettre des aller-retours plus rapides avec les métiers.

Le concept expérimenté

Une plateforme mutualisée et sécurisée de services de data science à la demande

Pour les data scientists de l’État, qui ont besoin d’outils de travail et de pouvoir manipuler de la donnée à caractère confidentiel avec un niveau de sécurité adapté, Nubonyxia est une plateforme Cloud de services de Data Science, offrant un environnement de travail numérique intégré dans un navigateur accessible par un réseau souverain séparé d’Internet. Le produit intègre Onyxia porté par l’INSEE (interface utilisateur open source de services data science lançables à la demande) et Nubo porté par la DGFIP (un des deux clouds souverrains de l’État).

Plus d’informations

Comment contribuer au projet ?

Aux origines du défi

La problématique pressentie

La collaboration entre les ingénieur(e)s des sciences de la donnée et les métiers est freinée par l’absence d’une plateforme sécurisée pour traiter des données sensibles

Lorsqu’il s’agit de données sensibles (impôts, décisions de justice, archives de cabinet, etc.), il n’est pas permis aux métiers de Bercy de faire de la datavisualisation ou de lancer des algorithmes via des solutions classiques. De plus, les cycles de vie des projets sortis de l’incubateur sont silotés du fait de l’absence d’une plateforme unifiée de services techniques. Cela génère une multitude de stacks techniques qu’il faut ensuite maintenir avec des compétences spécifiques. Ces irritants se matérialisent par des développements ralentis sans possibilité de passage à l’échelle, une accumulation de la dette technique, etc.

L’hypothèse à vérifier

Une plateforme de services techniques sécurisée permettrait une meilleure collaboration entre les ingénieur(e)s des sciences de la donnée et les métiers

Le défi pourra s’inspirer de solutions similaires existantes. D’abord, la technologie Onyxia utilisée par l’INSEE, qui permet de rendre exploitable par des data scientists des données issues de différents référentiels. Ensuite, par l’utilisation plus massive de l’offre de services cloud Nubo de la DGFiP destinée à accueillir des services, données et traitements sensibles de l’État. Enfin, des travaux sont en cours à la DGFiP pour utiliser un « pipeline » de déploiement continu.

Les ambitions du projet

Sécuriser et faciliter l’intelligence des données économiques et financières sensibles

Impulser l’émergence d’une filière technique data et data science au sein des MEFR afin de mettre à disposition des data-scientists de Bercy une plateforme open source intégrée exposant des briques IA réutilisables et faciles à maintenir. Parallèlement, cette levée des freins à l’accès aux infrastructures et plateformes devrait simplifier les taches des acteurs impliqués. Le portail cible partagé devra permettre aux ingénieur(e)s de la donnée de mettre leurs algorithmes et codes à disposition des métiers et ces derniers pourront traiter et enrichir ces données sensibles de façon plus autonome.