Permettre de pointer explicitement vers une définition de jeu de données lors de l'import
Besoin
Dans le contexte de flux de données encore assez peu propre et peu matures, ça serait vraiment utile de pouvoir choisir une config de jeu de données spécifique lors de l'import d'un fichier même si le nom du fichier ne match pas.
Deux cas d'usages principaux à ce stade :
- quand on développe dans
insitu
, pouvoir tester plus facilement sans avoir à renommer les fichiers ou a modifier la config d'un jeu de données - quand on aura avancé sur l'interface utilisateur d'
insitu
, permettre aux utilisateurs de choisir explicitement dans l'interface à quel config se rattache un fichier de données qu'ils cherchent à importer.
Proposition d'implémentation
- Rajouter un paramètre
--importer
à la commandeinsitu import
qui va écraser le comportement par défaut qui consiste à faire matcher le nom du fichier sur des regex pour trouver quel importeur(s) utiliser - Pas sûr qu'il soit utile d'implémenter
--importers
, il suffit de faire tourner la commande plusieurs fois si on veut utiliser plusieurs importers - Dans le cas ou on extrait des données du nom de fichier (ex:
mon_fichier_(?P<trimestre>T\d)_(?P<annee>\d{4}).csv
), permettre de passer ces infos à insitu directement en cli (par exemple,insitu import --importer mon_fichier --params '{"trimestre": 4, "annee": 2022}'
Edited by Vincent Viers