Skip to content

Refactor: clarifie un peu tout ce qui concerne les noms de colonnes

Contexte

On manipule différentes sortes de noms de colonne dans insitu, sans que ce soit toujours très clair de quoi on parle.

Par exemple :

  • le nom de colonne brut fourni dans la définition YML (p. ex. source: "T{quarter} {year}")
  • le nom de colonne attendu dans le fichier importé, après interpolation (p. ex. T1 2023)
  • le nom de colonne en base :
    • soit c’est le nom fourni dans la définition YML (p. ex. insitu: db: toto)
    • soit (et seulement pour une définition frictionless), c’est un nom généré (p. ex. t1_2023)

Contenu

On expose les propriétés ou méthodes suivantes sur la classe Dataset :

  • raw_source_columns : les noms de colonnes bruts tels que fournis dans la définition YML (avant substitution)
  • interpolated_source_columns() : les noms de colonnes après interpolation
  • db_columns : les noms et types des colonnes en base
Edited by Ronan Amicel

Merge request reports

Loading