Skip to content

Refactor: clarifie un peu tout ce qui concerne les noms de colonnes

Ronan Amicel requested to merge dataset-source-columns into main

Contexte

On manipule différentes sortes de noms de colonne dans insitu, sans que ce soit toujours très clair de quoi on parle.

Par exemple :

  • le nom de colonne brut fourni dans la définition YML (p. ex. source: "T{quarter} {year}")
  • le nom de colonne attendu dans le fichier importé, après interpolation (p. ex. T1 2023)
  • le nom de colonne en base :
    • soit c’est le nom fourni dans la définition YML (p. ex. insitu: db: toto)
    • soit (et seulement pour une définition frictionless), c’est un nom généré (p. ex. t1_2023)

Contenu

On expose les propriétés ou méthodes suivantes sur la classe Dataset :

  • raw_source_columns : les noms de colonnes bruts tels que fournis dans la définition YML (avant substitution)
  • interpolated_source_columns() : les noms de colonnes après interpolation
  • db_columns : les noms et types des colonnes en base
Edited by Ronan Amicel

Merge request reports