Data Engineer Spickzettel
Build Pipeline
Abschnitt betitelt „Build Pipeline“jinflow make # Standard-Tenant bauenjinflow make millesime.domaine_zufferey # bestimmten Tenantjinflow make millesime # alle Tenants im Packjinflow make --all # alle Tenants, alle Packsjinflow make --clean # loeschen + von Grund auf neu bauenjinflow make --sync # CSVs von DLZ zuerst kopierenjinflow make --extract # XLSX → CSV → Sync → Buildjinflow make --snapshot post-audit # KLS nach Build einfrierenBuild-Phasen
Abschnitt betitelt „Build-Phasen“| Phase | Was passiert |
|---|---|
| 0a | XLSX → CSV extrahieren (wenn --extract) |
| 0b | DLZ → raw/ synchronisieren (wenn --sync) |
| 1 | CSVs validieren + anreichern |
| 2 | Instrumente kompilieren (Signals, Theses, Verdicts, SMEbits, Reports, Entities, Lineage) |
| 3a | dbt Build: Bronze → Silver → Gold |
| 3b | dbt Build: Signals → Perspectives → Theses → Verdicts → SMEbits |
| 3c | dbt Build: Lineage |
| 3d | dbt Build: Reports |
| 4 | Pipeline Graph, PDF-Berichte, Calibration |
| 5 | Metadaten stempeln, AFS-Archiv backen, SIS erstellen |
Medallion-Ebenen
Abschnitt betitelt „Medallion-Ebenen“| Ebene | Zweck | Materialisierung | Kernprinzip |
|---|---|---|---|
| Bronze | Strukturelle Einnahme | TABLE | Source-System Dispatch, fuegt source_file + row_number hinzu |
| Silver | Domain-Validierung | TABLE | is_valid + invalid_reason auf jeder Zeile |
| Gold | Konsumvertrag | VIEW | Nur is_valid = true, quellsystem-agnostisch |
| Platform | Cross-Tenant | VIEW | UNION ALL mit tenant_id |
Instrumenten-Kompilierung
Abschnitt betitelt „Instrumenten-Kompilierung“# Validieren (YAML gegen Contracts pruefen)python3 scripts/probecheck.pypython3 scripts/hypothesischeck.pypython3 scripts/diagnosischeck.pypython3 scripts/smebitcheck.pypython3 scripts/reportcheck.py
# Kompilieren (YAML → dbt SQL)python3 scripts/probecompile.py # --check fuer Trockenlaufpython3 scripts/hypothesiscompile.pypython3 scripts/diagnosiscompile.pypython3 scripts/smebitcompile.pypython3 scripts/reportcompile.pyTenant-Verwaltung
Abschnitt betitelt „Tenant-Verwaltung“jinflow init --tenant my_analysis --source-system csv # von Grund aufjinflow init --pack millesime --tenant domaine_zufferey --source-system opale # aus Packjinflow clone millesime.domaine_zufferey --name sandbox # Tenant klonenjinflow us millesime.domaine_zufferey # als Standard setzenjinflow ls # alle Tenants auflistenjinflow stat # KLS GesundheitscheckUmgebungsvariablen
Abschnitt betitelt „Umgebungsvariablen“| Variable | Zweck |
|---|---|
JINFLOW_LIVE | Live Root ueberschreiben |
JINFLOW_TENANT | Standard-Tenant ueberschreiben |
JINFLOW_DB_PATH | Expliziter KLS-Pfad (Explorer) |
JINFLOW_AFS_ROOT | AFS Root (Explorer) |
JINFLOW_SYSTEM_DB_PATH | System DB Pfad |
JINFLOW_PACKS_ROOT | Pack Repos Verzeichnis |
ANTHROPIC_API_KEY | Claude API Key (Evolve) |
v0.45.1 · built 2026-04-17 08:14 UTC