Zum Inhalt springen

Pipeline-Uebersicht

Wie Quellsystemdaten von Roh-Exporten in einen diagnostizierten, herstelleragnostischen analytischen Datensatz transformiert werden.


Jede Organisation verwaltet ihre operativen Daten durch ein oder mehrere Quellsysteme — ERP-Plattformen, branchenspezifische Software oder benutzerdefinierte Tools. Von Domain Packs unterstuetzte Quellsysteme umfassen Skidata, CargoWise, SAP MM, Navision und viele mehr.

Die Organisation exportiert ihre Daten als Dateiensatz — typischerweise Excel-Arbeitsmappen oder CSV-Dateien. Diese Dateien sind die rohe Wahrheit. Sie enthalten alles — aber sie sind unordentlich, herstellerspezifisch und nicht analysebereit.


2. Konvertierung: Vom Herstellerformat zu kanonischen CSVs

Abschnitt betitelt „2. Konvertierung: Vom Herstellerformat zu kanonischen CSVs“

Der erste Schritt ist, den Quellsystem-Export in ein standardisiertes CSV-Format zu bringen. Hier lebt das herstellerspezifische Wissen.


3. Die Medallion-Architektur: Bronze → Silver → Gold

Abschnitt betitelt „3. Die Medallion-Architektur: Bronze → Silver → Gold“

Was es tut: Liest jede CSV-Datei genau wie sie ist in die Datenbank. Keine Transformation, kein Filtern, kein Urteilen.

Was es hinzufuegt: source_file und row_number fuer Rueckverfolgbarkeit.

Source-System Dispatch: Nur hier erscheinen herstellerspezifische Spaltennamen. Ab Bronze aufwaerts ist das Datenmodell vollstaendig quellsystem-agnostisch.

Was es tut: Nimmt jede Bronze-Tabelle und wendet Domain-Wissen an — Bereinigung, Typkonvertierung, Validierung.

Das Designprinzip: kein stilles Filtern. Silver verwirft nie eine Zeile. Jede Zeile bekommt is_valid und invalid_reason.

Was es tut: Filtert Silver auf nur gueltige Zeilen. Das ist der finale, vertrauenswuerdige Datensatz — der Produktvertrag.

Die Gold-Ebene ist formal versioniert durch einen Contract (gold_contract.v1.json).


Die Pipeline transformiert nicht nur Daten — sie misst ihre eigene Qualitaet auf jeder Stufe (Silver Quality Metrics, Gold Quality Metrics, Reconciliation).


5. Multi-Tenant und organisationsuebergreifende Analytik

Abschnitt betitelt „5. Multi-Tenant und organisationsuebergreifende Analytik“

Jeder Tenant bekommt sein eigenes isoliertes Schema in der Datenbank. Die Platform-Ebene sitzt ueber allen Tenants und erstellt Union-Views ueber Organisationen.


Signals sind automatisierte diagnostische Abfragen, die den Datensatz nach Anomalien, Ineffizienzen und potenziellen finanziellen Risiken durchsuchen.

Jedes Signal:

  1. Operiert ausschliesslich auf Gold Entities
  2. Sucht nach einem bestimmten Muster oder einer Anomalie
  3. Produziert standardisierte Findings

Jedes Signal gibt Zeilen mit derselben Struktur aus: finding_id, tenant_id, probe_id, severity, entity_type, entity_id, time_bucket, money_at_risk, evidence.


Geplante Verbesserungen: automatisierte Einnahme, inkrementelle Loads, temporale Gueltigkeit von Referenzdaten und zusaetzliche Signal-Typen.

Siehe die englische Referenz fuer die vollstaendige Dokumentation mit allen Detailtabellen.

jazzisnow jinflow is a jazzisnow product
v0.45.1 · built 2026-04-17 08:14 UTC