Ebook: Een Datawarehouse Opzetten van A tot Z
De volledige praktische handleiding voor data engineers — 10 hoofdstukken, codevoorbeelden en een complete case study. Gratis online te lezen.
Over dit ebook
Een Datawarehouse Opzetten van A tot Z
Praktische handleiding voor data engineers
Dit ebook neemt je mee op een complete reis door de wereld van datawarehousing. Van basisconcepten tot geavanceerde technieken — alles wordt behandeld met praktische voorbeelden, codefragmenten en best practices.
Inclusief: dimensionaal modelleren, ETL/ELT, Kimball vs. Inmon vs. Data Vault, cloud platforms (Snowflake, BigQuery, Redshift, Synapse), performance tuning en monitoring.
Inhoudsopgave
-
1
Inleiding tot Datawarehousing
Basisconcepten, historie, OLTP vs OLAP en waarom je een datawarehouse nodig hebt.
-
2
Architectuurprincipes en -patronen
Kimball, Inmon en Data Vault vergeleken — wanneer kies je welk patroon?
-
3
Requirements en Ontwerp
Functionele en niet-functionele requirements omzetten naar een technisch ontwerp.
-
4
Data Extract, Transform, Load (ETL)
ETL vs ELT, idempotente loads, incremental processing en orkestratie.
-
5
Data Modelling Technieken
Star schema, snowflake, dimensionaal modelleren en slowly changing dimensions.
-
6
Data Kwaliteit en Governance
Data contracts, lineage, profilering en governance frameworks die werken.
-
7
Cloud Datawarehouses
Snowflake, BigQuery, Redshift en Azure Synapse / Fabric — diepe vergelijking.
-
8
Performance Tuning en Optimalisatie
Partitioning, clustering, query plans en kostenoptimalisatie in de cloud.
-
9
Monitoring en Onderhoud
Observability, SLI's/SLO's, alerting en data freshness monitoring.
-
10
Case Study: Volledige Implementatie
Een retailbedrijf van 0 naar productie — alle concepten in de praktijk.
Wat je leert
Datawarehouse Architectuur
Begrijp de drie grote stromingen — Kimball, Inmon en Data Vault — en weet wanneer welk patroon werkt.
Praktische Implementatie
SQL- en Python-codevoorbeelden voor ETL, dimensies, fact tables, SCD type 2 en idempotente loads.
Cloud Platforms
Diepe vergelijking van Snowflake, BigQuery, Redshift en Azure Synapse / Microsoft Fabric.
Performance & Kosten
Partitioning, clustering, materialized views en kostencontrole in pay-per-query modellen.
Voor wie is dit ebook?
Voor beginnende data engineers, data analysts die willen doorgroeien, BI-developers die naar moderne stacks migreren, en IT-professionals die verantwoordelijk zijn voor data-oplossingen. Geen voorkennis vereist — we bouwen vanaf de basis op.
Klaar om te beginnen?
Het volledige ebook is gratis online te lezen. Geen registratie, geen e-mail, geen drempels.
Start met hoofdstuk 1