Data Engineering Mastery
Ontwikkel de skills die nodig zijn voor moderne data engineering - van SQL fundamentals tot geavanceerde cloud data platformen
Jouw Voortgang
25% VoltooidJe hebt 2 van de 8 modules voltooid. Ga zo door!
SQL Fundamentals
- SELECT statements en WHERE clauses
- JOINs (INNER, LEFT, RIGHT)
- Aggregaties en GROUP BY
- Subqueries en CTEs
- Window functions
ETL/ELT Processen
- ETL vs ELT concepten
- Data extraction technieken
- Transformatie logica
- Loading strategieën
- Incremental loading
Data Modeling
- Relationeel vs Dimensional modeling
- Star schema vs Snowflake
- Normalisatie vs Denormalisatie
- Data Vault 2.0
- Slowly Changing Dimensions
Cloud Data Platforms
- Databricks Fundamentals
- Snowflake Deep Dive
- Microsoft Fabric
- AWS Data Services
- Azure Data Factory
Data Modeling: Star Schema vs Snowflake
Wat is een Star Schema?
Een star schema is een data modeling techniek die wordt gebruikt in data warehouses. Het bestaat uit één centrale fact table en meerdere dimension tables die hiernaar verwijzen.
Key Concept
Star schema is geoptimaliseerd voor query performance door denormalisatie, terwijl snowflake schema normaliseert voor data redundancy.
Star Schema Voorbeeld:
-- Fact Table: Sales
CREATE TABLE fact_sales (
sale_id INT PRIMARY KEY,
date_id INT,
product_id INT,
customer_id INT,
store_id INT,
quantity_sold INT,
sale_amount DECIMAL(10,2),
FOREIGN KEY (date_id) REFERENCES dim_date(date_id),
FOREIGN KEY (product_id) REFERENCES dim_product(product_id),
FOREIGN KEY (customer_id) REFERENCES dim_customer(customer_id),
FOREIGN KEY (store_id) REFERENCES dim_store(store_id)
);
-- Dimension Table: Product (denormalized)
CREATE TABLE dim_product (
product_id INT PRIMARY KEY,
product_name VARCHAR(100),
category_name VARCHAR(50),
brand_name VARCHAR(50),
supplier_name VARCHAR(100)
);
Snowflake Schema Voorbeeld:
-- Dimension Table: Product (normalized - snowflake)
CREATE TABLE dim_product (
product_id INT PRIMARY KEY,
product_name VARCHAR(100),
category_id INT,
brand_id INT,
supplier_id INT,
FOREIGN KEY (category_id) REFERENCES dim_category(category_id),
FOREIGN KEY (brand_id) REFERENCES dim_brand(brand_id),
FOREIGN KEY (supplier_id) REFERENCES dim_supplier(supplier_id)
);
-- Additional normalized dimension tables
CREATE TABLE dim_category (
category_id INT PRIMARY KEY,
category_name VARCHAR(50),
department_name VARCHAR(50)
);
CREATE TABLE dim_brand (
brand_id INT PRIMARY KEY,
brand_name VARCHAR(50)
);
Oefening: Schema Design
Scenario: Je werkt aan een e-commerce data warehouse. Ontwerp een star schema voor sales analytics met de volgende requirements:
- Track daily sales per product, customer, and sales channel
- Include product categories and subcategories
- Track customer demographics and location
- Monitor promotional campaign performance
Opdracht: Identificeer de fact table, dimension tables, en bepaal of je star of snowflake schema gebruikt.
Wanneer gebruik je welk schema?
| Scenario | Aanbevolen Schema | Reden |
|---|---|---|
| High-performance reporting | Star Schema | Minder JOINs, betere performance |
| Complex business hierarchies | Snowflake Schema | Betere normalisatie voor complexe relaties |
| Data governance requirements | Snowflake Schema | Consistente dimension data |
Learning Resources
Jouw Learning Journey
Je bent goed op weg! Na het voltooien van de Data Engineering path heb je de skills voor roles zoals:
- Data Engineer - €45.000-€75.000
- ETL Developer - €40.000-€65.000
- Data Warehouse Specialist - €50.000-€80.000
- Cloud Data Engineer - €55.000-€85.000
Bekijk onze vacature pagina voor actuele data engineering banen!