Wat is SAP Datasphere?
Definitie: SAP Datasphere
SAP Datasphere (voorheen SAP Data Warehouse Cloud) is een volledig beheerd, cloud-native dataplatform van SAP. Het combineert een data warehouse, data lake, data-integratie, datafederatie en een business-semantieklaag in één dienst. Het draait op SAP Business Technology Platform (BTP) en is beschikbaar op AWS, Azure en Google Cloud.
Gelanceerd in 2023 als opvolger van SAP Data Warehouse Cloud, is Datasphere ontworpen voor organisaties die SAP ERP-systemen draaien (S/4HANA, ECC, BW) en die data willen combineren met andere bronnen in een beheerde, moderne cloudomgeving — zonder hun SAP-investering los te laten.
De kernbelofte: verbind met alles, modelleer met SAP-semantiek, en stel beheerde data beschikbaar voor SAP Analytics Cloud en andere BI-tools. Het is meer dan zomaar een cloud warehouse. Het is SAP's poging om de volledige data supply chain — van bron tot dashboard — een eersteklas SAP-ervaring te maken.
Architectuuroverzicht
Datasphere is georganiseerd rond vier architectuurpijlers die samenwerken:
- Data Spaces — geïsoleerde, beheerde werkruimten per team of domein
- Data Builder — de laag voor datamodellering en integratie
- Business Builder — de semantische businesslaag
- Data Catalog — enterprise-brede data-ontdekking en lineage
Onder deze lagen bevinden zich twee opslaglagen: een beheerde SAP HANA Cloud-instantie (de hete laag voor krachtige SQL) en een beheerde objectopslag (de koude/lake-laag, compatibel met Delta Lake en Apache Parquet). Beide lagen zijn volledig geabstraheerd van de gebruiker — je werkt ermee via de Datasphere-UI of SQL.
Architectuurinzicht
Datasphere draait bovenop SAP HANA Cloud, waardoor het de column-store engine, in-memory verwerking en multimodel-mogelijkheden van HANA erft (relationeel + document + graph). Dit geeft Datasphere een prestatievoordeel voor SAP-native analytics — maar het betekent ook dat het platform HANA-centrisch is in zijn kern.
Data Spaces: De Beheereenheden
Een Data Space is de fundamentele eenheid van organisatie en beheer in Datasphere. Zie het als een afdelingsniveau sandbox met eigen:
- Opslagtoewijzing (schijfquotum)
- Rekenkrachttoewijzing (geheugenquotum)
- Leden en rollen (Space Administrator, Modeler, Viewer)
- Verbindingen met bronsystemen
- Data-assets (tabellen, views, flows, modellen)
Spaces communiceren met elkaar via Cross-Space Sharing: een Space kan een view of tabel delen met een andere Space, maar de ontvangende Space kan het originele asset niet wijzigen. Dit dwingt data-product-denken af — elke space bezit en publiceert zijn data, terwijl andere teams die als alleen-lezen product consumeren.
Dit model sluit goed aan op Data Mesh-principes: gedistribueerd eigenaarschap, domeingedreven ontwerp en beheerd delen — allemaal binnen één beheerd platform in plaats van aparte infrastructuur per domein.
Praktijkvoorbeeld: Space-structuur voor een retailbedrijf
- FINANCE Space — bezit boekingen, kostenplaatsdata (bron: S/4HANA Finance)
- SALES Space — bezit verkooporders, prijscondities (bron: S/4HANA SD)
- SUPPLY_CHAIN Space — bezit voorraad, leveringsdata (bron: SAP EWM)
- CENTRAL_REPORTING Space — consumeert gedeelde views van de drie bovenstaande spaces en bouwt cross-domein KPI's voor SAP Analytics Cloud
Data Builder: Modellering en Integratie
De Data Builder is de plek waar je data modelleert, transformeert en integreert. Hij biedt meerdere objecttypen:
Lokale tabellen
Persistente tabellen opgeslagen in de HANA Cloud of objectopslaglaag. Je ontwerpt het schema in de grafische tabeleditor of importeert een CSV. Lokale tabellen zijn de basis van je dataopslag.
Views
SQL-views of grafische views bovenop lokale tabellen, remote-tabellen of andere views. De grafische editor laat je joinen, filteren, aggregeren en berekende kolommen toevoegen zonder SQL te schrijven — maar je kunt altijd overschakelen naar SQL-modus voor volledige controle.
-- Voorbeeld: SQL-view die verkooporders combineert met productmaster uit twee spaces SELECT so.SalesOrderID, so.CustomerID, so.NetValue, so.Currency, pm.ProductDescription, pm.ProductCategory FROM "SALES"."SalesOrders" so JOIN "CENTRAL_REPORTING"."ProductMaster" pm ON so.MaterialNumber = pm.MaterialNumber WHERE so.DocumentDate >= '2026-01-01'
Analytische modellen
Analytische modellen zijn de brug tussen de Data Builder en SAP Analytics Cloud. Ze stellen maten, dimensies, hiërarchieën en variabelen beschikbaar in een formaat dat SAP Analytics Cloud (SAC) stories natively consumeren.
Entity-Relationship (ER) modellen
Een canvas voor het documenteren van relaties tussen tabellen en views — nuttig voor het begrijpen en communiceren van datamodelstructuur tussen teams.
Data Flows
Grafische ETL-pipelines voor het laden en transformeren van data. Data Flows ondersteunen joins, aggregaties, projecties en schrijfdoelen (lokale tabellen). Ze draaien in een Spark-achtige uitvoeringsomgeving binnen Datasphere. Voor eenvoudige laadscenario's vervangen Data Flows de behoefte aan externe ETL-tools.
Replicatieflows
Specifiek bedoeld voor real-time of geplande replicatie vanuit SAP-bronnen (S/4HANA, BW, ECC) naar Datasphere-lokale tabellen of de objectopslag. Replicatieflows gebruiken Change Data Capture (CDC) waar beschikbaar — alleen gewijzigde records worden na de initiële lading gerepliceerd, niet de volledige tabel elke keer.
Waarom replicatieflows belangrijk zijn
Replicatieflows zijn de snelste en betrouwbaarste manier om SAP-transactionele data in Datasphere te krijgen. Ze verwerken delta-ladingen, schema-evolutie en partitionering automatisch. Voor S/4HANA-bronnen gebruiken ze SLT (SAP Landscape Transformation) of de SAP HANA Smart Data Integration (SDI)-adapter voor near-realtime CDC.
Transformatieflows
Krachtiger dan Data Flows voor complexe meerstaps-transformaties. Transformatieflows voeren SQL-scripts in volgorde uit en ondersteunen loops, variabelen en foutafhandeling. Ze zijn vergelijkbaar met opgeslagen procedures geörkestreerd als een pipeline.
Business Builder: De Semantische Laag
De Business Builder is een van de meest onderscheidende kenmerken van Datasphere ten opzichte van generieke cloud warehouses. Het stelt businessgebruikers en analisten in staat om businessentiteiten, metrics en dimensies te definiëren in businesstaal — zonder SQL te schrijven.
Businessentiteiten
Een businessentiteit is gekoppeld aan een fysieke view of tabel, maar voegt semantische context toe: labels, beschrijvingen, synoniemen en datacategorie (feit, dimensie, tekst). Businessentiteiten zijn de "zelfstandige naamwoorden" van je datamodel — Klant, Product, Verkooporder.
Feitmodellen en consumptiemodellen
Een Feitmodel verbindt een feitentiteit met zijn dimensieassociaties. Een Consumptiemodel stelt een set feitmodellen beschikbaar als een uniform queryvlak voor SAP Analytics Cloud. Gebruikers die stories bouwen in SAC navigeren de maten en dimensies van het consumptiemodel — ze zien nooit ruwe tabelnamen.
KPI's en metrics
De Business Builder ondersteunt het definiëren van herbruikbare KPI-definities met doelen, drempelwaarden en trendindicatoren. Deze KPI's voeden direct de KPI-dashboardfuncties van SAP Analytics Cloud — geen handmatige installatie in de BI-laag vereist.
Dit is de laag die SAP BW-veteranen het meest zullen herkennen. In BW dienden InfoObjects, InfoCubes en Queries hetzelfde doel. In Datasphere is de equivalente stapel: Lokale tabel → View → Businessentiteit → Consumptiemodel → SAC Story.
Federatie: Data Opvragen Zonder Verplaatsen
Datafederatie is een kernfunctie die Datasphere onderscheidt van veel cloud warehouses. In plaats van data naar Datasphere te kopiëren, maak je een Remote Table die wijst naar een tabel in een extern systeem. Wanneer een view of model die remote tabel opvraagt, stuurt Datasphere de query door naar de bron en geeft het resultaat terug — de data verlaat het bronsysteem niet.
Ondersteunde externe bronnen zijn:
- SAP-systemen: S/4HANA, BW, ECC, SAP HANA on-premise
- Cloud warehouses: Snowflake, Google BigQuery, Amazon Redshift, Azure Synapse
- Databases: SQL Server, Oracle, PostgreSQL, MySQL, IBM Db2
- Cloudopslag: Amazon S3, Azure Data Lake Storage, Google Cloud Storage
- SaaS-applicaties: Salesforce, SAP SuccessFactors, SAP Ariba
Remote Table vs Gerepliceerde tabel
Een Remote Table (gefedereerd) vraagt de bron live op — altijd actueel, nul opslagkosten, maar queryprestaties zijn afhankelijk van de bron. Een Gerepliceerde tabel kopieert de data naar Datasphere-lokale opslag — snellere queries, iets verouderd (op basis van replicatieplanning), verbruikt je opslagquotum. Je kunt tussen de twee modi wisselen op hetzelfde object.
Federatie is bijzonder krachtig voor SAP-naar-niet-SAP-joins: je kunt live S/4HANA-verkooporders (remote, gefedereerd) joinen met een gerepliceerde Salesforce-opportuniteitentabel in één SQL-view binnen Datasphere, zonder een tussenliggende ETL-taak.
Open SQL Schema: Je Eigen Tools Meenemen
Een Open SQL Schema is een speciaal schema binnen een Datasphere-Space dat externe tools direct kunnen benaderen via een standaard ODBC/JDBC-verbinding. Dit betekent dat je:
- Data in Datasphere kunt schrijven vanuit Python, dbt of Spark
- Datasphere-tabellen kunt opvragen vanuit elke SQL-client (DBeaver, DataGrip, Tableau)
- dbt-modellen kunt uitvoeren tegen Datasphere als SQL-engine
- Derde-partij ETL-tools (Fivetran, Matillion, Informatica) kunt gebruiken om data te laden
# dbt-profiel voor SAP Datasphere via Open SQL Schema (HANA adapter)
datasphere_project:
target: prod
outputs:
prod:
type: hana
driver: hdbcli
host: <datasphere-host>.hanacloud.ondemand.com
port: 443
user: <technical_user>
password: <password>
schema: OPEN_SQL_SCHEMA_NAAM
threads: 4
Het Open SQL Schema overbrugt de kloof tussen de SAP-beheerde wereld en het open-source data-engineering-ecosysteem. Zo kunnen teams die dbt of Python gebruiken voor transformaties, resultaten toch opslaan in Datasphere en ze laten beheren door Spaces en de Business Builder.
Data Catalog: Enterprise Data-ontdekking
De Data Catalog is de enterprise-metadatalaag over alle Spaces en verbonden bronnen. Hij biedt:
- Zoeken — vind tabellen, views en businessentiteiten op naam of businessterm
- Lineage — traceer data van een dashboard-KPI terug naar de bronsysteemtabel
- Impactanalyse — zie welke downstream-consumenten worden beïnvloed voordat je een brontabel wijzigt
- Business Glossary — definieer businesstermen en koppel ze aan technische assets
- Datakwaliteit — koppel kwaliteitsregels en scores aan assets
De Catalog is bijzonder waardevol in grote organisaties met tientallen Spaces. Zonder hem wordt het ontdekken van wie welke data bezit en hoe die stroomt bijna onmogelijk op schaal.
SAP Analytics Cloud: De Native BI-laag
SAP Analytics Cloud (SAC) is de natuurlijke BI-consument van Datasphere. De integratie is nauw en eersteklas:
- SAC verbindt live met Datasphere analytische modellen en consumptiemodellen — geen data-export vereist
- SAC-stories consumeren hiërarchieën, KPI's en variabelen die zijn gedefinieerd in de Business Builder
- Planningsmodellen in SAC kunnen terugschrijven naar Datasphere-lokale tabellen (vergelijking werkelijk vs plan)
- Single sign-on en uniform beheer over de SAP BTP-tenant
Voor organisaties die al gelicenseerd zijn voor SAC, is de Datasphere + SAC-stack een coherente vervanging voor de klassieke SAP BW + BEx Query + Analysis for Office-opzet — cloud-native, geen ABAP-ontwikkeling vereist en aanzienlijk sneller te implementeren.
Datasphere stelt ook standaard OData- en SQL-endpoints beschikbaar, dus Power BI, Tableau en Looker kunnen er ook mee verbinden — je bent niet gebonden aan SAC als enige BI-tool.
SAP Datasphere vs. Snowflake, Databricks en Azure Synapse
| Dimensie | SAP Datasphere | Snowflake | Databricks | Azure Synapse |
|---|---|---|---|---|
| Primaire kracht | SAP-ecosysteemintegratie + semantische laag | Multi-cloud SQL warehouse, datadeling | Lakehouse, ML/AI, open formaten | Azure-native, hybride analytics |
| SAP-bronconnectoren | Native (S/4HANA, BW, ECC via CDC) | Via derde partij (Fivetran, Qlik) | Via derde partij (ADF, Fivetran) | Via Azure Data Factory |
| Business-semantieklaag | Ingebouwd (Business Builder) | Geen native (gebruik dbt semantic layer) | Unity Catalog + dbt / AtScale | Geen native |
| Datafederatie | Sterk (100+ connectoren, live query) | Iceberg externe tabellen, beperkt live | Unity Catalog foreign catalogs | PolyBase / Synapse Link |
| ML / AI-workloads | Beperkt (via SAP AI Core-integratie) | Snowflake ML Functions, Cortex | Volledig: MLflow, AutoML, GPU-clusters | Azure ML-integratie |
| Open-formaatondersteuning | Delta Lake, Parquet (lake-laag) | Apache Iceberg | Delta Lake (native) | Parquet, Delta, Iceberg |
| Prijsmodel | Capaciteitseenheden (opslag + rekenkracht gebundeld) | Credits (rekenkracht) + opslag apart | DBU's (rekenkracht) + cloudopslag | DWU's + vCores + opslag |
| Beste voor | SAP-zware organisaties | Multi-cloud SQL, datadeling | Data engineering, ML, open data | Azure-native, Microsoft-omgevingen |
Het eerlijke oordeel: Datasphere probeert Snowflake of Databricks niet te verslaan op hun eigen terrein. Het richt zich op een specifieke sweet spot — organisaties die SAP op schaal draaien en een beheerde, geïntegreerde analyticslaag willen zonder zelf connectoren en semantische lagen te bouwen. Voor niet-SAP-organisaties zijn Snowflake of Databricks bijna altijd een betere keuze.
Migreren van SAP BW naar Datasphere
SAP BW (BW/4HANA of klassiek BW op HANA)-veteranen herkennen sommige concepten in Datasphere, maar de migratie is geen 1:1 lift-and-shift. Hier is hoe de conceptuele mapping werkt:
| SAP BW-object | Datasphere-equivalent |
|---|---|
| InfoObject (Kenmerk) | Businessentiteit (Dimensie) |
| InfoObject (Kengetall) | Maat in analytisch model |
| InfoCube / CompositeProvider | View + Analytisch model |
| DataStore Object (DSO) | Lokale tabel (met delta merge) |
| BEx Query | Consumptiemodel |
| Process Chain | Data Flow / Task Chain |
| Transformatie (BW) | Transformatieflow |
| SAP BW InfoProvider | Analytisch model |
SAP biedt een BW Bridge-functie binnen Datasphere waarmee je BW/4HANA-objecten native kunt uitvoeren — zodat je niet alles op dag één hoeft te migreren. Je kunt BW-objecten geleidelijk omzetten naar native Datasphere-objecten in je eigen tempo, terwijl BW-afhankelijke processen blijven draaien.
Aanbevolen migratiestrategie
Begin met Replicatieflows om brondata in Datasphere-lokale tabellen te brengen. Herbouw je meest gebruikte BEx Queries als consumptiemodellen. Gebruik de BW Bridge voor complexe transformaties die nog actief worden onderhouden in BW. Ontmantel BW-objecten geleidelijk naarmate je ze native herbouwt. Probeer niet alles tegelijk te migreren.
Wanneer Is SAP Datasphere de Juiste Keuze?
Datasphere past goed als...
- Je organisatie SAP S/4HANA, ECC of BW draait en die data wil combineren met andere bronnen
- Je near-realtime CDC-replicatie vanuit SAP-systemen nodig hebt zonder zelf pipelines te bouwen
- Je BI-team SAP Analytics Cloud gebruikt en een beheerde semantieklaag wil zonder ABAP
- Je op weg bent van BW naar de cloud en een migratiemodus wilt
- Je datafederatie nodig hebt over veel bronnen zonder alle data te centraliseren
- Compliance vereist dat bepaalde data on-premise blijft — federatie laat je die opvragen zonder te verplaatsen
Kijk elders als...
- Je geen SAP-systemen hebt — de belangrijkste meerwaarde verdwijnt
- Je zware ML/AI- en Python-workloads nodig hebt — Databricks is dan beter
- Je maximale SQL-prestaties op schaal wilt over niet-SAP-data — Snowflake of BigQuery zijn sterker
- Je open-source ecosysteem-tooling als eersteklas burger wilt (Airflow, Spark, Delta, dbt) — Databricks Lakehouse wint hier
- Je budget beperkt is — Datasphere's SAP-licentiemodel kan duur zijn voor kleinere organisaties
Aan de slag met SAP Datasphere
SAP biedt een gratis proefversie van Datasphere op SAP BTP. Dit is het aanbevolen pad om snel waarde te krijgen:
- Maak een Space aan — definieer de beheergrens van je team en wijs rollen toe
- Stel een verbinding in — verbind met je S/4HANA-sandbox, een Snowflake-proefversie of upload een CSV
- Maak een Remote Table of lokale tabel — breng een kleine dataset binnen (bijv. verkooporders)
- Bouw een view — join twee tabellen grafisch of met SQL
- Maak een analytisch model — definieer maten en dimensies op je view
- Verbind SAC — bouw een story op het analytische model en verken de data
De grafische, no-code interface maakt het mogelijk dit in minder dan een uur te voltooien zonder SQL aan te raken. Die lage instapdrempel is bewust — Datasphere is ontworpen voor zowel data engineers als businessanalisten.
SQL-toegang voor power users
-- Bevraag Datasphere vanuit elke SQL-client via het Open SQL Schema -- Verbinding: HANA ODBC naar <tenant>.hanacloud.ondemand.com:443 SELECT YEAR(OrderDate) AS Besteljaar, ProductCategory AS Productcategorie, SUM(NetAmount) AS TotaleOmzet, COUNT(DISTINCT SalesDocumentNumber) AS AantalOrders FROM "SALES_SPACE"."V_VerkoopordersVerrijkt" GROUP BY YEAR(OrderDate), ProductCategory ORDER BY Besteljaar DESC, TotaleOmzet DESC
Sterke punten en bekende beperkingen
Sterke punten
- Diepe SAP-integratie — CDC-replicatie vanuit S/4HANA en BW is beste-in-klasse
- Business-semantieklaag — Business Builder sluit de kloof tussen IT en businessgebruikers
- Federatie first — bevraag 100+ bronnen zonder verplichte dataverplaatsing
- BW Bridge — soepel migratiepad vanuit BW zonder big-bang herschrijving
- Beheerde Data Spaces — data-mesh-architectuur native ondersteund
- Geen infrastructuurbeheer — volledig beheerd, auto-scaling op BTP
Bekende beperkingen
- SAP-centrisch — de meerwaarde vermenigvuldigt met SAP-bronsystemen; zonder die is het een dure HANA Cloud-wrapper
- Python/Spark-ecosysteem — eersteklas Python-notebooks en Spark ontbreken; Data Flows zijn eenvoudiger dan Databricks-notebooks
- dbt-ondersteuning is indirect — werkt via Open SQL Schema maar is geen officieel ondersteunde adapter
- UI-complexiteit — het platform heeft veel lagen (Data Builder, Business Builder, Catalog, Spaces) met een steile leercurve voor nieuwkomers
- Prijsondoorzichtigheid — Capaciteitseenheden zijn niet altijd gemakkelijk te voorspellen; betrek SAP-licenties bij de scopebepaling
- Community-omvang — aanzienlijk kleinere open-source-community vergeleken met Snowflake of Databricks
Conclusie
SAP Datasphere is een volwassen, functierijk platform dat een reëel probleem oplost: SAP-operationele data samenvoegen met het bredere enterprise-datalandschap in een beheerde, cloud-native omgeving. De combinatie van native SAP-connectoren, CDC-replicatie, datafederatie en de Business Builder-semantieklaag is werkelijk uniek in de markt.
Als je organisatie SAP-zwaar is — S/4HANA voor kernoperaties en SAP Analytics Cloud voor rapportage — dan is Datasphere een serieuze evaluatie waard. Het elimineert de behoefte aan aangepaste integratiemiddleware, biedt een beheerde analyticslaag zonder ABAP en geeft je een duidelijk migratiepad vanuit BW.
Als je datastack grotendeels niet-SAP is, zijn Snowflake, Databricks of BigQuery betere opties — met grotere ecosystemen, betere ML-mogelijkheden en lagere licentiebehoefte. Het juiste antwoord is niet universeel; het hangt af van waar je data staat en wie je gebruikers zijn.
Wil je evalueren of SAP Datasphere past bij jouw landschap — of hoe je het combineert met Snowflake of Databricks? Neem contact op — ik help je graag bij de scopebepaling.
Veelgestelde vragen
Wat is SAP Datasphere?
SAP Datasphere is SAP's uniforme cloud dataplatform (voorheen SAP Data Warehouse Cloud) dat een data warehouse, data lake, data-integratie, datafederatie en een business-semantieklaag combineert in één volledig beheerde dienst op SAP Business Technology Platform (BTP).
Wat is een Data Space in SAP Datasphere?
Een Data Space is een beheerde, geïsoleerde werkruimte binnen Datasphere waar een team of businessdomein zijn eigen data-assets, opslagquotum, rekenkrachtquotum en toegangsrechten beheert. Spaces delen data met elkaar via gecontroleerde Cross-Space Sharing.
Wat is het verschil tussen SAP Datasphere en SAP BW?
SAP BW is een on-premise datawarehouse gericht op SAP-rapportage met ABAP-ontwikkeling. Datasphere is cloud-native, ondersteunt open standaarden (SQL, Parquet, Delta), koppelt aan niet-SAP-bronnen en vervangt ABAP-transformaties door grafische flows en SQL. BW-objecten kunnen via de BW Bridge geleidelijk worden gemigreerd.
Kan SAP Datasphere verbinden met niet-SAP-bronnen?
Ja. Datasphere heeft 100+ connectoren, waaronder Snowflake, BigQuery, Redshift, Azure Synapse, SQL Server, Oracle, PostgreSQL, Salesforce, Amazon S3, ADLS en meer. Federatie maakt het mogelijk om externe data op te vragen zonder ze naar Datasphere te kopiëren.
Vervangt SAP Datasphere Snowflake of Databricks?
Niet direct. Datasphere is geoptimaliseerd voor SAP-zware organisaties. Het biedt diepe S/4HANA- en BW-integratie die Snowflake en Databricks niet hebben. Voor niet-SAP-organisaties zijn Snowflake of Databricks bijna altijd een betere keuze. Veel grote organisaties draaien Datasphere naast Snowflake of Databricks in plaats van het ene door het andere te vervangen.
Ondersteunt SAP Datasphere dbt?
Indirect. Het Open SQL Schema van Datasphere stelt een HANA Cloud SQL-endpoint beschikbaar waar de dbt-hana-adapter op kan verbinden. Het is geen officieel SAP-ondersteunde integratie, maar het werkt voor teams die dbt-modellen willen gebruiken naast native Datasphere-objecten.