Aan de slag met open data: VerkenDeZorg.nl

Meerdere partijen willen graag inzicht krijgen in de kosten van het Nederlandse zorgsysteem. Eén van de stappen die dat mogelijk maakt is het publiceren van de prijzen die zorgverzekeraars en zorgverleners met elkaar afspreken. Onder meer de Consumentenbond, het TV-programma Kassa en de Autoriteit Consument en Markt vragen daar om. In september van dit jaar was zorgverzekeraar CZ de eerste die de stap zette, en een deel van de gecontracteerde prijzen tussen de verzekeraar en alle Nederlandse ziekenhuizen openbaarde. Het resultaat? Een Excel-document bestaande uit zo’n 85.000 regels.  Dat maakt het voor consumenten nog niet bepaald makkelijk om meer inzicht in die kosten te krijgen.

Aan de slag met de data

Omdat ik wel benieuwd was wat de publicatie van deze data betekent, zette ik een kleine website op: VerkenDeZorg.nl. Het maakt het mogelijk om iets gebruiksvriendelijker en gestructureerder door de dataset heen te gaan. De stappen om daartoe te komen waren vrij eenvoudig: ik zette het Excel-bestand om naar een .csv-bestand, en laadde dat bestand in een database via PhpMyAdmin.

verkendezorg-excel
De brondata: een Excel-document bestaande uit zo’n 85.000 regels

Met een kleine beetje php-code, en door Twitter’s  Bootstrap te gebruiken in combinatie met een gratis Bootstrap-template, was het vervolgens mogelijk om de dataset te doorzoeken op keywords en DBC-codes. Vervolgens wilde ik per behandeling (DBC-code) kunnen kijken hoeveel die zou kosten bij iedere zorgverlener, wat de gemiddelde prijs was voor die behandeling, en in hoeverre zorgverleners van dat gemiddelde afwijken. Onderstaand plaatje geeft een voorbeeld daarvan.

verkendezorg-1

Dat is natuurlijk een leuk inzicht. Een vervolgvraag die naarboven komt is: het Martini Ziekenhuis is hier het duurst. Zijn zij vaker het duurste ziekenhuis? Een ranking per zorgverlener maakt dat inzichtelijk. Die geeft aan: in hoeveel procent van de behandelingen is dit ziekenhuis duurder dan het gemiddelde? Bij het Martini Ziekenhuis gaat dat, op basis van deze dataset, om zo’n 60% van hun behandelingen.

Open data: ‘linked data’ is nóg leuker!

Hoe interessant een open data-set ook is, het wordt vaak nog interessanter als je meerdere datasets aan elkaar kunt koppelen. Nu is het geluk dat behandelingen in de zorg heel gestructureerd worden vastgelegd. Daar worden DBC-codes voor gebruikt. Dus we kunnen de CZ-dataset op basis van DBC-code linken aan andere datasets, die ook informatie op DBC-niveau bevatten. Echter: helaas zijn er niet heel veel datasets in die niche.. Na een uitgebreide zoektocht vond ik twee interessante: per DBC-code het totaal aantal behandelingen in Nederland per jaar, en de maximumprijzen voor een subset van de DBC-codes.

Die eerste dataset maakt het mogelijk om te kijken: hoe vaak is een behandeling vorig jaar uitgevoerd, en hoeveel verschilt de prijs voor die behandeling per ziekenhuis? Dat geeft wel een boeiend inzicht. De DBC-code voor ‘1 of 2 polikliniekbezoeken bij huidkanker of voortekenen daarvan’ is vorig jaar in totaal 122.452 keer voorgekomen. In het Ommelander Ziekenhuis in Groningen betaal je daarvoor 61 euro, terwijl je bij de Mauritsklinieken (in o.a. Nijmegen, Amsterdam en Utrecht) daar 170 euro voor betaalt. Dat is meer dan twee keer zo duur. En zo’n relatief groot verschil voor een behandeling die veel meer dan 100.000 keer op jaarbasis voorkomt, dat is natuurlijk bijzonder.

Maar… wat kun je nu met deze cijfers?

Eigenlijk heel weinig. Het is leuk om te zien dat een zorgverzekeraar het ene ziekenhuis meer betaalt voor een behandeling dan aan een ander ziekenhuis. Maar met de wetenschap dat er op een wat hoger niveau wordt onderhandeld dan op het niveau van individuele behandelingen zegt dat vrij weinig. Het wordt interessant als je weet wat de volumes van de specifieke behandelingen bij ieder ziekenhuis zijn. Dan zou je kunnen aanwijzen met welke ziekenhuizen de verzekeraar over bepaalde behandelingen scherper moet onderhandelen. Die volumecijfers zijn helaas niet openbaar. En ook kunnen we helaas nog geen vergelijkingen maken tussen zorgverzekeraars. CZ is namelijk de enige zorgverzekeraar die tot nu toe een deel van z’n tarieven heeft geopenbaard.

Wil je zelf nog even spelen met de data? Kijk dan op www.verkendezorg.nl!