Datagestuurd werken binnen de gemeenten: lessen van een pionier

door: Tom Reijner

Stel, je wilt als gemeente aan de slag met data om vraagstukken in het sociaal domein aan te pakken. Maar hoe doe je dat dan en wat levert het op? Ervaringen in andere gemeenten kunnen als blauwdruk dienen, zoals in Zaanstad, waar programmamanager datagestuurd werken Tom Pots binnen én buiten de gemeente aan de weg timmert.

Gemiddelde leesduur: 8 minuten

Tom Pots is al meer dan zeven jaar programmamanager Datagestuurd Werken bij de gemeente Zaanstad. Daarnaast is hij sinds 2019 Programmaleider & Docent leergang datagedreven sturing in de publieke sector aan de Vrije Universiteit Amsterdam.

Veel gemeenten zien data als dé heilige graal om prangende maatschappelijke kwesties op te lossen. Of om het leven van burgers met data een beetje beter te maken. Schonere stoepen, veiligere wijken – dat soort zaken. ‘Smart’ is hierbij het toverwoord. Maar Tom Pots, programmamanager datagestuurd werken bij de gemeente Zaanstad, komt in het begin van het interview al meteen met een fikse waarschuwing. Je kunt volgens hem niet zomaar lukraak met data gaan werken. ‘Je moet eerst en vooraf weten wat je doel is. Anders ben je volstrekt kansloos,’ zegt Pots. ‘Mensen komen met honderd vragen binnen, als ze een dataproject beginnen. Maar ze weten niet wat ze willen bereiken. Dit soort projecten zullen niet slagen.’ En Pots kan het weten. Na acht jaar als senior consultant te hebben gewerkt voor adviesbureau Berenschot, onder meer op het gebied van IT-governance, maakte hij in 2014 de overstap naar de gemeente Zaanstad waar hij twee jaar later begon te werken als programmamanager datagestuurd werken. Hij wilde wel eens zélf aan de slag met complexe maatschappelijke vraagstukken en hoe je die met data ‘een beetje beter kan maken’. Uiteindelijk lagen er een paar mooie resultaten op tafel, zegt hij. ‘Die begonnen op te vallen binnen de publieke sector. Ik werd gevraagd spreekbeurten te komen geven, her en der, en zo belandde ik op de Vrije Universiteit in Amsterdam.’ Daar geeft Pots, met al zijn expertise, nu een achtdaagse leergang over datagedreven sturing in de publieke sector.

"Pots deelt een eerste les voor iedereen die ‘iets’ met data wil gaan doen: weet waar je het over hebt. Met andere woorden: formuleer een heldere definitie van wat voor jou datagestuurd werken is"

In het begin was het pionieren Al die opgedane ervaring kwam er niet zonder slag of stoot. In het begin was er nog niet zoveel. Pots was informatiemanager en al wel bezig met Big Data, tot het moment dat een IT-manager binnen de organisatie datagestuurd werken opperde. Toen ging het balletje pas echt rollen, aldus Pots. ‘Het geld was beschikbaar. Opeens zaten we met twaalf mensen in een team. Je ziet dus heel duidelijk dat als het besluit eenmaal is genomen, zo’n thema als datagestuurd werken als een prioriteit wordt gezien.’ En dan is er ineens van alles mogelijk. Het was in het begin wel pionieren, vervolgt hij. ‘We hebben alle fouten gemaakt die we konden maken.’ Want hoewel inmiddels steeds meer gemeenten werken met data, stond dat destijds allemaal nog in de kinderschoenen. Big Data en smart cities waren ook toen al een hype, maar voor de rest was het nog onontgonnen terrein. Het eerste wat Pots deed was alle koppen bij elkaar steken en een paar thema’s uitkiezen waar hij ‘iets’ mee wilde gaan doen. ‘Ik ben raadsleden gaan interviewen, mensen bij woningcoöperaties, zorginstellingen en ander gemeenten,’ vertelt hij. 'Met telkens die ene vraag: welke technologische ontwikkelingen komen op ons af?’ De eerste pilot die de gemeente Zaanstad oppakte, was data science in het publieke domein. Data science is het toepassen van wiskundige modellen die in staat zijn patronen te herkennen in data die met het blote oog niet te zien zijn en die gebruikt kunnen worden om toekomstige gebeurtenissen te voorspellen. Niet dat dat meteen een succes werd. ‘Ik kan je vertellen: kansloos. Omdat we geen enkel idee hadden wat we aan het doen waren.’ Een paar lessen voor de organisatie Hij deelt daarom meteen de eerste les voor iedereen die ‘iets’ met data wil gaan doen: weet waar je het over hebt. Met andere woorden: formuleer een heldere definitie van wat voor jou datagestuurd werken is. Voor Pots is dat helder: ‘Datagestuurd werken is, om het even heel beknopt te zeggen, het toepassen van beschrijvende, diagnosticerende, voorspellende analyses binnen een organisatie. De thema’s binnen een publieke organisatie waarop je data-analyse kan toepassen zijn veelzijdig: het loopt van funderingen van wegzakkende huizen tot aan armoedebeleid in bepaalde buurten.’ Begripsbepaling is van essentieel belang, meent hij. ‘Data science heeft bijvoorbeeld weer helemaal niets te maken met dashboards, waarop je verschillende data kan monitoren. Zonder diepgravend onderzoek. Net zomin als dat dashboards iets te maken hebben met voorspelmodellen.’ Het valt of staat allemaal met een goed begrip van de kwestie die voorligt, benadrukt Pots. Wat is precies het feitelijk probleem? Wat is de werkelijkheid? Met wat voor data hebben we te maken? Het komt volgens hem te vaak voor dat mensen een probleem aanvliegen met data zonder datzelfde probleem tot in de haarvaten te kennen. En laat de organisatie doelbewust kiezen voor datagestuurd werken. Dat maakt de verandering ook makkelijker, ziet Pots. Je moet ruimte krijgen om met data aan de slag te gaan. Want het zijn trajecten van de lange adem: ‘Het kost best wel wat moeite om die voor elkaar te krijgen. Dat gaat gepaard met bloed, zweet en tranen.’ Pots: ‘Wat je verder vaak ziet is dat organisaties graag de basis op orde willen hebben. Maar daar gaat het niet om. Je moet juist beginnen met de spiegeltjes en de kraaltjes. Ervoor zorgen dat je genoeg mooie inspirerende voorbeelden hebt. Zodat mensen elders in de organisatie zeggen: dat is mooi, dat wil ik ook.’ Veel data zijn overigens allang beschikbaar en liggen soms, onopgemerkt in de spreekwoordelijke onderste lade. ‘Kijk vooral ook wat al voorradig is. Wat staat er in documenten, factsheets, presentaties, slides enzovoort?’ Een van de domeinen waar je verschil met data kan maken, is in het sociaal domein. ‘We richten ons op beschrijvende diagnosticerende analyses. Het is allemaal erg rechttoe rechtaan,’ zegt Pots, die vervolgens met een concreet voorbeeld rond jeugdbeleid op de proppen komt. ‘Zaanstad is verantwoordelijk voor de jeugdzorg, een open einde-regeling. Dat betekent dat je een bepaald budget krijgt, maar als er te veel aanmeldingen zijn, moet je gewoon betalen.’ Hij ziet dat de financiële kosten werkelijk alle kanten opvliegen. Daar zijn volgens hem een aantal redenen voor. ‘Een jeugdgroep moet vijf dagen voordat de zorg begint, worden aangemeld. Daar deden zorgaanbieders wegens verschillende oorzaken soms wel 85 dagen over. Dat betekent dat je soms wel 85 dagen niet weet welke kosten je aan het maken bent.’ Dat wil je niet, vervolgt hij. ‘Wat we toen hebben gedaan, is het verzamelen van data van alle zorgaanbieders om zo de kosten in kaart te brengen. Met een klein team hebben we ervoor gezorgd dat we de 85 dagen van kostenonzekerheid hebben teruggebracht naar 28 dagen.’

"Wie met data werkt, heeft dus te maken met ethiek. Of het nu om kunstmatige intelligentie gaat of hoe de data worden opgeslagen en wie er toegang tot hebben: op de een of andere manier moet je het goed kunnen afdekken"

Pots geeft nog een voorbeeld waar hij over te spreken is, buiten de gemeente Zaanstad weliswaar. ‘In Rotterdam hebben ze voor een wijkgerichte, datagestuurde aanpak gekozen in de jeugdpreventie. Wat hebben ze gedaan? Ze hebben een zogenoemd factorenmodel gemaakt samen met zes à zeven hoogleraren.’  Met zo’n factorenmodel op basis van wetenschappelijke kennis kun je bepalen aan welke maatschappelijke resultaten in de wijk gewerkt gaat worden en welke interventies, activiteiten en voorzieningen nodig zijn om dit te bereiken. In dit geval: hoe je jonge kinderen uit de jeugdproblematiek houdt. ‘De gemeente is met die hoogleraren en met het factorenmodel in de hand wijk voor wijk gaan kijken hoe ze jeugdproblematiek konden aanpakken. Met alle partners in de wijk hebben ze de wijkprogrammering aangepast én verbeterd. Een kwestie van diagnosticerende analyse uit de wetenschap inzetten om ervoor te zorgen dat de aanpak werkt.’ Vervolgens, zegt Pots, en dat maakt het allemaal wat complexer, heeft Rotterdam een monitorsysteem opgetuigd om te kijken of het factorenmodel ook echt effect sorteerde. ‘Dat is wel echt nieuw en innovatief. Tien jaar geleden was dit niet mogelijk geweest.’ Een jaloersmakend voorspelmodel Zo zie je dus dat er verschillende manieren zijn om met data om te gaan. Soms is het vrij simpel, zoals een inventarisatie van de kosten om de keten binnen de jeugdzorg beter te laten functioneren, en soms is het vraagstuk ook een stuk complexer met grote datasets. Zo koos de gemeente Den Haag voor een voorspelmodel, Data-analist Michiel Deerenberg ontwikkelde een model waarmee de gemeente de uitgaven op basis van de Wmo de komende jaren nauwkeurig op wijkniveau kan voorspellen. Zo’n model werkt kostenbesparend en dat is handig in de almaar groeiende zorgsector. Verderop in dit magazine leest u hier meer over. In Zaanstad branden ze hun vingers er voorlopig niet aan. De reden is dat de teams niet klaar zijn voor het voorspelmodel, aldus Pots. ‘Wat je ziet, is dat mensen binnen teams vooral bezig zijn met beschrijvende vragen, met de diagnostiek van het probleem.’ En er speelt nog iets belangrijkers: veel data van gemeenten zijn ongeschikt voor voorspelmodellen. ‘Die datasets zijn simpelweg te beperkt. Ze hebben niet de grootte om algoritmes goed te kunnen voeden en trainen,’ legt Pots uit. Hij wijst op het Haagse voorbeeld, dat hij ‘jaloersmakend goed’ noemt. Wat ze daar hebben gedaan, is zich baseren op de microdata van het Centraal Bureau voor de Statistiek (CBS), zodat je Nederland als een grote dataset kan zien. ‘Het algoritmisch model, toepasbaar op wijkniveau, was zo goed getraind met al die data dat er een voorspellend model uit kon komen.’

De ethische kant van het verhaal Over algoritmes en kunstmatige intelligentie gesproken. Dat die ‘momenteel niet heel erg lekker liggen’ is voor Pots een andere reden om daar uiterst voorzichtig mee om te gaan. We kennen immers allemaal het voorbeeld dat leidde tot de toeslagenaffaire. Voor het voorkomen van fraude werden algoritmes ingezet, maar die bleken duizenden ouders onterecht als fraudeur aan te merken, waardoor zij grote schulden opliepen. Het is een extreem voorbeeld van hoe het mis kan gaan met algoritmes. ‘Het gebruik daarvan is uiterst dubieus als je bijvoorbeeld menselijk gedrag wilt voorspellen. Bij de verwerking van data komt namelijk altijd bias om de hoek kijken. Vooroordelen.’ Met het Wmo-voorspelmodel, zoals ontwikkeld in Den Haag, is ethisch niets mis, benadrukt Pots. ‘Wat ze in Den Haag deden, was kijken naar de kosten van de Wmo. Ik zie daar weinig controversieels in.’ Pots noemt een voorbeeld van een voorspelmodel binnen het sociaal domein waarbij het ethisch gezien heel wat minder eenduidig is. ‘Dat gaat over kindermishandeling. Eén foute beschuldiging, en een heel gezin valt uit elkaar. Aan de andere kant: wat nu als je met zo’n model kunt voorkomen dat drie kinderen worden mishandeld? Zeg het maar. Waar kies je voor?’ Pots komt daar zelf niet uit. ‘Dat grijze gebied is ook precies de reden waarom zo’n voorspelmodel er nooit is gekomen.’ Wie met data werkt, heeft dus te maken met ethiek. Of het nu om kunstmatige intelligentie gaat of hoe de data worden opgeslagen en wie er toegang tot hebben: op de een of andere manier moet je het goed kunnen afdekken. Dat wil én moet je , in het licht van de Algemene verordening gegevensbescherming (AVG) voorkomen. Zeker als je te maken hebt met gevoelige gegevens binnen het sociaal domein. Waar sla je alle beschikbare data op? Welke datasets zijn er en hoe maak je die kenbaar aan het publiek? En, vanuit privacy-oogpunt heel belangrijk: wie hebben toegang tot welke data? In Zaanstad hebben ze om die reden een Datapakhuis opgezet. Van hieruit wordt data gedeeld met belangstellenden, zowel binnen als buiten de gemeenten, en de privacy is in veilige handen. Alle datasets zijn thematisch gerangschikt. De open datasets zijn voor elke burger vrij toegankelijk maar voor de gesloten, versleutelde data moet je een aanvraag doen. Met het Datapakhuis, bereikbaar via zaanstad.dataplatform.nl heb je de eerste resultaten al binnen enkele dagen binnen, terwijl dat voorheen vijf dagen was.(1) ‘Het is de bedoeling om via dit dataplatform ook de samenwerking te zoeken met andere gemeenten en data te delen,’ aldus Pots. Hij verwacht dat data science binnen gemeenten heel groot gaat worden ‘Digitalisering is overal. Op straat, in de stad. We zijn onze huizen aan het digitaliseren. Een wasmachine kent vaak meer sensoren dan je voor mogelijk houdt. Als die ontwikkelingen doorzetten, is data science ook binnen gemeenten niet meer te stuiten.’