Goed werken met data
door: Caroline Raat
Datagestuurd werken in het sociaal domein; als je hierop googelt, krijg je een grote hoeveelheid leveranciers te zien die dit als dienst bieden, aangevuld met opleidingen hierover. Dat is logisch, omdat je met data ongelofelijk veel kunt doen en iedereen daar een graantje van wil meepikken. Door kunstmatige intelligentie (AI), machine learning en het combineren van diverse datasets krijgt de gemeente informatie om van te smullen: sturen met getallen is aantrekkelijk, zeker als het gaat om taken die geld kosten. Juist door de hoeveelheid commerciële aanbieders, die lang niet altijd doordesemd zijn met publieke waarden, waaronder grondrechten van burgers (privacy!), dreigen gemeenten mogelijk de nadelen uit het oog te verliezen.
Gemiddelde leesduur: 8 minuten
Een voorbeeld uit de ‘systeemwereld’ (tegengestelde van de leefwereld van de burger) kwam ik tegen in een ronkend artikel: “Ook oneigenlijk gebruik van de Wmo werd in een gemeente opgespoord na het analyseren van data van Wmo-gebruikers. ‘Eenzaamheid blijkt een reden om een huishoudelijke hulp aan te vragen. Dat is oneigenlijk gebruik van de Wmo. Deze mensen moeten worden verwezen naar het voorliggend veld en zo besparen we kosten op de Wmo.’(1)” Een dergelijke ‘onmenselijk aandoende’ conclusie lijkt mij niet alleen wat simpel gedacht, maar gaat mogelijk ook nog eens de grenzen van de AVG te buiten gaan. In deze bijdrage ga ik in op enkele vragen.
Wat is datagestuurd werken? Data zijn gegevens, niet meer en niet minder. Soms zijn ze ‘Big’, en dan bedoelen we een grote hoeveelheid gegevens, doorgaans van cijfermatige aard. Deze zijn vooral nuttig bij het afleggen van financiële en andere in cijfers uit te drukken verantwoording en dito voorspellingen. Hiermee kan de organisatie beleidskeuzes maken. Maar data zijn ook andere gegevens, zoals NAW-gegevens, gezondheidsgegevens en gegevens over iemands woon- en leefsituatie: persoonsgegevens dus. Ook deze kunnen worden gebruikt voor datagestuurd werken, wat in de kern niet meer is dan werken met behulp van data. Data resulteren in allerlei soorten output: van kaarten met hotspots, statistieken, grafieken tot websites met benchmarks.(2) Deze kunnen heel bruikbare informatie geven en het is interessant erop te kijken. Zeker omdat de websites – voor zover ik heb kunnen beoordelen aan de voorkant – geen persoonsgegevens weergeven, is er op het eerste gezicht niets aan de hand.
Maar wat als gemeenten mensen in het sociaal domein gaan beoordelen op basis van zulke informatie? In welke wijk wonen ze? Hoe is die wijk qua achtergrond (opleiding, afkomst) samengesteld – iets dat wel uit deze statistische data kan worden achterhaald? Krijgen mensen door hun postcode al een ‘vinkje’ of wordt er extra streng ‘maatwerk’ geleverd? Hoe gerechtvaardigd is een dergelijke datagestuurde aanpak, wetend dat zelfs goede data nog steeds een geaggregeerd, cijfermatig beeld opleveren dat niet de werkelijkheid zelf is of weergeeft? En hoe schadelijk kan het zijn als in data en een ingebakken bias zit: een vooringenomenheid die weliswaar doorgaans niet is bedoeld, maar die wel doorwerkt. Digitale data zijn namelijk, hoe geavanceerd zo ook worden bewerkt en gecombineerd, ‘dom’. Stop je discriminatoire gegevens in een systeem, dan krijg je die er ook weer uit. De Toeslagenaffaire is een bekend voorbeeld ervan, maar ook de Wet SyRI. De bepalingen in de Wet SUWI die door deze wet werden ingevoerd, zijn door de rechter onrechtmatig verklaard: het aan elkaar koppelen van risicofactoren met persoonsgegevens uit diverse overheidsdatabases is een vorm van profilering, en dat is op grond van art. 22 van de AVG bijna altijd verboden.(3)
Te enthousiast omarmen van datagestuurd werken ligt op de loer, om de simpele reden dat technologie meer kan dan er is toegestaan. De verleiding om de grenzen van wat mag of wenselijk is op te zoeken is nu eenmaal ingebakken in mensen en dus in overheidsorganisaties. Die vrees wordt ook door veel juridische experts en mensenrechtenorganisaties, maar ook door de Autoriteit Persoonsgegevens, geuit ten aanzien van de komende Wet gegevensverwerking door samenwerkingsverbanden. In die wet zullen verbanden van bestuursorganen en private partijen gezamenlijk gegevens mogen verwerken voor zwaarwegende algemene belangen, zoals de bestrijding van fraude en de georganiseerde criminaliteit. Die bestrijding willen we allemaal wel, maar er bestaat ook nog zoiets als proportionaliteit en subsidiariteit, nog los van onbedoelde kwalijke effecten.
"Te enthousiast omarmen van datagestuurd werken ligt op de loer, om de simpele reden dat technologie meer kan dan er is toegestaan"
Wat mag wel en niet met data? Onderzoek Op grond van de AVG bestaan er speciale regels voor onderzoek wat betreft het recht op inzage, rectificatie of bezwaar. Het moet dan volgens art. 89 van de AVG en 44 van de Uavg wel gaan om wetenschappelijk onderzoek. Daaronder wordt volgens de AVG-wetgever ook toegepast wetenschappelijk onderzoek verstaan, maar het moet het algemeen belang dienen, te weten het – door middel van publicatie – verder brengen van de stand van de wetenschap. Fraude-onderzoek of onderzoek naar ‘oneigenlijk gebruik’ van de Wmo valt hier in elk geval niet onder. Statistisch onderzoek ten behoeve van openbare rapportages aan de gemeenteraad wel: kennis wordt hiermee vergroot en verspreid. Dat iets onder de regels voor onderzoek valt, betekent niet dat alles geoorloofd is. De onderzoeker – de gemeenteambtenaar of externe – moet ook dan voldoende waarborgen treffen om zo veel mogelijk privacyrisico’s te voorkomen. Daarom moeten er technische en organisatorische maatregelen worden getroffen, die doorgaans pseudonimisering (het versleutelen van gegevens door middel van een algoritme) moeten omvatten. 'Persoonsgericht' dataonderzoek Op grond van de AVG kunnen persoonsgegevens worden verwerkt als daarvoor een grondslag in artikel 6 van de AVG staat. Voor de overheid, en dus ook voor het sociaal domein, komen we dan uit bij artikel 6, eerste lid, aanhef en onder c (noodzakelijk voor het uitvoeren van een wettelijke plicht), d (noodzakelijk om de vitale belangen van de betrokkene of van een andere natuurlijke persoon te beschermen) of e (noodzakelijk voor de vervulling van een taak van algemeen belang of van een taak in het kader van de uitoefening van het openbaar gezag). Datagericht werken in het sociaal domein zal dus bestaan uit verwerking van gegevens voor de hiervoor genoemde doelen, zoals het beoordelen van het recht op uitkering of een Wmo-voorziening. Vaak zijn deze gegevens van de betrokkene zelf afkomstig, maar bijvoorbeeld ook van wijkteams, Wmo- of jeugdzorginstellingen of uit SUWI-net (voor uitkeringsgerelateerde wetten in het sociaal domein). Hiervoor geldt altijd dat de verwerking moet voldoen aan de beginselen van art. 5 van de AVG en het proportionaliteits- en subsidiariteitsbeginsel (noodzakelijkheidsvereiste). “Wel handig of interessant” is geen grondslag om iemands persoonsgegevens te verwerken. Verder verwerken voor onderzoek Als er een keer persoonsgegevens worden verwerkt, dan mogen deze soms verder worden verwerkt voor andere doeleinden. De regels hiervoor staan in het vierde lid van art. 6 van de AVG. Soms is de verdere verwerking toegestaan als dat noodzakelijk en evenredig is in een democratische samenleving ter waarborging van een aantal in art. 23 van de AVG opgesomde situaties, zoals voorkoming en onderzoek m.b.t. strafbare feiten en toezicht. In artikel 22 van de AVG (het verbod op profilering) is een uitzondering opgenomen voor het opsporen van fraude etc., maar die uitzondering moet wel aan zeer strenge voorwaarden voldoen. SyRI voldeed er niet aan, omdat het middel niet transparant was (de Staat kon geen uitleg geven van wat het algoritme deed) en niet proportioneel, gelet op het doel. Ook heeft de betrokkene bij profilering altijd recht op menselijke tussenkomst, inspraak en bezwaarmogelijkheid. Voorlopig lijkt mij dat gemeenten het sinds dit debacle met het met data opsporen van oneigenlijk gebruik van voorzieningen in het sociale domein erg rustig aan moeten doen. Data mogen hooguit – en dan nog conform de beginselen en regels van de AVG – als hulpmiddel worden gebruikt, maar niet als ‘beoordelaar’ of beslisser. Soms mogen persoonsgegevens dus verder worden verwerkt voor andere doelen, zo lang die verenigbaar zijn met het oorspronkelijke doel. Daarvan is sprake als er een dicht verband is tussen het nieuwe en het oude doel, waarbij de gemeente rekening moet houden met de context en de aard van de gegevens. Ook hier geldt: niet alles dat kan, is wenselijk of toegestaan. Juist omdat in het sociaal domein burgers in een afhankelijke positie zitten en de gemeente doorgaan erg veel weten over deze mensen, is het belangrijk om uit te gaan van het voorzorgbeginsel(4), ontleend aan Hildebrand: “Het gaat eigenlijk steeds om een verplichting om te voorzien dat de verwerking waarschijnlijk leidt tot aantasting van rechten en vrijheden en vervolgens om een verplichting tot het nemen van de nodige maatregelen. Een van die maatregelen kan zijn om af te zien van de verwerking. Het gaat hier dus eigenlijk om het voorzorgbeginsel.” Want, volgens mij kun je wat je een keer over iemand weet, niet ‘ontweten’: “Mensen hebben er al kennis van kunnen nemen. Helaas zie ik vaak dat organisaties met verwerking, waaronder publicatie, van persoonsgegevens het recht in eigen hand nemen. Dat is in strijd met het voorzorgbeginsel, mogelijk schadelijk en vaak is het nergens voor nodig.”
"Data en datagestuurd werken zijn in ethische zin niet goed en niet slecht; het is simpelweg een fenomeen waar je op een ethisch meer of minder goede manier mee om kunt gaan, een fenomeen dat zich bovendien niet laat tegenhouden; data zijn overal"
Data: een goed begin Data en datagestuurd werken zijn in ethische zin niet goed en niet slecht; het is simpelweg een fenomeen waar je op een ethisch meer of minder goede manier mee om kunt gaan, een fenomeen dat zich bovendien niet laat tegenhouden; data zijn overal. De overheid heeft macht over burgers en de samenleving. Ook die macht is niet goed of niet slecht. Maar de overheid, en dus ook de gemeente en alle mensen die daar werken, hebben niet alleen de juridische, maar ook morele plicht om die macht goed te gebruiken. Daarom is de rechtsstaat ontwikkeld – als middel tegen willekeurige machtsuitoefening. De gemeente heeft enorm veel informatie, en informatie geeft vanzelf macht, zeker als degene waarover die informatie gaat, daarover niet beschikt. Stel je voor: je Wmo-voorziening wordt na twee jaar stopgezet, of misschien wordt er zelfs een terugvordering gedaan vanwege, zo lazen we in de inleiding: “u bent eenzaam, maar dat is geen reden voor huishoudelijke hulp. Ga maar naar een voorliggend veld”. U vraagt aan de consulent: “hoe komt u aan die informatie?” En u krijgt het antwoord: “Dat is moeilijk uit te leggen, want we hebben geen onderzoek gedaan naar uw specifieke situatie, maar het komt uit onze data.” De kans dat er beelden a la Kafka op je netvlies verschijnen en je je erg machteloos voelt, lijkt mij groot. Welk ‘voorliggend veld’ (algemene voorziening, zoals een bibliotheek of zwembad)? Hoezo eenzaam? En waarom krijg jij wel deze beslissing en een ander in dezelfde situatie niet? Je verwacht minstens een op jouw situatie en persoon gericht onderzoek: ben je eenzaam, maar mankeer je verder niets, dan zou het inderdaad kunnen dat je niet in aanmerking komt voor huishoudelijke hulp. Dan doemen de vragen op: waarom heb je die dan in vredesnaam wel eerder gekregen? Is er bij de aanvraag niet goed doorgevraagd? Is er bij het keukentafelgesprek niet gesproken over de voorliggende velden, of zijn die niet beschikbaar in de omgeving? Worden data dan ingezet om ‘menselijke fouten’ te corrigeren? En waarom gebeurt dat nu pas? Dit voorbeeld lijkt overdreven, maar uit de Toeslagenaffaire en andere rechtzaken blijkt dat dit soort vervreemdende situaties voorkomen, ook in het sociale domein. Data zijn in dit domein dus vooral behulpzaam op beleidsmatig niveau: om te inventariseren hoe vaak bepaalde fenomenen voorkomen, hoe kosten zich ontwikkelen, etc. Ook daar geldt dat data alleen ‘koude informatie’ opleveren: kwantitatieve gegevens. Die geven niet aan hoe en waarom zich bepaalde zaken ontwikkelen, en vooral niet hoe mensen dat ervaren en beleven. Daarvoor is ‘warme informatie’ nodig: kwalitatieve gegevens. Die kan afkomstig zijn uit de gemeentelijke organisatie zelf, vooral van de streetlevel medewerkers: die medewerkers die contact hebben met de ‘leefwereld’. Nog beter is het als gebruik wordt gemaakt van ervaringen van de burgers of klanten. Een goede methode daarvoor is storytelling(5). Uiteindelijk kunnen kwantitatieve en kwalitatieve gegevens samengevoegd optimale informatie opleveren. Data of datagestuurd werken in individuele casus is mogelijk, maar dan als beslisondersteuning. Er zijn diverse apps waarmee met name eenvoudige cijfermatige beoordelingen, die met een ‘ja-nee’ beslisboom kunnen worden uitgevoerd, worden vergemakkelijkt. Deze toepassingen werken goed om ‘te veel menselijkheid’ in de vorm van vooringenomenheid, sympathie, antipathie of vriendjespolitiek tegen te gaan. Dat is ethisch nuttig, omdat deze verschijnselen uiteraard niet erg passen bij een objectieve en onpartijdige rechtsstaat. Tot slot Goed werken met data: dat moeten gemeenten vooral doen! Als dat op een rechtmatige manier gebeurt en het doel waarmee je het doet, namelijk het vergroten van beleidsmatige kennis, dan kan data heel veel kennis en inzicht opleveren. Zijn data ‘persoonsgegevens’, dan gelden de beginselen en regels van de AVG. Dat is geen belemmering, maar een terechte inperking van macht. Daarom is datagestuurd werken om fraude op te sporen of individuele beslissingen te nemen hooguit mogelijk als hulpmiddel, en niet als vervanger van mensen.
Mr. dr. Caroline Raat is eigenaar van Recht en Raat onderzoek, opleiding en advies. Zij is auteur, annotator en veelgevraagd spreker op het gebied van staats- en bestuursrecht, open overheid, subsidierecht, klachtrecht, integriteits- en privacyvraagstukken. Eerder dit jaar verscheen haar boek Ethiek en integriteitszorg: Handboek voor de overheidsjurist.