De Opdrachtgever
De opdrachtgever voor deze opdracht is de gemeente Ede.
De Challenge
Verschillende afdelingen binnen het Sociaal Domein gebruikten verschillende systemen en datasets. De verschillende datasets konden moeilijk gecombineerd worden en het vroeg te veel tijd om analyses er over te doen.
De doelstelling was om data te ontschotten waardoor de gemeente Ede beter integraal verantwoording kan afleggen en om de slag te maken naar betere afwegingen en sturing op basis van data. Ook kunnen zo nieuwe vragen beantwoord worden, die tot voor kort nog niet konden worden beantwoord. De primaire use case als vertrekpunt was “stapeling van zorg”: waar worden verhoudingsgewijs de meeste zorgkosten gemaakt?
Extra uitdaging: sommige onderzoekers wilde de data verder analyseren in SPSS en andere informatiespecialisten in PowerBI. Dat vraagt een flexibele output in zowel ‘platte tabellen’ als een ‘sterdiagrammen’ voor PowerBI.
De Aanpak
Voor dit traject hebben we eerst met de beleidsmedewerkers de ‘informatiebehoefte’ opgehaald: welke beleidsvragen moeten worden beantwoord ? Met die vragen hebben we met het project team van Ede de vraag vertaald in functionele, technische en datawensen en eisen. Centraal in de oplossing staat een nieuw ontwikkelde pseudonimiseringscomponent die alle data pseudonimiseert met behoud van logica. Ook is een slimme hybride oplossing ontworpen wat de gemeente Ede in staat stelt om datasets samen te stellen en de datadienst data te laten prepareren voor verdere analyse.
Het Resultaat
Het dataplatform sociaal domein is een oplossing die dagelijks actuele informatie uit verschillende bronnen ophaalt, combineert, pseudonimiseert en vervolgens in een hybride variant beschikbaar stelt aan de gebruikers. Deze gebruikers kunnen hier flexibel data filteren en datasets samenstellen voor hun eigen analyses in een formaat die ze zelf prefereren om verder te analyseren in hun analysetools: SPSS en PowerBI.
Een depseudonimiseringstool maakt het voor geautoriseerde gebruikers tot slot mogelijk om gevonden resultaten indien nodig weer te ontsleutelen.
8 grote databronnen
5 Miljoen records
Iedere dag geactualiseerd
Alle data gepseudonimiseerd