‘Het is alsof je voortdurend langs de afgrond fietst’
Hoogleraar Joost Kok over de onzichtbare kracht en het gebruik van big data
Van sport tot geneeskunde en van aandeelhandel tot verkeer. Het vormt slechts een greep uit de sectoren voor wie het snel verwerken en analyseren van grote hoeveelheden data een waardevolle ‘grondstof’ is geworden. Volgens Joost Kok, hoogleraar Informatica en hoogleraar Geneeskunde, ligt de uitdaging niet in het verzamelen, maar in het doeltreffend gebruik daarvan.
Je verwacht het niet zo snel op het bureau van een professor op de Universiteit Leiden. Er ligt een A4-tje met het logo van de KNVB op tafel. Een breed kleurenpallet op papier verraadt de looplijnen van de voetbalsters van Oranje. Het EK vrouwenvoetbal vormt in eigen land het decor voor een grootschalig data-onderzoek. Bij de Oranje Leeuwinnen draait het namelijk niet alleen om inzet en balbehandeling, maar ook om big data. De rekenmeesters van de Universiteit Leiden laten er vakkundig allerlei analyses op los. “We bekijken het voetbal met wiskundige methoden. Alsof de spelers natuurkundige, bewegende deeltjes zijn”, verklaart Joost Kok.
Miljoenen factoren
Onder zijn leiding registreren onderzoekers tijdens de wedstrijden alles tot in detail. Wie naar wie speelt, waar een corner heen gaat, waar de keeper heen springt. Ook staan er in het stadion camera’s die de locatie van de spelers vastleggen. De voetbalsters en de bal krijgen op elk moment een coördinaat. Zo wordt de wedstrijd weergegeven als bewegende puntjes. “Je kunt dan precies zien hoe het team zich beweegt, en de spelers reageren in bepaalde scenario’s”, weet Joost.
Na het verzamelen van de data begint het echte werk voor de hoogleraar en zijn team. In de brei aan data zoeken zij naar data om voorspellingen te doen. “We zien duizenden, misschien miljoenen factoren die kunnen leiden tot een schot op doel. Wat werkt dan wel, en wat werkt niet? Je zoekt naar verbanden om de coach te helpen de winnende strategie te bepalen.”
Hollandse Brug
Het zo slim mogelijk ontsluiten van data. Dat klinkt misschien vaag, maar deze wetenschap heeft heel veel invloed op ons leven. “Denk aan connectiviteit via internet of intelligente computers die ons werk uit handen nemen. Deze ontwikkelingen gaan zo snel dat we over pakweg vijf jaar weer anders zullen denken en ons anders zullen bewegen”, verwacht Joost.
De hoogleraar en veelgevraagd spreker is onder meer betrokken bij het Leiden Centre of Data Science, een netwerk van statistici en informatici dat fundamenteel onderzoek verricht naar wiskundige theorieën en computermethoden om big datagegevens te analyseren. Daarnaast was hij tot voor kort wetenschappelijk directeur van het Leiden Institute of Advanced Computer Science (LIACS).
Joost Kok wijst op de verticale dwarsbalk onder de brug waar sensoren op bevestigd zijn voor het meten van onder meer de vibraties, spanning en temperatuur.
Nijkerkbrug
Joost vormt zo een onzichtbare en onmisbare kracht achter allerlei projecten die een grote impact hebben op de maatschappij. Met zijn hulp vinden wetenschappers nieuwe medicijnen, ontdekt de overheid mogelijke fraude bij zorgdeclaraties en kunnen assets op afstand in de gaten gehouden worden. Veel van onze bruggen stammen uit de jaren zestig en zeventig. Deze constructies hebben gemiddeld een levensduur van veertig jaar en daar lopen we nu tegenaan. Alle bruggen vervangen is onbetaalbaar. De schade, zoals op Nijkerkbrug waar stukken beton zijn losgeraakt en de brug voor de zekerheid wordt gestut, blijven repareren is geen optie. Joost: “Het reparatiewerk gaat meestal maar tien jaar mee. Je wil op langere termijn kunnen kijken of iets veroudert, en op welke wijze die curve verloopt, zodat je beter kan voorspellen wanneer de brug aan onderhoud toe is.”
Onder leiding van Joost nam een projectteam zeven jaar geleden de proef op de som. Kun je de belasting die het verkeer op de brug uitoefent zo gedetailleerd mogelijk meten dat je beter kunt anticiperen op periodieke inspecties?
Filteren
De Hollandse Brug op de A6 tussen Amsterdam en Almere vormde een gewillig slachtoffer om dat in de praktijk uit te testen. Strukton plaatste er ruim honderd sensoren op voor het meten van onder meer de vibraties, spanning en temperatuur. Het projectteam bedacht computerarchitectuur en software om de verkregen data te verwerken. Binnen twee minuten analyseren 528 computer cores tegelijk allerlei meetgegevens. Cores zijn stukjes hardware waarop berekeningen worden uitgevoerd.
Het verwerken, analyseren en vindbaar maken van dagelijks ruim 5 GB aan data levert volgens Joost allerlei uitdagingen op. Want data vergaren is één, maar uit die brei aan informatie de juiste vertaalslag maken is twee.
Dat begint al met nadenken over de wijze waarop je data binnenhaalt. “De data was er in het begin nog niet op berekend dat online te doen. Het was ook prijzig om er glasvezel te laten ingraven. We noemden het daarom ook wel het Nike-netwerk, omdat we toen de data fysiek moesten ophalen”, zegt de hoogleraar met een lach.
Data verzamelen
Volgens Joost is het verzamelen van zoveel data in een dergelijke lange tijdspanne uniek. Hij bestempelt deze periode als een leerproces van hoe je die data nu het best kan verwerken en hoe je de verschillende tijdschalen het best met elkaar kunt vergelijken. “Hoe ga je bijvoorbeeld om met fouten in de verzamelde data? En wat is het meest voorspellende voor hetgeen je wil weten? Hoeveel vrachtwagens er over de brug rijden? Of meer specifiek hoeveel zwaar beladen vrachtwagens er overheen rijden? Zij zijn er immers de oorzaak van dat een brug op termijn slijt. Als er een te zware vrachtwagen overheen rijdt, trilt de brug nog na. Zegt dat iets over de conditie van de brug? Het is relatief eenvoudig om te detecteren of er files staan, maar het is wat anders als je gaat zeggen of er daadwerkelijk veroudering optreedt bij een brug en of je dan moet ingrijpen.”
Het verwerken, analyseren en vindbaar maken van dagelijks ruim 5 GB aan data van de Hollandse Brug levert volgens Joost Kok allerlei uitdagingen op.
Eenvoudig sensorsysteem
In dit geval hebben we het nog maar over één asset. In het ideale scenario zou je het systeem als geheel willen bekijken. Van micro- naar macroniveau. “Als je over data van alle bruggen in Nederland beschikt, kun je ook zeggen hoe Nederland in beweging is. Bijvoorbeeld hoe het gesteld is met luchtvervuiling of de economie”, is de overtuiging van Joost.
“Het zou mooi zijn als we een relatief eenvoudig sensorsysteem kunnen maken wat we op elke brug en op de wegen daar naartoe kunnen inzetten. Een generiek systeem dat voor elke brug nog wel specifiek gekalibreerd moet worden om specifieke uitspraken over te doen. Ik verwacht dat het hier op termijn naartoe gaat.”
Riolering
Niet alleen bruggen, maar ook het beheer en onderhoud van bijvoorbeeld ons rioleringsstelsel biedt in dat perspectief kansen. Met ruim honderdduizend kilometer aan rioleringsbuizen door ons land is met de inzet van sensoren veel winst te behalen. “Het liefst zou je een slimme buis maken waar sensoren inzitten. Draadloos en bestand tegen de vochtige ondergrondse omgeving. Ik denk dat we dit op termijn kunnen en gaan realiseren. Voorlopig is het echter nog niet kosteneffectief, omdat je de inzet van de sensoren in de productie van de buizen moet meenemen.”
Boeing
Joost noemt een Boeing als voorbeeld. Het vliegtuig wordt volledig in de computer gebouwd en getest voordat hij koers zet naar zonnig oorden. “Dat hele proces, alle simulaties en het nauwlettend elektronisch bijhouden wanneer je onderhoud moet doen, niet te vroeg en niet te laat, is een voorbeeld voor de ingenieurswereld.”
Data is kortom een hele business geworden dat onze wereld vooruit helpt. Aan de andere kant vormt privacy en de inbreuk daarop een niet te onderschatten factor. “We moeten oppassen dat je netjes met data omgaat, anders mag je straks niks meer doen. Er zijn technische hulpmiddelen om dat op een nette manier te doen. Bijvoorbeeld door versleutelingsmechanismen in je presentatie in te bouwen over wie wat te zien krijgen. Ook kun je in plaats van met data zelf werken met kleuren die de status van een wijk duiden. We moeten nog leren daar een balans in te vinden. Als we daar niet goed over nadenken gooien we het kind met het badwater weg.”