stelletje gegevens

, Radha Ramdan

Ook de analyse van big data deelt weer eens een gevoelige tik uit aan de vrije wil.

Panorama
Canvas, 21.35-22.25 uur

Ruim vijftig minuten lang schotelt The Age of Big Data, een herhaling uit de wetenschappelijke BBC-reeks Horizon, de kijker voor hoe ‘data’ een almaar machtiger product beginnen te worden. Aan de hand van de immense hoeveelheid digitale gegevens die beschikbaar zijn kunnen knappe koppen met computers patronen ontdekken en voorspellingen doen.
De BBC-uitzending roept stellig de associatie op dat ‘data-science’ een harde wetenschap is. Is dat wel zo? We vroegen het Rens Bod, hoogleraar Computational Humanities en directeur van het Center for Digital Humanities aan de UvA. Bod en zijn team houden zich bezig met de grootschalige analyse van data uit de geesteswetenschappen.
‘Data-science beperkt zich niet tot de alfawetenschappen, maar werkt met data van zeer uiteenlopende aard: van astronomische data tot video-security, en van medische data tot e-mails. Data-science stelt nieuwe eisen aan de informatica, hetgeen betekent dat we nieuwe algoritmen moeten ontwerpen die met ‘fuzzy data’ kunnen omgaan, zoals bijvoorbeeld handschriften. In dat opzicht is het een harde wetenschap: we kunnen hypothesen over bijvoorbeeld handschriftherkenning testen tegen data. Maar veel van onze algoritmen verkeren in een ontwikkelingsfase. Dus een volwassen wetenschap is het zeker nog niet.’
In de documentaire zien we hoe politie in LA patrouilles uitvoert en mogelijke verdachten aanhoudt op basis van big data-analyses. Is er een keerzijde aan data-science, bijvoorbeeld op het gebied van de ‘vrije wil’? ‘Zeker, er is een keerzijde, maar die is niet nieuw. Het leger, bedrijfsleven, de wetenschap gebruiken al decennia lang data-analyses bij het bepalen van een strategie. Het probleem is vooral de privacy: als de overheid persoonlijke data zoals e-mails inziet, vindt de meerderheid van de burgers dat onwenselijk. Het onderwerp ‘vrije wil’ is lastig omdat er zoveel kanten aan zitten. Uit ons onderzoek naar menselijke taalmodellen aan de hand van big data, valt voorzichtig te extraheren dat het grootste deel van menselijk (taal)handelen wordt bepaald door matching met massaal opgeslagen eerdere taaldata. Vrije wil en (taal)creativiteit spelen nog slechts een zeer kleine rol, al hebben wij mensen de illusie dat deze wel een grote rol spelen.’