KENNIS IS   MACHT !
Gespecialiseerde ACTIEGROEP voor beroepschauffeurs en chauffeuses

TRANSPORTEFFECT

Terug klik hier
‘Data-analyse wordt te ingewikkeld voor bestuurders’
Analyses van big data worden steeds ingewikkelder, waardoor bestuurders soms verantwoordelijk zijn voor algoritmes die ze niet begrijpen. Dat kan grote financiële consequenties hebben, van boetes tot reputatieschade.

Die waarschuwing geeft Sander Klous, hoogleraar Big Data Ecosystems aan de Universiteit van Amsterdam en leider van het Big Data Analytics-team bij KPMG. Klous is naar eigen zeggen al meerdere malen benaderd door bestuurders, die niet zeker wisten of ze zich wel aan de wet hielden met de algoritmes die ze gebruikten.
Ter illustratie van de mogelijke risico's verwijst Klous naar een algoritme van het Amerikaanse ministerie van Justitie. Dat voorspelde de waarschijnlijkheid dat een gevangene die op vrije voeten kwam, opnieuw in de fout zou gaan. Toen de website Propublica dat algoritme nader onderzocht, bleek huidskleur een van de bepalende factoren in het algoritme te zijn. 'Als bedrijf kun je flink in de problemen komen als blijkt dat je bedrijfsvoering is gebaseerd op een zelflerend algoritme dat discriminerende keuzes maakt.’

Hoe kun je zo’n situatie voorkomen?

‘Door te begrijpen wat de algoritmes in je data-analyse berekenen. Dat kan bijvoorbeeld met open source software. Dat geeft je vrije toegang tot de bronmaterialen van de software en daarmee kun je dus onder de motorkap van een algoritme kijken. Vijftien jaar geleden wilden bedrijven niks met open source te maken hebben, maar je merkt dat het steeds belangrijker wordt.’
‘Uiteindelijk gaat het erom dat je te vertrouwen bent, zodat klanten, partners en medewerkers het idee hebben dat de analyses betrouwbaar zijn en aan ethische standaarden voldoen, maar ook dat je analyses uitvoert waar de klant op zit te wachten.’
Is betrouwbaarheid de grootste uitdaging voor bedrijven op het gebied van big data?
‘Het is een van de grote uitdagingen. Een andere is dat er steeds meer partijen betrokken zijn bij data-analyses, waardoor er big data ecosystemen ontstaan. Dat maakt het soms verwarrend wie er verantwoordelijk is voor wat. Als er bijvoorbeeld een zelfrijdende Tesla achterop een vrachtwagen rijdt, is Tesla dan verantwoordelijk voor dat ongeval, of de leverancier van het zelfrijdende algoritme, of toch de passagier die ondanks de automatische piloot beter had moeten opletten? Vermoedelijk is het antwoord: allemaal een stukje. Maar dan is weer de vraag: hoe groot is dat stukje?’
Los van de verantwoordelijkheid, lijkt het me al een uitdaging om zo’n data-analyse met meerdere partijen op te zetten. Hoe gaat dat in zijn werk?
‘Je moet goede afspraken maken over wie wat doet. Vergelijk het met een klassieke toeleveringsketen. De een levert de ruwe materie, de ander maakt er een halffabricaat van en een derde assembleert dat tot een eindproduct. Alleen bij data-analyses kan een bedrijf in het ene geval leverancier van ruwe data kan zijn en in het andere geval degene het eindproduct samenstelt.’
Kunt u een voorbeeld geven van zo’n big data ecosysteem?
‘Een in het oog springend voorbeeld is de logistiek. Daar heb te maken met vervoerders die vracht van A naar B brengen en bedrijven die hun vracht van A naar B willen verplaatsen. De klassieke logica is dan om de data van de vervoerders te koppelen aan de data van de bedrijven die vervoer nodig hebben. Maar je kan ook een stap verder gaan door informatie te gebruiken van bedrijven die vracht van B naar A willen sturen. Daarmee voorkom je dat de vervoerders met een lege vrachtwagen terugrijden.’
‘Nog efficiënter wordt het als je behalve vrachtwagens ook luchtvracht en scheepvaart meeneemt in de berekening. Maar dan moet je wel een aantal problemen oplossen, want je hebt te maken met commercieel gevoelige data van bedrijven die vaak tegengestelde belangen hebben. Die willen hun data niet met elkaar delen, tenzij ze er zeker van zijn dat de concurrent geen gegevens kan inzien. Daarom heb je een derde partij nodig die al die data anoniem bij elkaar brengt en analyseert.’
Hoe belangrijk is privacy in dit soort data-ecosystemen?
‘Heel belangrijk, zeker in een sector als de zorg. Veel artsen hebben geen haar op hun hoofd die eraan denkt om gegevens over hun patiënten ergens anders onder te brengen dan in hun eigen ziekenhuis. Maar als je een ziekte goed wil analyseren, dan heb je soms wel tienduizend gevallen nodig. Zeker als je wil uitsplitsen naar leeftijd, geslacht, opleidingsniveau et cetera. Dan moet je dus platformen inrichten waar anoniem data uit verschillende ziekenhuizen kan worden geanalyseerd. Vervolgens worden alleen de eindresultaten gedeeld met de ziekenhuizen.’
Waar ziet u op dit moment het grootste obstakel bij bedrijven voor het invoeren van een gedegen data-analyse?
‘Organisaties zijn vaak te hiërarchisch. Wil je als bedrijf veel met data-analyse gaan werken, dan zul je meer als een it-bedrijf moeten gaan werken, die termen gebruiken als lean, agile en scrums. Waar het op neerkomt is dat je een data-analyse nooit in één keer goed krijgt. Je moet dus werken met korte cycli van bijvoorbeeld twee weken. Daarmee zet je kleine stapjes die de analyse steeds ietsje beter maken dan voorheen.’










Artikel FD Joep Westerveld