‘Social Engineering’ met Big Data.

door Denkerij®

‘Social engineering’ is een technologie die wordt toegepast om samenlevingen te analyseren, te controleren en te verbeteren. De methode maakt gebruik van statistische analyses om kennis over de samenleving te produceren. De resultaten van de analyses krijgen vorm in allerlei grafieken of diagrammen waarin trends, gemiddelden, indexen, steekproeven, kansverdelingen enzovoort zijn weergegeven. De data waarop de weergaven zijn gebaseerd worden verzameld door enquêtes, registraties van statistische bureaus, testomgevingen in laboratoria,  administraties op allerlei gebied, enzovoort. Als deze gegevens eenmaal beschikbaar zijn kunnen ze worden samengevat en gebruikt voor beleid en management. Het CBS bijvoorbeeld verzameld steekproefsgewijs medische gegevens bij huisartsen om te kunnen vaststellen of er bovengemiddelde afwijkingen zijn van de diagnose influenza. Als die er zijn, zal snel moeten worden vastgesteld welk soort virus die afwijking veroorzaakt en met welk tempo het zich verspreidt, om te voorkomen dat er een pandemie ontstaat.

Het probleem hier is, de wijze van verzameling van deze gegevens. Het zijn altijd per definitie historische gegevens. Het resultaat is gemiddelden en indexen.  Ze zijn pas achteraf bruikbaar. Wat ze voorspellen op het moment van publicatie kan in de reële wereld alweer achterhaald zijn. Het proces van sturing van samenlevingen en hun economieën met behulp van de ‘tools’ van de statistiek, als toegepaste ‘social engineering’, heeft zijn langste tijd gehad.

Alex Pentland een vooraanstaand wetenschapper aan het MIT in Cambridge US, stelt in zijn publicaties (waaronder het boek ‘Sociale Big Data’) voor om intensief gebruik te maken van wat hij noemt de Big Data die wij produceren in ons digitale tijdperk. Als we dat gaan doen zoals hij voorstelt, treedt er een grote methodologische verschuiving op in de sociale wetenschap (sociologie en economie). Hij vergelijkt de verschuiving met wat Prometheus de mens bracht toen hij het vuur van de Goden stal. De mens die door de Goden karig was bedeeld om zich te kunnen handhaven in zijn biotoop, kreeg door het vuur (en dus de technologie) een hulpmiddel aangereikt dat hem in staat stelde te overleven. Pentland geeft aan dat de Big Data het moderne vuur zijn waarmee we als mensen in de toekomstige samenleving kunnen overleven en die samenleving mogelijk opnieuw kunnen uitvinden.

Het digitale tijdperk dat in de jaren tachtig volop zijn intrede heeft gedaan in de samenleving is de laatste 10 jaar in een stroomversnelling geraakt. De technologische middelen waarmee we data produceren en kunnen bewaren hebben een omvang bereikt die vergelijkbaar is met de tweede helft van het schaakbord. Deze schaakbord metafoor uit de ‘Second Machine Age’ van Erik Brynjolfsson en Andrew McAfee, collega’s van Alex Pentland aan het MIT, geeft aan dat we op het gebied van dataproductie een omvang aan gegevensverzamelingen hebben bereikt  die we alleen kennen van de deeltjesfysica. Sociale fysica is dan ook de benaming die nodig is om een geëigende wetenschappelijke methode aan te duiden voor het analyseren, beschrijven en duiden van de elementen die de bouwstenen zijn van de hypermoderne samenleving.

Maar niet alleen de hoeveelheid aan data bepaalt het belang voor de prometische omwenteling. Ook de beschikbaarheid van de data in ‘real time’ was tot voor enkele jaren ondenkbaar. Sensoren op plaatsen waar veel publiek verzameld is, maken de nu nog gehanteerde methode via de 1e lijns gezondheidszorg om pandemieën te voorkomen onmiddellijk hopeloos ouderwets. De algoritmen die de data ontcijferen kunnen door de huidige rekenkracht direct afwijkingen van normale patronen berekenen en alarmsignalen afgeven. Net zoals in de ‘dealing rooms’ op de financiële markten koop en verkoop patronen in flash-time zichtbaar zijn, zal binnenkort in een controle kamer van het RIVM op monitoren te zien zijn hoe het met de besmettelijke ziekten in Nederland gesteld is.

De data die wij genereren via allerlei systemen zoals smartphones, wearables, app’s, domotica en publieke sensoren en social media, veroorzaken een stortvloed van informatiedeeltjes die de sociale fysica moet gaan bestuderen en interpreteren. De berg aan data kan met de gewone statistische analyse methoden niet meer worden geduid. Alles wordt statistisch significant vanwege de omvang van de data. De wetenschappers ontbreekt het vooralsnog aan een intuïtie die richting geeft aan de ontwikkeling van algoritmen om significante patronen te herkennen in de databrij. Zoals Pentland het zegt: “Management using Big Data is actually a radically new thing.”

Intussen zijn we volop bezig met het oogsten van data. We vullen silo’s met informatiedeeltjes die zo omvangrijk zijn dat het iedere verbeelding tart. Die data zal op korte termijn een ongekende  economische waarde gaan vormen. Er wordt gesproken over data mining als de nieuwe digitale ‘goldrush’. Daardoor is er al een strijd gaande over het eigendom van de digitale informatie. Is het telefoonbedrijf als provider van de datalijnen van mijn smartphone eigenaar van de data die het beheert en bewaart, de bank omdat ik er een credit card heb, het ziekenhuis dat mijn hartconditie op afstand controleert, David Zuckerberg omdat ik iets of iemand ‘Like’ op Facebook of Larry Page omdat ik op Google heb opgezocht wat de openingstijden van mijn supermarkt zijn?

In een samenleving die zoals het heet ‘Data-driven’ wordt zal de meest cruciale vraag zijn; Wie is de eigenaar van de data? Ben ik als eigenaar van een creditcard, smartphone of pacemaker of gebruiker van Facebook of Google ook eigenaar van de data die ik er mee of er door produceer? Tot voor kort was het toch duidelijk dat de documenten die ik produceer door het gebruik van mijn tekstverwerker ‘Word’ geen eigendom werden van Microsoft. Nu ik ze in de cloud van Microsoft bewaar, is dat wat minder duidelijk. Maar in veel gebruiksovereenkomsten die je op dit moment ‘tekent’ doe je vaak nog afstand van het eigendom van je persoonlijk data. Zeker ook bij de grote entrepreneurs in de era van de social media. Google en Facebook konden zich nog een ‘cowboy’ status permitteren omdat de social media een soort van ‘Wild West’ vormden waar ze zelf de regels konden bepalen. Die tijden zijn voorbij. Zuckerberg c.s. spartelen nog wel tegen maar op plaatsen als bij het World Economic Forum zijn ze het er over eens dat van mij afkomstige data mij ook toebehoort. Ik heb het laatste woord over mijn data en kan dat eigendom beschouwen als een waarde die ik liquide zou moeten kunnen maken. Ik moet kunnen bepalen of ik mijn data wil delen en met wie en voor welke prijs. Dit heeft al geleid tot wetgeving is de US met de ‘Çonsumer Data Bill’ en in de EU tot de ‘declaration on Data Rights’. Het beginsel van privacy dat tot de grondrechten van de burger behoort, moet ook in een digitale wereld overeind kunnen blijven.

Als dit grondrecht op een of andere manier ook technologisch wordt geborgd (en daar zijn aanzetten voor) kan de sociale fysica verder aan de slag met de data die wij produceren. Die fijnmazige data over het menselijk gedrag in groepen en individueel maakt het immers mogelijk om stuurinformatie te vergaren en vervolgens allerlei processen algoritmisch te managen. Er kan zo ‘social egineering’ worden toegepast op de efficiëntie en verbetering van bijvoorbeeld transport en distributie systemen, energie systemen en gezondheidszorg systemen. Met name in de agglomeraties van mensen in wereldsteden met miljoenen inwoners zal het van grote waarde zijn om de systeemfuncties in de toekomst overeind te houden.

De dreiging dat mijn persoonlijke data niet voldoende afgeschermd of geanonimiseerd zullen zijn om gebruikt te worden door de sociale fysica is voorlopig niet alleen denkbeeldig. Er zal een robuust juridisch kader moeten worden ontwikkeld en technologische hoogwaardige dataprotectie zoals in het bankwezen met onkraakbare versleutelingen, wil mijn persoonlijke dataopslag veilig blijven. Ook de overheid zal stappen terug moeten doen door bijvoorbeeld af te zien van het gebruik van de sleepnet technologie waarmee ze nu de datapakhuizen bevist. Het grondrecht van de privacy mag alleen dan worden opgeheven door de overheid, als bij een redelijke verdenking een rechter toestemming heeft gegeven om gebruik te maken van een digitale huiszoeking.