Meer weten? Neem contact met me op.

Don de Haan (Projectleider)

06-53614213
d.dehaan@optimalesamenwerking.nl
Portfolio Don de Haan

Big Data Expo

9-10-2015 - Don de Haan

Op 1 oktober 2015 was ik met mijn collega’s van Optimale Samenwerking aanwezig op de Big Data Expo in de Jaarbeurs te Utrecht. Omdat de hoeveelheid data in de wereld snel groeit en continue aan verandering onderhevig is kon het geen kwaad mij extra te oriënteren op de mogelijkheden van Big Data. Dit vanuit het oogpunt in hoeverre Big Data complexe samenwerking zou kunnen versterken.
Een tweetal essentiële vragen over Big Data zag ik daarom graag beantwoord:
Wat is Big Data eigenlijk?
Voor wie is Big Data relevant?

Wat is Big Data eigenlijk?

Op de Big Data Expo website vond ik een definitie:

“Men spreekt van Big Data als de hoeveelheid gegevens zo groot en divers is dat ze niet meer te beheren zijn met de tot nu toe gebruikelijke middelen zoals conventionele databases “.

Big Data is duidelijk een containerbegrip en enige categorisatie was mij meer dan welkom. Toch werd het begrip nog verder verruimd door de eerste spreker die wij bezochten, Rick van der Lans (R20/Consultancy). Hij nam stelling in dat ook relationele databases prima Big Data kunnen bevatten. Het gaat volgens hem ook niet zozeer om de structuur of de omvang van de data. Uiteindelijk blijft data gewoon data en het draait allemaal om de analyse. Dit was voor mij op zich niets nieuws, maar de term waar Van der Lans liever over spreekt, “Big Analytics”, werkte toch enigszins als een eyeopener. Maar hoe kunnen we Big Data dan categoriseren?
Grofweg kun je onderscheid maken tussen:
  • Data uit traditionele bedrijfssystemen. Gestructureerde data, vaak opgeslagen in relationele databases. Deze data zou door haar structurele aard goed analyseerbaar zijn
    Voorbeelden zijn : contactregistratie, productie data, logistieke data, dossiervorming, et cetera
  • Data uit sociale netwerken. Enigszins gestructureerde data met beperkt toezicht. Door haar ongestructureerde aard moeilijk analyseerbaar
    Voorbeelden zijn : Blogs, E-Mail, Facebook, Twitter, Youtube, Data van mobiel textverkeer, Zoekopdrachten, et cetera.
  • Internet of Things. Machine gedreven data. Alle technologie zit tegenwoordig vol met sensoren die allerlei zaken meten. De data is zeer gestructureerd maar door zijn omvang, snelheid en veelzijdigheid toch moeilijk te analyseren.
    Voorbeelden zijn : Verkeerssensoren, logbestanden, beveiligingsbeelden, satellietbeelden, koffiezetapparaten, televisies, gps-data, et cetera

Voor wie is Big Data relevant?

Big Data is relevant voor iedere organisatie. En we kunnen er beter nog gisteren dan vandaag beginnen! Dat is de boodschap die elk bedrijf actief in Big Data natuurlijk wil verkopen op een beurs als de Big Data Expo. En het moet gezegd worden: er werden op de beurs een aantal fraaie voorbeelden te geven van hoe Big Data (of Big Analytics zo je wilt) in bepaalde contexten zeer bruikbaar is:
  • Het internationale samenwerkingsverband tussen ziekenhuizen dat miljoenen scans deelt om tot betere analyses te komen
  • De voetbalteams die zuiver op basis van statistiek in plaats van inzichten van scouts of trainers hun teams op Moneyball-achtige wijze inrichten
  • De Rijkswaterstaat die griepstatistieken en filestatistieken combineert om tot een betere planning van hun wegwerkwerkzaamheden te komen
  • De vele webwinkels die aan de hand van jouw koopgedrag en dat van anderen jouw verdere koopgedrag voorspellen / beïnvloeden
  • De analyse van miljoenen mails om spam steeds nauwkeuriger uit te filteren
De Big Data beweging brengt een groeiend aantal succesverhalen voort en Big Data werkt voor veel bedrijven. Met name de sociale netwerken als Twitter en Facebook, retailbedrijven, aanbod gestuurde ketens, logistieke organisaties, oliemaatschappijen en supermarkten kunnen nu al flink profiteren door hun Big Data slim te analyseren. Dit gebeurt dan ook al op grote schaal. Maar gaat dit nu ook gelden voor ketens die klanten bedienen met een complexere hulpvraag? Voor kleinere organisaties? En hoe zit het met organisaties actief in complexe samenwerkingsverbanden? In die gevallen denk ik, zorg dat je je eerst (opnieuw) focust op de dataverzameling en data-analyse uit de traditionele bedrijfssystemen. In de inrichting van deze primaire processen valt nog altijd de meeste winst te behalen. En of je het dan Big Data of gewoon data noemt is mij eender. Ik hoor u denken, “we hoeven dus nog niet écht iets te doen met Big Data!?” Incorrect, u zult u wel degelijk moeten verdiepen. Want oriëntatie bij de registratie van data is altijd belangrijk. Je kunt namelijk alleen data analyseren die je hebt geregistreerd. Stel als organisatie jezelf dus altijd de volgende vragen:
  • Welke data registreer ik nu?
  • Welke data is benodigd om effectief te kunnen sturen?
  • Over welke overige data zou ik willen beschikken?
  • Welke analyses zou ik willen uitvoeren?
  • Hoe registreer ik de data die ik daar voor nodig heb?