Column


Column Maarten Albregts

Big Data en (Security) Analytics

Big Data kent nagenoeg geen limieten meer. Maar hoe zit het met de security? Security doorkruist alle aspecten van een Big Data-oplossing. Een organisatie die met Big Data-projecten aan de slag gaat, moet hier vanaf het begin rekening mee houden.

Maar laten we eerst eens enkele termen analyseren. Alleen de kop boven deze column bevat al enkele aansprekende high-profile buzz-termen. Met de term Big Data bedoelen we eigenlijk datasets die zo groot zijn dat de mogelijkheid om deze met standaard middelen te verwerken leidt tot een onacceptabele verwerkingtijden en beslag op beschikbare resources. En met Analytics worden deze grote datasets onderzocht op verborgen patronen, verbanden (correlaties) of om tot voorspellende inzichten (predictive analytics) te leiden.

Maar… Analytics, dat is toch niets meer dan old-school statistiek en wiskunde? Regressie-analyse, moving average, Markov-modellen, binaire classificatie, het gaat te ver voor dit artikel, maar het hele analytics is grotendeels hierop gebaseerd. Zelfs de evolutie van analytics met machine-learning- en kunstmatige intelligentie-achtige toepassingen zijn al volop beschikbaar in de bekende clouddiensten: Microsoft biedt Cortana Intelligence, IBM heeft Watson, Amazon heeft de Artificial Intelligence Service. Als Big Data gaat over hele grote datasets, en analytics over wiskunde, wat is dan de buzz of hype?

Technologie is er al
Het IDC-congres over Big Data & Analytics dat op 2 juni plaatsvond in Amsterdam maakte dit meteen al duidelijk: compute- en opslagresources zijn al lang niet meer beperkend in de mogelijkheden en hoeveelheden. De technologie van vandaag de dag is zo krachtig dat al die grote hoeveelheden gegevens met complexe, intelligente algoritmen vaak al realtime geanalyseerd en gevisualiseerd kunnen worden. De Big Data-term uit de definitie van de openingszin is dan ook een contradictie want de standaard middelen zijn inmiddels al geschikt…

Voorheen had je als zelfrespecterend bedrijf een zogenaamd datawarehouse dat zo efficiënt mogelijk was ingericht om ook al grote hoeveelheden gegevens te verzamelen van belangrijke bedrijfsapplicaties (ERP, CRM, et cetera) en daarop Cognos-kubussen los te laten die het management in staat stellen bepaalde beslissingen te nemen waar vooraf over was nagedacht. Een Big Data-oplossing draait tegenwoordig naast het datawarehouse of integreert er zelfs mee. Verzamel bijvoorbeeld beeldmateriaal, documenten, loginformatie, Twitterfeeds, live transactiegegevens, et cetera, in een Hadoop-achtige oplossing en laat daar intelligente analyses op los om tot nog niet eerder bekende inzichten te komen. Een dergelijke Big Data-toepassing is dynamisch, agile en voorspellend, en niet alleen voor het management van een organisatie, het kan alle lagen en processen van een organisatie bedienen.

Vandaag de dag zijn de financiële, producerende en publieke sector leidend met Big Data-oplossingen om op allerlei lagen van de bedrijfsvoering de informatievoorziening en besluitvorming te ondersteunen. De Big Data-oplossingen worden door ondernemingen gebruikt voor digitale transformatieprocessen waarbij met name gekeken wordt hoe contact en binding te houden met de klant (‘engagement’). Motorenbouwer Rolls-Roys verkoopt haar klanten geen motoren meer, maar vlieguren. Dankzij voorspellende analytics kan het onderhoud van vliegtuigmotoren superefficiënt worden uitgevoerd. Een luchtvaartmaatschappij neemt dus vlieguren voor motoren af in plaats van de aanschaf van een motor: airtime-as-a-service. Van traditionele levering van producten naar verdiensting: Everything-as-a-Service!

En security dan..?
We kijken op hoofdlijnen naar twee invalshoeken voor security bij Big Data & analytics:

  • 1.Securityaspecten doorkruisen de infrastructuur, architectuur, integratie en koppeling van databronnen, het beheer van Big Data-oplossingen, et cetera. Of het nu gaat om granulair ingeregelde en beveiligde toegang tot gegevens, privacy van gebruikers en identiteiten, traceerbaarheid van handelingen, compliance, beschikbaarheid en betrouwbaarheid, het komt er allemaal bij kijken. Een organisatie die met Big Data-projecten begint, zal hier rekening mee moeten houden. Vaak wordt een Big Data-project gestart op basis van een specifieke businesscase en voor je het weet haken de vervolgprojecten hierop in. Een betrouwbare, schaalbare en beveiligbare infrastructuur zou by-design opgezet moeten worden.
  • 2.En dan is er nog Big Data & analytics ten behoeve van security: vandaag de dag heeft iedereen wel iets van een SIEM-oplossing die grote hoeveelheden loginformatie inleest en op basis van voornamelijk statische use-cases analyseert. In de evolutie hiervan zien we nu zowel specifieke als generieke security-oplossingen verschijnen die grote hoeveelheden gegevens (‘Big Data’) kunnen analyseren (‘analytics’). Specifieke security analytics-tooling die afwijkingen van gebruikelijke patronen kan herkennen op bijvoorbeeld gebruikers- en netwerkactiviteiten. Dit is niet zozeer Big Data in context van het begin van dit artikel, maar een min of meer kant-en-klare oplossing voor een of enkele specifieke use-cases (bijvoorbeeld Microsoft Advanced Threat Analytics, FireEye Threat Analytics, ForcePoint SureView Analytics of Darktrace). De meer generieke security analytics-platformen evolueren van de traditionele SIEM-producten naar misschien een meer modulair systeem waarbij analytics en artificial intelligence en visulisatie-modules bijgeschakeld kunnen worden.

Big data kent dus nagenoeg geen limieten meer op de compute-, storage- en softwarelagen. Kunstmatige intelligentie (zoals Cortana of Watson) kan online gekoppeld worden via de bekende cloudleveranciers. Databronnen kunnen zowel streaming als batch worden ingevoerd in een Big Data-oplossing. De voorzieningen en mogelijkheden zijn er. Wat dan nog ontbreekt, is de kennis om de informatie verstopt in de Big Data-berg uit te nutten. Kennis is nodig van business intelligence, data-analyse, en mensen die dit alles kunnen inregelen én beveiligen: Datawetenschappers en analisten (wiskundig sterk, verstand van modellering en machine learning-algortimes), data-architecten (verstand van Big Data-infrastructuren en technologieën), business analisten. Misschien word ik wel een Security Data Architect.


Lees meer over