Wat is datamining en hoe kun je het toepassen in je bedrijf?

Data helpen je om betere beslissingen te nemen. Daardoor is ‘datagedreven’ een soort toverwoord geworden en schieten datamining-tools als paddenstoelen uit de grond. Deze software verschaft je de broodnodige business intelligence om problemen op te lossen, risico’s te beperken en nieuwe businesskansen te ontdekken. We leggen uit wat datamining precies is en hoe je het kunt toepassen binnen je bedrijf.

Datamining heeft de laatste jaren snel aan importantie gewonnen. Sinds een jaar of tien maken veel bedrijven gebruik van de kracht van big data, oftewel gigantische datasets met voornamelijk ongestructureerde data. In combinatie met de ongekende rekenkracht van computers vandaag de dag én de beschikbaarheid van superslimme machine learning- en AI-algoritmes, kunnen bedrijven data relatief gemakkelijk omzetten in bruikbare inzichten.

Wat is datamining?

Datamining is het analyseren van grote datasets om afwijkingen, patronen en correlaties te vinden die kunnen worden gebruikt als business intelligence. Het doel is om ruwe data om te buigen tot bruikbare inzichten, die kunnen helpen om problemen op te lossen, risico’s te beperken en nieuwe mogelijkheden te ontdekken. 


Datamining betekent zoveel als ‘gegevens delven’. De analogie met de mijnbouw is duidelijk: uit een hele berg ruw materiaal delf je de verborgen stukjes met waarde.

Datamining: betekenis voor je bedrijf

Datamining kan van grote betekenis zijn voor je bedrijf. Data zijn de nieuwe olie, wordt vaak gezegd. Datagedreven bedrijven worden inderdaad voortgestuwd door de inzichten die ze halen uit gegevens. Hoe sneller ze inzichten extraheren uit big data, hoe beter de beslissingen worden die ze nemen. Omdat datagedreven bedrijven het verleden en het heden begrijpen, kunnen ze beslissingen nemen die de tand van de toekomst doorstaan.

 
Als bedrijf kun je op verschillende manieren profiteren van datamining. Zo kun je er vragen mee beantwoorden die vroeger onbeantwoord bleven, bijvoorbeeld omdat het toen te tijdrovend was om uit te zoeken of omdat de data simpelweg niet beschikbaar waren. Door big data en slimme algoritmes kun je voorspellen wat er waarschijnlijk gaat gebeuren (‘predictive analytics’) en beslissingen nemen die daar op inspelen. Oftewel: dankzij gedolven datajuwelen krijg je een concurrentievoordeel omdat je meer weet over klanten, effectievere marketingstrategieën ontwikkelt en operationele kosten verlaagt.


Lees ook: Datagedreven werken biedt bedrijven veel voordelen

Datamining: how to?

Wil je met datamining aan de slag gaan? Stel jezelf dan eerst de vraag: welke businessgerelateerde vraag hebben we eigenlijk? Op basis daarvan ga je verder nadenken over het verzamelen en analyseren van de juiste data. Vervolgens is het belangrijk om uit te zoeken of de hoeveelheid data die je ter beschikking hebt voor je analyse groot genoeg is om algemene uitspraken mee te kunnen doen.

 
Grofweg volg je het volgende stappenplan:

  1. Begrijp je business. Snap je je eigen business niet, dan weet je niet welke vragen je moet stellen en welke data je nodig hebt.

  2. Begrijp je data. Stel vast welke data je nodig hebt om het probleem op te lossen en verzamel de data uit al je bronnen.
  3. Bereid de data voor. Zorg dat de data in het juiste formaat zijn en herstel problemen rondom datakwaliteit zoals ontbrekende of dubbele data.
  4. Ga modelleren. Gebruik algoritmes om patronen binnen de data te herkennen.
  5. Evalueer de resultaten. Zoek uit of en hoe resultaten die afkomstig zijn uit een model helpen om een bepaald businessdoel te bereiken.
  6. Verzilver de data. Stel de data beschikbaar aan de decisionmakers.

Technieken en uitdagingen

Voor datamining wordt een breed scala aan technieken en technologieën gebruikt om de data te kunnen analyseren. Een aantal voorbeelden:

  • Machine learning: met deze vorm van kunstmatige intelligentie kunnen computers statistische waarschijnlijkheden leren zonder dat ze daarvoor geprogrammeerd zijn.
  • Association rule learning: het zoeken naar relaties tussen variabelen in een dataset.
  • Opschonen van data: fouten en ontbrekende data worden geïdentificeerd en verwijderd om de datakwaliteit te verbeteren.
  • Beslisboom: het classificeren of voorspellen van mogelijke uitkomsten op basis van een set van beslissingen, waarbij via een boomachtige visualisatie de mogelijke uitkomsten van de beslissingen worden gerepresenteerd.

Datamining is bepaald geen kinderspel, er spelen tal van uitdagingen. Goede implementatie is bijvoorbeeld complex; je hebt data-analisten en data scientists nodig om de juiste oplossing te kiezen en implementeren in je organisatie. Het succes is bovendien afhankelijk van de datakwaliteit: slechte gegevens leiden tot slechte resultaten (‘garbage in, garbage out’). Verder moet je ervoor waken dat er verbanden worden gelegd die er niet zijn, bijvoorbeeld doordat bepaalde gegevens niet gevonden of juist bewust genegeerd worden. Zorg er tot slot voor dat de dataminers nauw samenwerken met vakinhoudelijke experts zodat de dataminingresultaten aansluiten bij de businessvraag.


Lees ook: Machine learning vs deep learning: wat zijn de verschillen?

Toepassingen van datamining

Datamining kan succesvol worden toegepast in alle commerciële sectoren en daarnaast voor onder meer wetenschappelijke, journalistieke, medische en zelfs militaire doeleinden. Binnen sales en marketing kun je bijvoorbeeld op basis van historische klantprofielen onderzoeken welke prospects waarschijnlijk klanten worden, hoe je cross-selling en up-selling verbetert en hoe je de klanttevredenheid verhoogt. 


Air France KLM gebruikt datamining onder meer om een 360-gradenblik op klanten te krijgen. Gegevens uit zoekopdrachten voor trips, boekingen en vluchtgegevens alsmede data uit interacties met het web, social media en callcenters worden geïntegreerd om persoonlijke reiservaringen voor klanten mee te creëren.

Tools voor datamining

Datamining-tools zoeken gericht naar statistische verbanden in grote datasets. De software speurt naar afwijkingen, patronen en correlaties en kan daar modellen van maken. Nieuwe data worden vervolgens met zo’n model geanalyseerd om snel afwijkingen te kunnen signaleren. 
Omdat de markt voor datamining booming is, schieten de datamining-tools als paddenstoelen uit de grond. Bekende datamining-platformen zijn bijvoorbeeld SAS Visual Data Mining and Machine Learning, IBM Watson Discovery, RapidMiner Studio en Alteryx. Ga je een platform uitkiezen voor je bedrijf? Let er dan op dat de tool het traject van a tot z bestrijkt, van dataverkenning tot het produceren en visualiseren van inzichten. De tool moet bovendien zijn te integreren met alle relevante systemen: ERP, CRM, finance, business intelligence, enzovoort. Tot slot: zorg ervoor dat het platform niet alleen voldoet aan de behoeften van IT, data scientists en analisten, maar dat het ook de businesskant van de organisatie een plezier doet, dankzij mogelijkheden van rapporteren en visualiseren.

Gerelateerde artikelen