Big data: zwarte magie met petabytes
De Gentse big-dataspecialist NGData heeft deze maand 2,5 miljoen dollar kapitaal opgehaald. Waarom is big data zoveel waard en moet je er zelf ook aan beginnen?
NGData is een startend bedrijf dat een tool maakt waarmee bedrijven grote aantallen gegevens analyseren om inzicht te krijgen in het gedrag van hun klanten. Lily heet de software en het haakt in op de trend van big data. Maar wat is big data nu eigenlijk? We vroegen het aan Frank Hamerlink, operationeel directeur bij NGData.
ZDNet: Wat is big data?
Frank Hamerlink: Er zijn twee benaderingen om big data te omschrijven. Vanuit een zakelijk oogpunt kan je big data zien als een manier om met grote hoeveelheden data om te gaan. Vroeger had je in een bedrijf enkel de transactiegegevens en die zaten allemaal netjes gestructureerd in een ERP. Maar nu heb je ook data van het internet en een massa ongestructureerde data in het bedrijf zelf.
De technologische definitie omschrijft big data als een technologie die het mogelijk maakt om gegevens op te slaan en doorzoekbaar te maken zonder ze in een relationele databank te stoppen. Voorbeelden zijn BigTable van Google en Apache Hadoop.
Hoe start je met big data?
Een van de belangrijkste kenmerken van big data is flexibiliteit en dat wil zeggen dat je niet op voorhand al je velden van je databank moet definiëren zoals bij SQL. Je kan achteraf nog kolommen gaan toevoegen aan bepaalde records zonder dat je die gegevens voor elk ander record moet gaan aanvullen.
Om met big data te starten moet je eerst je gegevensbronnen gaan identificeren. Vertrek je vanuit het CRM, een transactioneel systeem en sociale data en later volgt dan een incrementeel proces waarin de data worden aangevuld.
Daarna moet je gaan aggrereren: je gaat gegevens rond een persoon stockeren. Je kan er eigenschappen aan toekennen zoals leeftijd, geslacht, abonneenummer, kredietkaartnummer, relaties van de persoon met producten of met andere personenen, tweets of gedragingen tegenover coupons. In ons bedrijf hebben we daar een geheime methode voor in ons product Lily.
De volgende stap is dan om de gegevens te gaan gebruiken om je zakelijke doelen te dienen. Een webshop kan producten gaan aanbevelen, een site kan ads gaan tonen of je kan er zelfs mee aan fraudebeheer doen.
Welk voordeel kan je als bedrijf halen uit big data?
Ik zal je drie voorbeelden geven uit onze belangrijkste afzetmarkten: financiële wereld, verkoop en media-uitgevers.
Een van onze gebruikers is een bank met klanten die een kredietkaart hebben. Zij hebben met big data een systeem opgezet waarbij ze via de smartphone coupons bezorgen aan de kredietkaarthouders. De coupons kunnen ingeruild worden bij handelaars die ook in het kredietkaartnetwerk zitten. De handelaar bepaalt de aanbieding, gekoppeld aan plaats en tijd. Als een potentiële klant in de buurt van de winkel komt, krijg je korting bij betaling met je kredietkaart.
In de verkoop bedienen we een keten die door overnames is gegroeid en nu een 100.000-tal producten aanbiedt. Lily heeft de productdatabanken en klantendatabanken geaggregeerd. Daardoor heeft de verkoopsketen een online aanwezigheid uitgebouwd met productaanbevelingen op basis van big data. Ze konden marketingcampagnes in één winkel uittesten en daarna in het hele land gebruiken. Dat lijkt wat op business intelligence, maar het is sneller.
Derde voorbeeld is de mediasector. Daar kan je meten hoe lang een video of artikel bekeken wordt. Met die gegevens kan je voorkeuren gaan berekenen en suggesties doen uit veel verschillende bronnen van video en tekst.
Hoe kan je nu weten of je ook big data moet gaan gebruiken voor je bedrijf?
Er zijn drie drempels voor je aan Big Data kan beginnen. Als je er één van de drie overschrijdt, heeft het zin aan big data te doen.
Nummer één: volume. Als je over petabytes aan gegevens spreekt, dan begin je best aan big data te denken. Tweede is de snelheid van verwerking. Als je gigabytes aan data in een korte tijd moet verwerken, dan zullen klassieke methodes van verwerking niet volstaan. Een voorbeeld is een dashboard van een massa transacties. Derde reden is de variëteit aan gegevens. Moet je veel nieuwe producten aan een databank toevoegen bijvoorbeeld.
De Gentse big-dataspecialist NGData heeft deze maand 2,5 miljoen dollar kapitaal opgehaald. Waarom is big data zoveel waard en moet je er zelf ook aan beginnen?
NGData is een startend bedrijf dat een tool maakt waarmee bedrijven grote aantallen gegevens analyseren om inzicht te krijgen in het gedrag van hun klanten. Lily heet de software en het haakt in op de trend van big data. Maar wat is big data nu eigenlijk? We vroegen het aan Frank Hamerlink, operationeel directeur bij NGData.
ZDNet: Wat is big data?
Frank Hamerlink: Er zijn twee benaderingen om big data te omschrijven. Vanuit een zakelijk oogpunt kan je big data zien als een manier om met grote hoeveelheden data om te gaan. Vroeger had je in een bedrijf enkel de transactiegegevens en die zaten allemaal netjes gestructureerd in een ERP. Maar nu heb je ook data van het internet en een massa ongestructureerde data in het bedrijf zelf.
De technologische definitie omschrijft big data als een technologie die het mogelijk maakt om gegevens op te slaan en doorzoekbaar te maken zonder ze in een relationele databank te stoppen. Voorbeelden zijn BigTable van Google en Apache Hadoop.
Hoe start je met big data?
Een van de belangrijkste kenmerken van big data is flexibiliteit en dat wil zeggen dat je niet op voorhand al je velden van je databank moet definiëren zoals bij SQL. Je kan achteraf nog kolommen gaan toevoegen aan bepaalde records zonder dat je die gegevens voor elk ander record moet gaan aanvullen.
Om met big data te starten moet je eerst je gegevensbronnen gaan identificeren. Vertrek je vanuit het CRM, een transactioneel systeem en sociale data en later volgt dan een incrementeel proces waarin de data worden aangevuld.
Daarna moet je gaan aggrereren: je gaat gegevens rond een persoon stockeren. Je kan er eigenschappen aan toekennen zoals leeftijd, geslacht, abonneenummer, kredietkaartnummer, relaties van de persoon met producten of met andere personenen, tweets of gedragingen tegenover coupons. In ons bedrijf hebben we daar een geheime methode voor in ons product Lily.
De volgende stap is dan om de gegevens te gaan gebruiken om je zakelijke doelen te dienen. Een webshop kan producten gaan aanbevelen, een site kan ads gaan tonen of je kan er zelfs mee aan fraudebeheer doen.
Welk voordeel kan je als bedrijf halen uit big data?
Ik zal je drie voorbeelden geven uit onze belangrijkste afzetmarkten: financiële wereld, verkoop en media-uitgevers.
Een van onze gebruikers is een bank met klanten die een kredietkaart hebben. Zij hebben met big data een systeem opgezet waarbij ze via de smartphone coupons bezorgen aan de kredietkaarthouders. De coupons kunnen ingeruild worden bij handelaars die ook in het kredietkaartnetwerk zitten. De handelaar bepaalt de aanbieding, gekoppeld aan plaats en tijd. Als een potentiële klant in de buurt van de winkel komt, krijg je korting bij betaling met je kredietkaart.
In de verkoop bedienen we een keten die door overnames is gegroeid en nu een 100.000-tal producten aanbiedt. Lily heeft de productdatabanken en klantendatabanken geaggregeerd. Daardoor heeft de verkoopsketen een online aanwezigheid uitgebouwd met productaanbevelingen op basis van big data. Ze konden marketingcampagnes in één winkel uittesten en daarna in het hele land gebruiken. Dat lijkt wat op business intelligence, maar het is sneller.
Derde voorbeeld is de mediasector. Daar kan je meten hoe lang een video of artikel bekeken wordt. Met die gegevens kan je voorkeuren gaan berekenen en suggesties doen uit veel verschillende bronnen van video en tekst.
Hoe kan je nu weten of je ook big data moet gaan gebruiken voor je bedrijf?
Er zijn drie drempels voor je aan Big Data kan beginnen. Als je er één van de drie overschrijdt, heeft het zin aan big data te doen.
Nummer één: volume. Als je over petabytes aan gegevens spreekt, dan begin je best aan big data te denken. Tweede is de snelheid van verwerking. Als je gigabytes aan data in een korte tijd moet verwerken, dan zullen klassieke methodes van verwerking niet volstaan. Een voorbeeld is een dashboard van een massa transacties. Derde reden is de variëteit aan gegevens. Moet je veel nieuwe producten aan een databank toevoegen bijvoorbeeld.