Kom en bekijk de presentatie van Tim Wilson tijdens de DDMA Digital Analytics Summit 2023 op 12 oktober. Tickets zijn beschikbaar via: digitalanalyticssummit.nl.
Hoi Tim, kun je jezelf kort introduceren? Wie bent je en wat doe je?
‘Ik ben een analist. Ik ben een paar decennia geleden min of meer toevallig in de wereld van analytics beland, en sindsdien heb ik in verschillende rollen in de wereld van analytics mogen fungeren. Om iets specifieker te zijn, ben ik een analytics consultant die werkt op het gebied van marketing- en productanalyse, waarbij ik voornamelijk werk met organisaties aan de kant van mensen en processen. Of, om het wat meer in vaktermen uit te drukken, ik werk met bedrijven om hen te helpen hun data in te zetten om doelen te bereiken, in plaats van met hen te werken aan hoe ze hun gegevens verzamelen en beheren.
Op dit moment ben ik even in-between-jobs, omdat ik mijn laatste baan aan het begin van dit jaar heb verlaten om precies uit te zoeken wat ik hierna ga doen (en om nog wat avonturen te beleven met mijn kinderen voor ze het nest verlaten). Dus, “wat ik doe” in analytics in de tegenwoordige tijd is: mede-gastheer en mede-producent van de tweewekelijkse Analytics Power Hour-podcast, mede-organisator van de maandelijkse Columbus Web Analytics Wednesday-bijeenkomst, spreken op verschillende conferenties (zoals Digital Analytics Summit!), content ontwikkelen voor een analytics-boek waaraan ik werk met een voormalige collega, en hier en daar wat analyses uitvoeren om mijn programmeervaardigheden scherp te houden.’
Vanuit je ervaring lijkt het erop dat je consultant bent geweest voor verschillende sectoren, waaronder gezondheidszorg, farmaceutica, detailhandel, consumptiegoederen en financiële diensten. Ziet je duidelijke verschillen in de volwassenheid en strategie van digitale analytics-activiteiten in deze sectoren, bijvoorbeeld met betrekking tot governance?
‘Ik moet een beetje voorzichtig zijn, omdat elk bedrijf waarmee ik heb gewerkt een bedrijf is dat in zekere zin externe ondersteuning op het gebied van analytics heeft gezocht. In theorie hebben zeer analytisch volwassen organisaties – ongeacht hun sector – minder behoefte aan externe ondersteuning.
Dat gezegd hebbende, terwijl de bedrijfsmodellen voor verschillende sectoren variëren, zie ik veel overeenkomsten als het gaat om hun analytics en analytics-volwassenheid. Misschien schilder ik met een te brede kwast, maar elke organisatie heeft het gevoel dat hun gegevens gefragmenteerd en onvolledig zijn. Ze denken vaak dat er meer waarde uit te halen is, en dat er een overvloed aan bruikbare inzichten zal ontstaan als ze gewoon alle juiste datastukjes op hun plaats kunnen krijgen. Veel organisaties – opnieuw, ongeacht hun sector – hebben een groot project met betrekking tot hun datatooling of -infrastructuur in uitvoering: het implementeren van een datalake, het toevoegen van een tool voor klantreisanalyse, het uitrollen van een customer data platform (CDP), migreren naar een nieuwe BI-tool, of zelfs eenvoudigweg overschakelen naar een nieuw digitaal analytics-platform. Vaak zijn deze inspanningen naar mijn mening verkeerd gericht… maar dat is de kern van mijn praatje op de Summit, en ik realiseer me goed dat het een controversiële positie is.
Ik denk wel dat het de moeite waard is om op te merken dat de aard van de gegevens die organisaties in verschillende sectoren hebben, behoorlijk kan verschillen. Zo hebben CPG/FMCG-bedrijven zelden toegang tot data op klantniveau voor hun klanten, aangezien veel van de marketing en verkoop plaatsvindt via kanalen die eigendom zijn van en beheerd worden door hun distributiepartners. Detailhandelaren hebben vaak zowel online als offline verkoopkanalen, dus zelfs als ze gegevens op klantniveau hebben in enige vorm, varieert de aard van die gegevens op basis van het kanaal. Uiteraard kan de gevoeligheid van de gegevens behoorlijk verschillen, zeker nu GDPR en andere regelgeving alle organisaties dwingen om na te denken over persoonlijke gegevens en deze goed te beschermen. De aard van data ligt nu aanzienlijk gevoeliger in bijvoorbeeld sectoren als de gezondheidszorg en financiële dienstverlening, dan in detailhandel of CPG/FMCG.
Dus feitelijk is mijn antwoord vrij standaard en prototypisch voor een consultant: “ja, nee, en het hangt ervan af!”’
Op LinkedIn vermeld je dat je klanten helpt bij het kiezen van algoritmische multitouch-marketingattributiemodellen. Het ooit veelbelovende idee dat deze modellen de heilige graal van attributie zouden zijn, is nog niet waargemaakt. Hoe zie jij dit en hoe zorg je ervoor dat deze modellen in het huidige tijdperk echt werkbaar zijn?
‘Oh, jee. Ik heb klanten geholpen bij het maken van die keuzes, maar dat was altijd onder dwang, omdat multitouch-marketingattributie nooit iets is geweest wat men ervan verwachtte – en dat gaat het ook nooit zijn. Ik heb hele presentaties gegeven en zelfs een uitgebreide Twitter/X-thread over het onderwerp gepost. Om zo beknopt mogelijk te zijn: het fundamentele misverstand is dat multitouch-attributie een middel is voor het “toewijzen van waarde”, maar het wordt behandeld alsof het een instrument is voor het “meten van waarde”. Het laatste is wat marketeers (en analisten) verwachten: hoeveel waarde heeft kanaal X (of subkanaal Y, of campagne Z) geleverd? Het echte antwoord op deze vraag zou een berekening moeten zijn die het totale gerealiseerde inkomen (of welke zakelijke maatstaf dan ook) neemt en daarvan het totale inkomen aftrekt dat is gerealiseerd in een parallel universum waar kanaal X helemaal niet werd gebruikt. In fancy-statistiekspraak is dit het concept van “counterfactuals” (tegenfeitelijkheden). Uiteraard kunnen we niet meerdere universums ervaren, maar er zijn technieken die dit wel op die manier benaderen, zoals gerandomiseerde gecontroleerde testen (RCT’s, of experimenten) en marketing mix modelling (MMM). Multitouch-attributie, ondanks dat het gebaseerd is op algoritmes, is hier niet bijzonder goed in. Een ander mooi voordeel van RCT’s en MMM is dat geen van beide afhankelijk is van het volgen van individuele gebruikers over meerdere touchpoints. Daarmee vervalt een hele reeks privacy-overwegingen – zowel technisch als regelgevend.
Dit betekent niet dat RCT’s en MMM direct de heilige graal zijn. Ze zijn inherent minder gedetailleerd en het kost tijd en moeite om ze te configureren en uit te voeren. Multitouch-attributie heeft zijn voordelen: het is snel en relatief eenvoudig, het kan zeer gedetailleerd zijn (op zoekwoord-, tactiek- of plaatsingsniveau) en het geeft tot op een zekere hoogte aan aan welke activiteiten een reactie genereren. Het laat echter niet zien wanneer een bepaalde reactie een reactie vervangt die zou zijn gebeurd als een tactiek niet is toegepast. Denk aan klikken op betaalde zoektermen die via organische zoekopdrachten zouden zijn gekomen als er niet voor die termen betaald was.
Wat ik opvallend vind, is dat er steeds meer interesse is in RCT’s en MMM, en MMM – dat al lang voor het digitale tijdperk bestond – is bezig met een comeback. Uiteindelijk gebruiken de meest volwassen bedrijven meerdere technieken en gebruiken ze RCT’s en MMM om elkaar en hun multitouch-attributiemodellering te kalibreren.’
Er wordt vaak gezegd dat het veld van digitale analytics snel verandert. Maar is dit echt het geval? We hebben de neiging om vast te houden aan wat we gewend zijn in ons vakgebied. Hoe denk jij hierover als zelfbenoemde Analytics dinosaurus?
‘Laat me eerst mijn dinosaurus-oed opzetten en zeggen dat, zoals Stéphane Hamel onlangs zei, “digital analytics is mostly ‘analytics engineering’” (AKA ’tagging’). Uiteindelijk bestaat het vak weinig uit echte analyses en zakelijke resultaten.” Het is aan de kant van datacollectie dat het vakgebied van digital anlaytics snel evolueert. Het is niet zo lang geleden dat we geen tagmanagers hadden. Daarnaast zijn cookies steeds minder betrouwbaar zijn geworden en zorgen privacyregelgeving en privacybeleid van browsers en besturingssystemen dat we gebruikers steeds minder goed kunnen volgen. Als gevolg klagen specialisten steeds meer over hoe ze harder moeten werken voor steeds minder goede resultaten op basis van de gegevens die ze verzamelen.
Als je kijkt naar hoe data daadwerkelijk wordt gebruikt om zakelijke beslissingen te nemen, is er ook een voortdurende evolutie. Tien jaar geleden dachten maar heel weinig digitalanalisten aan SQL, Python of R als tools die ze in hun gereedschapskist moesten hebben. Hoewel er nog steeds (te) veel analisten zijn die zich verzetten tegen die evolutie, geloof ik echt dat ze hun carrièregroei hiermee beperken. Steeds vaker (en dit is niet bijzonder nieuw), ontdekken organisaties dat ze moeten werken met gegevens uit verschillende bronnen, en dat betekent vaak ze het extraheren van data via API’s combineren met het werken met data die is ondergebracht in een enterprise-grade database, zoals BigQuery, Azure, AWS, of iets anders. Gepaard met die “bredere sets van data” gaat vaak het samenwerken met data scientists. Dat opent op zijn beurt weer de deur naar slimmer, beter en dieper nadenken over verschillende analytische technieken. Ik was met stomheid geslagen toen ik door dit soort samenwerkingen kennis maakte met verschillende nieuwe concepten en technieken: counterfactuals (die ik eerder al noemde), het uitsplitsen van tijdreeksen, stationariteit, eerste verschillen en bayesiaanse structurele tijdsreeksen. Deze zijn enorm nuttig en ze zijn allemaal veel, veel eenvoudiger uit te voeren met een programmeertaal als R of Python. Dit is echt een ontwikkeling die draait om het samenbrengen van beproefde technieken uit andere vakgebieden – econometrie, sociale wetenschappen en elders – in de wereld van digitale analytics.
En natuurlijk gaat AI ook een rol spelen in ons vakgebied. Mijn gevoel is dat het zowel ondergewaardeerd als overgewaardeerd wordt – misschien wel verkeerd begrepen? Er zijn meer dan genoeg mensen met sterke Meningen over dat onderwerp, dus daar laat ik het even daarbij.
Al met al denk ik dat snelle evolutie een redelijk accurate beschrijving is van wat er gebeurt in digital analytics. Soms goede ontwikkelingen, sommigen echt niet.’
Wat zijn de trends en ontwikkelingen waar digitaleanalytics-professionals zich de komende jaren echt op moeten richten binnen het vakgebied?
‘Er is vrijwel zeker een kloof – mogelijk een enorme – tussen waar de industrie zich op gaat richten en waarvan ik denk waarop-ie zich zou moeten richten. Ik ben niet arrogant genoeg om te beweren dat ik absoluut gelijk heb, maar de grootste trend die ik zie die aan de industrie wordt opgelegd, is een afname van de beschikbaarheid van data op persoonsniveau. Zowel vanuit wetgeving als als technologie drijven organisaties steeds verder weg van het streven naar een “360-graden beeld van de klant”. Dat ‘nirvana’ was nooit op grote schaal haalbaar, maar organisaties zijn zich er steeds meer van bewust dat dit het geval is.
Wat ik graag zou zien als reactie van de analytics-industrie op deze realiteit, is tweeledig.
Ten eerste wil ik dat we stoppen met het behandelen van complete gegevens op gebruikersniveau als een analytisch doel op zich en in plaats daarvan onvolledige en geaggregeerde data bestempelen als volkomen adequaat en bruikbaar. Dit betekent dat we comfortabel moeten worden met de probabilistische aard van analytics – we moeten het zoeken naar een “objectieve waarheid” vermijden en in plaats daarvan onze rol zien als het “verminderen van onzekerheid in dienst van het nemen van beslissingen”. Dit vereist een verandering in de mentaliteit van analisten en een verandering van mentaliteit van onze zakelijke collega’s. Een ambitieuze missie, maar ik hoop dat we hier wel naartoe gaan bewegen.
Ten tweede hoop ik dat we gaan beseffen hoe gemakkelijk het is om verstrikt te raken in de technische uitdagingen van dataverzameling en –beheer. Dat we actief weerstand gaan bieden aan deze neiging en ons gaan concentreren op hoe we verzamelde data écht kunnen gaan inzetten. Het is altijd makkelijk om meer gegevens te verzamelen of een ander dashboard uit te rollen dan om onze mouwen op te stropen, de grootste problemen en uitdagingen van het bedrijf te identificeren en vervolgens de meest effectieve en efficiënte manieren te bedenken waarop we data (analytics, experimenten, onderzoek) kunnen gebruiken om het bedrijf vooruit te helpen.
Dit zijn, geef ik toe, behoorlijk ambitieuze doelen, maar ik denk dat we er echt naartoe moeten als we ons vakgebied niet willen neerzetten als louter een kostencentrum dat grafieken maakt.’
Kunt je een voorproefje geven van wat u zult bespreken op de Summit?
‘Je hebt me min of meer voorbereid op deze vraag met de vorige vraag! Tijdens de Summit ga ik in op het idee dat al het datagerelateerde werk kan worden verdeeld in twee afzonderlijke categorieën: dataverzameling en –beheer aan de ene kant, en datagebruik aan de andere kant. Ik betoog dat, ondanks het gemak van het toekennen van waarde aan datacollectie, dit eigenlijk niet het geval is. Het verzamelen en beheren van data biedt alleen het potentieel voor zakelijke waarde. Om daadwerkelijk zakelijke waarde te realiseren, moeten we dingen doen met die data, en het is naïef of onverantwoordelijk (of beide) om van onze zakelijke collega’s te verwachten dat ze de volledige last daarvan dragen. Ik ga specifiek in op enkele krachtige krachten die ons (en onze zakelijke collega’s) aandrijven die deze denkwijze stimuleert. Vervolgens geef ik (kort) een raamwerk bieden om data zinvol te gebruiken.’