Je hebt het wellicht al eerder gelezen: data zijn ‘het nieuwe goud’. Dat goud schittert evenwel enkel ten volle wanneer je het correct weet op te delven. Wij gingen na waarom je propere gegevens – clean data – best bij de bron verzamelt en hoe ze de boekhouder helpen om zijn promesse als echte partner van de ondernemer waar te maken.
De moderne boekhouder omarmt vandaag alle digitale tools die hem de nodige inzichten bieden. Hij spitst zich niet enkel toe op de louter boekhoud-technische aspecten, maar staat ook als adviseur aan de zijde van zijn klanten. Hij helpt hen beslissingen te onderbouwen en een juiste cashflowplanning op te stellen aan de hand van actuele en exacte financiële informatie. Onjuiste, ongestructureerde of onvolledige data leiden daarbij onvermijdelijk tot verkeerde conclusies, met alle gevolgen van dien. Naarmate de complexiteit stijgt, nemen de uitdagingen en mogelijke risico’s op het vlak van datakwaliteit bovendien nog toe.
Propere data
Datakwantiteit is dus één ding, maar het is vooral datakwaliteit die organisaties een toegevoegde waarde biedt. Grote bedrijven investeren daartoe fors in data scientists, terwijl binnen kleinere organisaties het (chronologisch) ordenen, filteren en corrigeren van data deel uitmaakt van het lijvige pakket van de (externe) boekhouder. Wat ons betreft, kan het anders en beter. Wie van bij het begin de juiste clean data binnenhaalt, zet meteen een belangrijke stap richting een gestroomlijnde taakuitvoering. Op die manier bespaar je heel wat tijd, moeite en frustraties (lees: kwartaalstress).
Data staan dus best bij de bron al op punt. In de realiteit loopt er op dat vlak helaas nog één en ander fout. Facturen bereiken ons via een kluwen van kanalen zoals e-mail, leveranciersportalen en papieren post. De aanlevering van rekeninguittreksels gebeurt eveneens nog te vaak op papier of als pdf. Dat resulteert in een langere verwerkingstijd en een hogere foutmarge. Neem gerust zelf de proef op de som en registreer hoeveel tijd je kantoor spendeert aan het aanzuiveren van onvolledige of onduidelijke factuurinformatie. Het resultaat biedt ongetwijfeld stof tot nadenken.
Digitale facturen
Uniformiteit geldt bijgevolg als een belangrijke voorwaarde voor goeie data. Digitale facturatie biedt hier via het beveiligde Europese netwerk Peppol een antwoord op. Het maakt het mogelijk om facturen in UBL-formaat volgens een vastgelegd protocol te versturen. Alle verzonden en ontvangen facturen voldoen automatisch aan een aantal vaste vormvereisten, waardoor je niet langer achter ontbrekende of onduidelijke informatie hoeft aan te hollen. Onze dienst CodaBox maakt als gecertifieerd access point gebruik van het Peppol-netwerk voor elektronische facturatie.
Beperkingen van OCR en data scraping
Voor het oogsten van digitale data treden OCR en data scraping vaak op het voorplan.
OCR, ofwel Optical Character Recognition, herkent op een snelle wijze relevante gegevens op papieren documenten en zet die om in een bewerkbaar digitaal formaat. Na het inscannen ‘ziet’ de OCR-software dus bepaalde lettercombinaties en bepaalt ze of het om een specifiek veld gaat, zoals een totaalbedrag of btw-nummer.
Data scraping laat scripts los op mailboxen, platformen en websites, op zoek naar facturen en betaalbewijzen. Het is een manier om data te extraheren, te analyseren en vervolgens gestructureerd weer te geven in een eigen databank.
Ondanks de knappe technologieën die erachter schuil gaan, kennen beide vormen hun beperkingen. OCR genereert automatisch data uit digitale facturen, zoals de factuurdatum en het factuurbedrag. Het probleem dat zich hierbij stelt, is dat OCR bepaalde data niet altijd even goed leest of die zelfs fout interpreteert. OCR vraagt net als data scraping een manuele verificatie, wat haaks staat op het beoogde gebruiksgemak. Beide technologieën schieten op het vlak van data management hun doel dus enigszins voorbij.
Wat met gratis data?
Zelf op pad gaan om data op te halen of ze via een datapartner genereren? Het kan natuurlijk. Maar als iets te mooi lijkt om waar te zijn, betaalt er uiteindelijk altijd wel iemand de rekening: de boekhouder of de ondernemer. Bovendien stel je zowel jezelf als je klanten langs die weg bloot aan foute informatie, datalekken of cyberaanvallen. Het beperkte financiële voordeel van gratis data berokkent je kantoor dus mogelijk aanzienlijke financiële schade en een onherstelbare reputatiedeuk. Je gaat best altijd uitvoerig na of je ook echt op je datapartner kunt bouwen.
Snelheid en totaalbeeld
Naast correctheid geldt ook snelheid als een belangrijke voorwaarde voor datagedreven advies. Je voedt de dashboards binnen je boekhoudpakket idealiter met de meest actuele data, onder meer op het vlak van betalingen, inningen en cashpositie. Een snelle ontvangst van documenten vormt daartoe een cruciale factor. Het principe van clean data is van belang bij tal van gegevensstromen: van bankafschriften, over facturatiedata, tot loongegevens. Enkel wie een helikopterkijk hanteert, signaleert tijdig alle opportuniteiten en valkuilen.
Een optimale datakwaliteit verhoogt de wendbaarheid, competitiviteit en efficiëntie van een organisatie. Datahygiëne begint bij de bron: door informatie op de meest aangewezen manier te verzamelen, werk je met correcte, pure data en ben je gevrijwaard van een intensief datazuiveringsproces achteraf.