Benford’s Law is het verschijnsel dat in een dataverzameling van getallen de eerste cijfers van deze getallen op een speciale wijze verdeeld blijken te zijn. Je zou wellicht verwachten dat elk eerste cijfer van 1 tot en met 9 een even grote kans heeft om voor te komen, maar dat blijkt niet het geval te zijn.
In werkelijkheid komt het cijfer 1 vaker voor en het cijfer 9 het minst vaak.
Dit kan gebruikt wordt om onregelmatigheden, vervorming van data of frauduleuze handelingen te ontdekken. Door de verdeling van de eerste cijfers van een dataset te vergelijken met de verdeling volgens Benford’s Law kunnen onregelmatigheden ontdekt worden, die verder onderzocht moeten worden.
De ISACA (Information Systems Audit and Control Association) heeft een uitstekend artikel geschreven met een uitleg over het gebruik van Benford’s Law te vinden via de volgende link: https://www.isaca.org/Journal/archives/2011/Volume-3/Pages/Understanding-and-Applying-Benfords-Law.aspx
In deze blog laat ik zien hoe je Benford’s Law toepast in een Power BI dashboard.
Stap 1 Toevoegen Benford’s distributie tabel
Open in Power BI de Query Editor. Maak via New Source een ‘Blank Query’ aan.
Hernoem de query naar Benford’s law/
Start de Advanced Editor.
Voer de volgende code in:
let
Stap1 = Table.RenameColumns(Table.FromList(List.Numbers(1,9), Splitter.SplitByNothing()),{{“Column1”, “Cijfer”}}),
Stap2 = Table.AddColumn(Stap1, “Log10″, each Number.Log10(1+1/[Cijfer]), type number),
#”Renamed Columns” = Table.RenameColumns(Stap2,{{“Log10”, “Verwacht percentage”}})
in
#”Renamed Columns”
Het resultaat is een tabel met Benford’s distributie:
Eerste cijfers bronbestand
Als bron bestand heb ik een auditfile vanuit een financieel administratie pakket gebruikt.
Het bronbestand heet in dit voorbeeld trLine2016:
Stap3= trLine2016,
Middels de optie Add column – > extract -> First character heb ik van elk getal het eerste cijfer in een aparte kolom genaamd ‘Digit’ geplaatst.
Groeperen en tellen van werkelijke aantallen
Met de volgende code groeperen we de getallen in de kolom Digit en berekenen we het aantal keer dat het getal voorkomt in de kolom Actual:
Stap4 = Table.Group(Stap3, {“Digit”}, {{“Actual”, each Table.RowCount(_), type number}}),
Berekenen totaal
In de volgende stap rekenen we het totaal aantal getallen uit, zodat we de verdeling per cijfer kunnen uitrekenen.
Hiervoor gebruiken we de volgende code:
Stap5 = Table.Group(Stap4, {}, {{“AllOccurences”, each List.Sum([Actual]), type number}}),
AllOccurences = Stap5{0}[AllOccurences],
Samenvoegen met Benford’s distributie
In stap 6 voegen we per getal de verwachte waarde volgende Benford’s distributie samen met de werkelijke aantallen per cijfer:
Stap6 = Table.NestedJoin(Stap4,{“Digit”},#”Benford’s law”,{“Cijfer”}, “NewColumn”,JoinKind.RightOuter),
#”Expanded NewColumn” = Table.ExpandTableColumn(Stap6, “NewColumn”, {“Cijfer”, “Verwacht percentage”},
{“NewColumn.Cijfer”, “NewColumn.Verwacht percentage”}),
#”Renamed Columns” = Table.RenameColumns(#”Expanded NewColumn”,{{“NewColumn.Verwacht percentage”, “Verwacht percentage”}}),
Verwachte aantallen
In volgende stap rekenen we de verwachte aantallen per cijfer uit door het totaal aantal getallen te vermenigvuldigen met Benford’s distributie. Onderweg verwijderen we ook twee kolommen die we niet meer nodig hebben.
Stap7 = Table.RemoveColumns(#”Renamed Columns”,{“NewColumn.Cijfer”}),
Stap8 = Table.AddColumn(Stap7, “Verwacht”, each [Verwacht percentage]*AllOccurences, type number),
Stap9 = Table.RemoveColumns(Stap8,{“Verwacht percentage”})
Visualiseren in Power BI
We hebben nu genoeg data om Benford’s Law te visualiseren in Power BI.
Voeg een Bar Line and column stacked visual toe aan het rapport.
Voeg de data velden toe aan de vsualisatie:
- Digit onder Shared Axis
- Actual onder Column values
- Verwacht onder Line Values
Power BI laat nu een mooie grafiek zien van de werkelijke en verwachte verdeling van de eerste cijfers volgens Benford’s Law.
Meer weten over onze oplossingen?
Onze consultants hebben veel ervaring binnen een grote verscheidenheid aan branches.
Eens verder brainstormen over de mogelijkheden voor jouw organisatie?
Maak kennis met onze specialist Arnoud van der Heiden.
Wellicht herkent u een van deze vraagstukken.
Inmiddels hebben wij ruime ervaring opgedaan met Business Intelligence. Wij staan ook u graag te woord bij vragen of opmerkingen.
Business Intelligence (BI) is het technologie gedreven proces van gegevensanalyse dat bedrijven in staat stelt om waardevolle inzichten te halen uit hun gegevens. BI-oplossingen kunnen helpen bij het verzamelen, analyseren en presenteren van bedrijfsgegevens om betere beslissingen te nemen en concurrentievoordeel te behalen.
BI richt zich op het verzamelen, analyseren en presenteren van historische en huidige gegevens om bedrijfsprestaties te meten en te rapporteren. BA daarentegen richt zich meer op het voorspellen van toekomstige trends en mogelijkheden door geavanceerde analysemethoden en -modellen toe te passen op gegevens.
Het gebruik van BI-oplossingen kan bedrijven helpen om hun prestaties te verbeteren, betere beslissingen te nemen en concurrerend te blijven. Het kan hen helpen om inzicht te krijgen in klantgedrag, trends te identificeren, kosten te verlagen, de efficiëntie te verbeteren en nieuwe zakelijke kansen te ontdekken.
Growteq biedt verschillende BI-oplossingen aan, waaronder Power BI van Microsoft, QlikView en Qlik Sense, Tableau en SAP BusinessObjects. Elk van deze oplossingen heeft zijn eigen sterke punten en functies, en kan worden aangepast aan de behoeften van een bedrijf.
Ja, Growteq kan bedrijven helpen bij het implementeren van BI-oplossingen door het bieden van strategisch advies, consultancy en implementatiediensten. Ze werken samen met klanten om oplossingen op maat te maken die aan hun specifieke behoeften voldoen en hen helpen om waarde te halen uit hun gegevens.
De kosten van BI-oplossingen kunnen variëren afhankelijk van de grootte van het bedrijf, de omvang van de implementatie en de gekozen oplossing. Growteq werkt samen met klanten om oplossingen te vinden die passen bij hun budget en behoeften. De voordelen van het gebruik van BI-oplossingen kunnen echter vaak opwegen tegen de kosten, omdat ze bedrijven kunnen helpen om hun prestaties te verbeteren en hun concurrentievoordeel te behalen.
De implementatie van een BI-oplossing omvat meestal de volgende stappen:
- Definiëren van de doelstellingen en vereisten van het BI-project
- Verzamelen en integreren van relevante gegevens uit verschillende bronnen
- Het ontwikkelen van een datawarehouse om de gegevens op te slaan in een logisch model
- Implementatie van dashboards, KPI’s en visualisatie voor gegevenspresentatie
- Training van medewerkers
- Continue monitoring en optimalisatie van de BI oplossing
BI maakt verschillende soorten analyses mogelijk, waaronder:
- Descriptive analyse: Hierbij worden historische gegevens gebruikt om te begrijpen wat er in het verleden is gebeurd.
- Diagnostische analyse: Hierbij wordt onderzocht waarom bepaalde gebeurtenissen of trends zich hebben voorgedaan
- Voorspellende analyses: Hierbij worden gegevens en modellen gebruikt om toekomstige gebeurtenissen en trends te kunnen voorspellen
- Prescriptive analyse: Hierbij worden aanbevelingen gedaan over mogelijke acties op basis van analyse en voorspelling
Enkele populaire BI-tools zijn o.a.:
- Microsoft Power BI
- QlikView
- Qlik Sense
- Tableau
- MicroStrategy
- IBM Cognos
Business Intelligence (BI) kan gegevens uit verschillende bronnen gebruiken, zoals:
- Interne databases en systemen (bijv. CRM-systemen, ERP-systemen)
- Externe gegevensbronnen (bijv. marktonderzoekgegevens, sociale media)
- Gestructureerde gegevens (bijvoorbeeld databases en spreadsheets)
- Ongestructureerde gegevens (bijv. tekstuele gegevens, e-mails, logboeken etc.)
- Big data-bronnen (bijv. sensorgegevens, weblogs)
Growteq heeft ervaring met al deze bronnen.
Selfservice BI verwijst naar het vermogen van niet-technische gebruikers om zelfstandig gegevens te verkennen, te analyseren en rapporten en dashboards te maken met behulp van gebruiksvriendelijke BI-tools. Enkele voordelen van selfservice BI zijn o.a.:
- Verminderde afhankelijkheid van IT-afdelingen voor rapportage en analyses
- Snellere besluitvorming doordat gebruikers direct toegang hebben tot benodigde gegevens
- Verhoogde flexibiliteit en aanpasbaarheid bij het verkennen van gegevens
- Stimuleert gegeven gestuurde cultuur binnen de organisatie
3 reacties. Leave new
What an manual labor required.
I use CaseWare IDEA and there are 7 different tests on digits available on Benford ‘ Law…..
Hi Desmond,
Het is inderdaad wel bewerkelijk.
Ik ken de mogelijkheden van IDEA inderdaad ook. IDEA heeft verder echter weinig visualisatie mogelijkheden. Ten minste niet in de versies waar ik mee gewerkt heb.
In een vervolg blog ook de mogelijkheden van R script in combinatie met Power BI en Benford’s Law laten zien.
Zie http://blog.smartinsight.nu/benfords-law-met-r-script-in-power-bi/