In mijn vorige blog (http://blog.smartinsight.nu/fraude-signaleren-met-benfords-law-in-power-bi/) heb ik aandacht besteed aan de mogelijkheden om fraude te signaleren met behulp van Benford’s Law in Power BI. Dezelfde resultaten (en veel meer) zijn nog sneller te realiseren als je gebruikt maakt van R. De programmeer taal R is erg populair onder ‘data-scientists’ en kan gebruikt worden voor allerhande statistische analyses en visualisaties. De analytische mogelijkheden in Power BI kunnen nog verder worden verstrerkt door R scripts te integreren.
In deze blog laat ik zien hoe Benford’s Law met behulp van R in Power BI kan worden uitgevoerd.
Installatie van R
Om R in Power BI te kunnen gebruiken, moet R geïnstalleerd zijn. Via de volgende link kun je de juiste versie van R downloaden: https://mran.revolutionanalytics.com/download/.
Nadat R geïnstalleerd is, moet in Power BI een koppeling naar de home directory van de installatie worden verwezen. Open Power BI desktop en ga naar File -> Options and Settings -> Options.
Zorg dat de juiste R Home directory gekoppeld is:
Toevoegen R Visual
Voeg een R Visual toe aan het report canvas:
Er verschijnt nu een R script editor onder aan het canvas.
Sleep nu het veld waar je Benford’s Law op wilt toepassen naar het Value veld van de R visual:
In de script editor zie je dat Power BI automatisch een R dataset heeft aangemaakt en eventuele dubbele rijen heeft verwijderd.
Het veld dat we in het Value veld van de R Visual hebben toegevoegd (in dit geval het veld amnt), kunnen we nu gebruiken hier als volgt naar te verwijzen: ‘dataset$amtn’.
CRAN Package benford.analysis
R kan worden uitgebreid met heel veel verschillende externe packages waarmee statistische berekeningen kunnen worden uitgevoerd. Voor deze blog maken we gebruik van het package ‘benford.analysis’. Meer informatie is te vinden op de volgende pagina: https://github.com/carloscinelli/benford.analysis
R script
Voer de volgende statements in in de R script editor:
install.packages(“benford.analysis”)
library(benford.analysis)
bfd.cp <- benford(dataset$amnt, number.of.digits=1)
plot(bfd.cp)
Met de eerste stap wordt het externe package geïnstalleerd.
Het tweede statement zorgt ervoor dat het package geladen wordt en dat de functies gebruikt kunnen worden voor de berekeningen.
De derde regel maakt een Benford’s object aan met de resultaten van de analyse. De tweede parameter is hier ingesteld op alleen het eerste cijfer (number.of.digits=1). Dit nummer kan ook aangepast worden naar bijvoorbeeld 2 of 3 waarbij de analyse kijkt naar de eerste 2 of de eerste 3 cijfers.
Het plot statement maakt een aantal visualisaties aan op basis van de Benford’s analyse.
Uitvoeren script
Klik in de zwarte balk van de R script editor op de Run button en het R script wordt uitgevoerd
Resultaten
In het Power BI canvas verschijnen nu vijf visualisaties op basis van de Benford’s Law analyse.
Conclusie
Deze blog heeft laten zien dat Power BI veel mogelijkheden biedt om specifieke algoritmes zoals Benford’s Law op een eenvoudige manier toe te passen. Door gebruik te maken van R code kunnen de mogelijkheden van Power BI om data te analyseren enorm uitgebreid worden.
Meer weten over onze oplossingen?
Onze consultants hebben veel ervaring binnen een grote verscheidenheid aan branches.
Eens verder brainstormen over de mogelijkheden voor jouw organisatie?
Maak kennis met onze specialist Arnoud van der Heiden.
Wellicht herkent u een van deze vraagstukken.
Inmiddels hebben wij ruime ervaring opgedaan met Business Intelligence. Wij staan ook u graag te woord bij vragen of opmerkingen.
Business Intelligence (BI) is het technologie gedreven proces van gegevensanalyse dat bedrijven in staat stelt om waardevolle inzichten te halen uit hun gegevens. BI-oplossingen kunnen helpen bij het verzamelen, analyseren en presenteren van bedrijfsgegevens om betere beslissingen te nemen en concurrentievoordeel te behalen.
BI richt zich op het verzamelen, analyseren en presenteren van historische en huidige gegevens om bedrijfsprestaties te meten en te rapporteren. BA daarentegen richt zich meer op het voorspellen van toekomstige trends en mogelijkheden door geavanceerde analysemethoden en -modellen toe te passen op gegevens.
Het gebruik van BI-oplossingen kan bedrijven helpen om hun prestaties te verbeteren, betere beslissingen te nemen en concurrerend te blijven. Het kan hen helpen om inzicht te krijgen in klantgedrag, trends te identificeren, kosten te verlagen, de efficiëntie te verbeteren en nieuwe zakelijke kansen te ontdekken.
Growteq biedt verschillende BI-oplossingen aan, waaronder Power BI van Microsoft, QlikView en Qlik Sense, Tableau en SAP BusinessObjects. Elk van deze oplossingen heeft zijn eigen sterke punten en functies, en kan worden aangepast aan de behoeften van een bedrijf.
Ja, Growteq kan bedrijven helpen bij het implementeren van BI-oplossingen door het bieden van strategisch advies, consultancy en implementatiediensten. Ze werken samen met klanten om oplossingen op maat te maken die aan hun specifieke behoeften voldoen en hen helpen om waarde te halen uit hun gegevens.
De kosten van BI-oplossingen kunnen variëren afhankelijk van de grootte van het bedrijf, de omvang van de implementatie en de gekozen oplossing. Growteq werkt samen met klanten om oplossingen te vinden die passen bij hun budget en behoeften. De voordelen van het gebruik van BI-oplossingen kunnen echter vaak opwegen tegen de kosten, omdat ze bedrijven kunnen helpen om hun prestaties te verbeteren en hun concurrentievoordeel te behalen.
De implementatie van een BI-oplossing omvat meestal de volgende stappen:
- Definiëren van de doelstellingen en vereisten van het BI-project
- Verzamelen en integreren van relevante gegevens uit verschillende bronnen
- Het ontwikkelen van een datawarehouse om de gegevens op te slaan in een logisch model
- Implementatie van dashboards, KPI’s en visualisatie voor gegevenspresentatie
- Training van medewerkers
- Continue monitoring en optimalisatie van de BI oplossing
BI maakt verschillende soorten analyses mogelijk, waaronder:
- Descriptive analyse: Hierbij worden historische gegevens gebruikt om te begrijpen wat er in het verleden is gebeurd.
- Diagnostische analyse: Hierbij wordt onderzocht waarom bepaalde gebeurtenissen of trends zich hebben voorgedaan
- Voorspellende analyses: Hierbij worden gegevens en modellen gebruikt om toekomstige gebeurtenissen en trends te kunnen voorspellen
- Prescriptive analyse: Hierbij worden aanbevelingen gedaan over mogelijke acties op basis van analyse en voorspelling
Enkele populaire BI-tools zijn o.a.:
- Microsoft Power BI
- QlikView
- Qlik Sense
- Tableau
- MicroStrategy
- IBM Cognos
Business Intelligence (BI) kan gegevens uit verschillende bronnen gebruiken, zoals:
- Interne databases en systemen (bijv. CRM-systemen, ERP-systemen)
- Externe gegevensbronnen (bijv. marktonderzoekgegevens, sociale media)
- Gestructureerde gegevens (bijvoorbeeld databases en spreadsheets)
- Ongestructureerde gegevens (bijv. tekstuele gegevens, e-mails, logboeken etc.)
- Big data-bronnen (bijv. sensorgegevens, weblogs)
Growteq heeft ervaring met al deze bronnen.
Selfservice BI verwijst naar het vermogen van niet-technische gebruikers om zelfstandig gegevens te verkennen, te analyseren en rapporten en dashboards te maken met behulp van gebruiksvriendelijke BI-tools. Enkele voordelen van selfservice BI zijn o.a.:
- Verminderde afhankelijkheid van IT-afdelingen voor rapportage en analyses
- Snellere besluitvorming doordat gebruikers direct toegang hebben tot benodigde gegevens
- Verhoogde flexibiliteit en aanpasbaarheid bij het verkennen van gegevens
- Stimuleert gegeven gestuurde cultuur binnen de organisatie