Data analyses uitvoeren als particulier: Het kan vlot en goedkoop met R & Rstudio!
Nicky Van Thuyne - 6 juni 2020
Wie in deze tijd data zegt, denkt onmiddelijk aan big data. Dit buzz woord gaat reeds enkele jaren mee, en heeft nog niets aan kracht verloren. Het is echter zo dat analyses van data vaak gepaard gaan met complexe concepten, en hoge kosten. Dit hoeft echter niet het geval te zijn.
Wie grondig aan de slag wil met data-analyse doet er goed aan naar The R Project for Statistical Computing te kijken. “R” is zeker geen programma waarin je wat rondclickt in menu’s in afwachting van tovenarij, maar het biedt wel veel meer mogelijkheden, controle en flexibiliteit.
Maar wat zijn nu de voordelen van met R te werken? Er zijn er veel, maar ik ga starten met de volgende vier die in mijn ogen het belangrijkst zijn.
1. R is open source.
Dit betekent dat je het gratis kunt downloaden, installeren en gebruiken. Voor programmas zoals Microsoft Office (excel) daarentegen en SPSS (dat ook vaak gebruikt wordt voor dit doel) moet betaald worden. Bovendien wordt R voortdurend door de gebruikers zelf verder ontwikkeld. Specialisten die zelf programmeren stellen hun eigen pakketten ter beschikking en dat opent nieuwe terreinen en instrumenten voor analyse.
2. R is beschikbaar voor verschillende platforms
Namelijk Windows, Apple en Linux. Je downloadt het R basispakket voor jouw operating system en je kunt aan de slag. De code die je schrijft en deelt met een collega die op een ander platform werkt wordt moeiteloos overgenomen, en kan perfect geïntegreerd worden in zijn/haar werkzaamheden.
3. R is uit te breiden met extra pakketten.
Wanneer R is gedownload zijn al een aantal standaardpakketten geïnstalleerd, ruim voldoende voor eenvoudige statistische berekeningen en grafieken. Wil je wat verder? Bijvoorbeeld sociale netwerk analyse, scraping data, of betere grafieken, dan moeten extra pakketten worden gedownload van de zogenaamde cran-servers .
4. Als gebruiker van R sta je er niet alleen voor.
R kent een zeer uitgebreide community, die de software onderhoudt, de handleidingen maakt of voorbeelden van analyse publiceert.
Alleen maar voordelen?
R is zeker geen programma waar je wat rondclickt in menu’s in afwachting van de tovenarij. Je moet zelf opdrachten geven vanaf de prompt in de terminal; van het importeren van je data, het maken van tabel, het berekenen van randtotalen, tot het tekenen van een histogram, een kaart of een regressielijn, het is allemaal ‘command driven’.
Zoals steeds zijn er bedrijven (zoals Rstudio) die tools aanbieden aan de gebruikers om hun ervaring nog vlotter te laten verlopen. Deze interface kan eveneens gratis gedownload worden, en gebruikt door eenieder.
Het werkt heel aardig voor het laden van pakketten, exporteren van grafieken en het werken op een terminal. En de resultaten, kunnen die ook online? Niet met de bekende ‘embedded link, maar met Shiny. Hiermee maak je interactieve webpagina’s van je data en grafieken uit R Studio.
Zoals je ziet, kan je heel wat bereiken met gratis beschikbare tools, maar moet je wel de handen uit de mouwen steken en de stap durven zetten.
Indien je hier nog vragen over hebt, aarzel dan niet om me te contacteren.