DATA SCIENCE PRACTITIONER
Wat ga je leren?
Het verbeteren van processen op basis van data science.
Het creëren van waarde voor je organisatie vanuit de beschikbare data.
Het doorgronden van de principes van data science en machine learning.
Trainer Dr. Joran Lokkerbol
Joran Lokkerbol is a data scientist and director of the Centre of Economic Evaluation & Machine learning at Trimbos. He specialized in machine learning at Harvard and MIT, and is active as a post-doc at Utrecht University. He is interested in developing methods for targeted prevention in healthcare. Joran trained over 300 professionals in applying data science and improving processes.
Download Brochure
De opleiding:
Bestaat uit 9 modules
Bevat veel data om mee te oefenen
Tijdens deze opleiding werk je aan de implementatie van een Data Science Machine Learning project dat is opgezet en uitgevoerd volgens het CRoss Industry Standard Process for Data Mining (CRISP-DM) model. Je verwerft de basisvaardigheden en knowhow om een Data Science project op te zetten en uit te voeren. Samen onderzoeken we de mogelijkheden om data met behulp van machine learning en andere data science technieken om te zetten in echte waarde. Je leert door te doen, wat inspeelt op de vaardigheden die je nodig hebt om dataprojecten succesvol te implementeren.
Wordt afgesloten met een Data Science Practitioner examen
Vraagt om een investering van 2495 euro (geen BTW)
Richt zich op deelnemers met WO-denkniveau en affiniteit voor data-analyse. Ervaring met programmeren (in wat voor taal dan ook) is een pré. In de opleiding wordt gewerkt met zowel R als Python, gratis beschikbare statistische softwarepakketten. Deelnemers die geen ervaring hebben met programmeren in R of Python volgen voorafgaand aan de opleiding een online tutorial
Is bestemd voor talenten die willen weten hoe je vanuit data échte waarde creëert voor een organisatie
PROGRAMMA
DATA SCIENCE PRACTITIONER
Onderdeel #1
INTRODUCTIE
In dit onderdeel leer je wat data science precies is, welke vaardigheden hiervoor nodig zijn en welk soort statistiek een rol speelt binnen data science. Je maakt kennis met de software die je hierbij kunt gebruiken, en leert op welke plekken je relevante informatie over data science kunt vinden.
ONDERWERPEN
Introductie Data Science
Introductie statistische software
Introductie statistiek
Relevante bronnen
Onderdeel #2
PROJECTDOEL & STRATEGIE
In dit onderdeel leer je hoe je een duidelijk afgebakend data science project selecteert, met een helder verbeterdoel dat bijdraagt aan de doelen van de organisatie. Je leert daarnaast een gericht plan van aanpak waarmee je je data science project uitvoert.
ONDERWERPEN
Predictie versus causaliteit
Projectselectie en -afbakening
Projectfasering
Het starten van een project
Onderdeel #3
DATAVERKENNING
In dit onderdeel leer je het belang van een goed begrip van je data, welke stappen je hiervoor doorloopt en welke doelen je hierbij nastreeft.
ONDERWERPEN
Beschrijvende statistiek
Datavisualisatie
Kwaliteit van data
Bruikbaarheid en beschikbaarheid van data
Verdere projectafbakening
Onderdeel #4
DATAVOORBEREIDING
Ruwe data staan simpelweg nooit in de vorm waarin ze analyses in staat stellen om tot de beste modellen te komen. In dit onderdeel leer je hoe je je data optimaal voorbereidt, zodanig dat je daar zo goed mogelijke modellen mee kunt ontwikkelen.
ONDERWERPEN
Data opschoning
Feature engineering
Onderdeel #6
MODELLERING-ALGORITMES
In dit onderdeel leer je de werking achter een aantal veel gebruikte machine learning algoritmes en hoe je deze traint, interpreteert en optimaliseert.
ONDERWERPEN
Regressie
K Nearest Neighbors
LASSO
Decision trees
Random Forest
Gradient Boosting
Onderdeel #5
MODELLERING-BASISPRINCIPES
In dit onderdeel leer je de basisprincipes die aan elke Machine Learning toepassing ten grondslag liggen.
ONDERWERPEN
Overfitting en regularization
Train- en testdata
Bias-Variance tradeoff
Crossvalidatie
Onderdeel #7
MODELLERING-PERFORMANCE METRICS
In dit onderdeel leer je welke keuzes je hebt bij de bepaling van de specifieke uitkomstmaat die helpt bepalen welk machine learning algoritme het best presteert, en waarom deze zo enorm belangrijk is wanneer je met Data Science daadwerkelijk wilt bijdragen aan de doelen van je organisatie.
ONDERWERPEN
Classification Metrics
Regression Metrics
Confusion Matrix
Onderdeel #8
EVALUATIE
In dit onderdeel leer je hoe je het optimale Machine Learning algoritme selecteert, hoe je kritisch analyseert wat de voor- en nadelen van een algoritme zijn, op welke mogelijke manieren het algoritme kan worden toegepast in de praktijk, en hoe je de ingeschatte baten als gevolg van het gebruik van het algoritme in kaart brengt.
ONDERWERPEN
Beoordeling kwaliteit van het model
Error Analyse
Inschatting baten
Onderdeel #9
IMPLEMENTATIE & NEXT STEPS
In dit onderdeel leer je op welke onderdelen Data Science een rol speelt bij de implementatie van machine learning algoritmen, zoals hoe je monitort of het geïmplementeerde Machine Learning algoritme daadwerkelijk leidt tot verbeterde uitkomsten, en hoe je de kwaliteit van het algoritme waarborgt gedurende het gebruik in de praktijk. Daarnaast staan we stil bij mogelijke ontwikkelingspaden die je zou kunnen doorlopen om verdere ambities te verwezenlijken met betrekking tot het succesvol toepassen van data science.
ONDERWERPEN
Interpreteerbaarheid
Logging
Uitkomst- en inputmonitoring
Modelupdating
Next steps
Jij als succesvolle Data Science Practitioner
Als je de training succesvol hebt doorlopen, presteer je op het niveau van Data Science Practitioner. Je bent in staat om inzichten uit data te halen en deze succesvol te implementeren. Je creëert hiermee waarde voor je organisatie, doordat jij op een manier naar processen en data kijkt, zoals weinig anderen dat doen.
WORD EEN DATA SCIENTIST PRACTITIONER
WAT KRIJG JE?
> 9 ONLINE modules
> een persoonlijk intakegesprek van 45 minuten met Joran Lokkerbol
> een persoonlijk evaluatiegesprek van 45 minuten met Joran Lokkerbol
> indien gewenst coachingsessies
> Praktijkopdrachten, datasets en scripts
> Toegang tot de Data Science Practitioner studiegroep
> Templates
> Een handout van de lessen
> Het Data Science Practitioner examen en eindbeoordeling van je Data Science project
> een persoonlijk intakegesprek van 45 minuten met Joran Lokkerbol
> een persoonlijk evaluatiegesprek van 45 minuten met Joran Lokkerbol
> indien gewenst coachingsessies
> Praktijkopdrachten, datasets en scripts
> Toegang tot de Data Science Practitioner studiegroep
> Templates
> Een handout van de lessen
> Het Data Science Practitioner examen en eindbeoordeling van je Data Science project
(¹) Prijzen Data Science Practitioner
De prijzen zijn inclusief 0% btw en inclusief examen en projectbeoordeling. Voor de opleiding tot Data Scientist Practitioner heb je de software R-Studio of Python nodig. R en Python zijn gratis softwarepakketten, die gebruikt worden voor alle data-analyse en Machine Learning tools. R en Python draaien zowel op Windows als op de Mac.
Examen & scope opleiding
De deelnemer ontvangt een certificaat wanneer:
de machine learning projectdocumentatie voldoet aan de hieraan gestelde eisen en het theoretische examen met een voldoende afsluit.
Je kan het machine learning project tweemaal indienen ter certificering. Na de eerste keer ontvangt je feedback. Bij de tweede beoordeling wordt bepaald of de feedback naar tevredenheid is verwerkt. Het theoretisch examen is een open boek examen bestaande uit multiple choice vragen. Het theoretisch examen vindt twee keer per jaar plaats.
Scope van de opleiding:
Binnen scope: hoe ontwikkel je machine learning modellen op basis van beschikbare data? Hoe bereid je je machine learning algoritme voor op de fase van het in productie brengen?
Buiten scope: hoe ontsluit je data uit de datasystemen? Hoe breng je een machine learning algoritme in productie?