Certified Data Science Professional (Big Data / Business Intelligence)
€6580, aangeboden door International Management Forum
Big Data – huidige kennis is onvoldoende
Het thema Big Data staat wereldwijd sterk in de belangstelling omdat er nog nooit zulke hoeveelheden data beschikbaar zijn geweest en nog nooit zo snel nieuwe data werden geproduceerd door mensen en sensoren. Big Data is niet alleen groot, maar ook complex, gevarieerd en in real-time. Zowel de data-infrastructuur als de huidige kennis onder informatici is veelal ontoereikend om met Big Data om te gaan.
Big Data – grote behoefte aan Data Scientists
Een nieuwe functie/rol die snel voet aan de grond krijgt in organisaties is die van Data Scientist met een sterke achtergrond op het gebied van wiskunde en statistiek. De functie Big Data Scientist is in twee rollen te verdelen. Aan de organisatorische kant de Data Detective; de manager/analist die de juiste vragen kan stellen. Aan de technische kant de Hadoop Hacker; de IT-deskundige die Big Data technologieën kan implementeren en onderhouden.
McKinsey voorspelt in een recent rapport dat alleen al in de VS in 2018 een enorm tekort zal zijn aan medewerkers met sterke analytische vaardigheden.
Certified Data Science Professional opleiding – voor wie?
Na Data Warehousing en Business Intelligence wordt Big Data door analisten wel de derde technologische golf genoemd, die inzicht geeft en waarde creëert uit zowel gestructureerde als ongestructureerde data. Deze 10-daagse Certified Data Science Professional opleiding heeft als doel de Business Intelligence professional en informatiespecialist op te leiden tot Data Scientist.
Certified Data Science Professional – opzet van de opleiding
De 10-daagse opleiding Certified Data Science Professional bestaat uit presentaties, documentatiemateriaal, een toolbox, voorbeelden en opdrachten. Aan de hand van een korte presentatie krijgt u een introductie in de concepten. Vervolgens laten de trainers aan de hand van een concreet voorbeeld in python of R zien hoe e.e.a. werkt. U krijgt de beschikking over de DatamineR™ virtual machine op een USB geheugendrager. Dit is een toolbox waarin alle voorbeelden en het cursusmateriaal direct beschikbaar zijn. Na deze opleiding heeft u kennis opgedaan van de meest gebruikelijke data science tools van dit moment (python en R).
Certified Data Science Professional – 10-daagse opleiding plus 2 dagen examen
De Certified Data Science Professional opleiding is een intensieve opleiding bestaande uit 10 lesdagen en 2 examendagen. Ter voorbereiding op het examen moet u rekening houden met opdrachten en huiswerk gedurende de opleiding.
Tijdens de opleiding wordt er in overleg met u een opdracht samengesteld. Deze opdracht vormt een belangrijk onderdeel van uw certificering als Data Scientist. Elke deelnemer presenteert het resultaat van de opdracht aan de andere cursisten en de certificeringsboard.
Het Certified Data Science Professional examen bestaat uit 3 onderdelen. Onderdeel 1 bestaat uit 50 multiple choice vragen die u in 2 uur tijd moet beantwoorden, plus 2 korte programmeeropdrachten (één in python en één in R). Voor de programmeeropdrachten heeft u 2 uur de tijd. Het tweede onderdeel betreft een praktijkcase die u uit dient te werken conform het geleerde. Tot slot wordt in het derde onderdeel van u verwacht dat u uw praktijkcase presenteert. U dient uw stakeholders te overtuigen van de gekozen aanpak.
Certified Data Science Professional (CDSP) – inhoud van de opleiding
De docenten nemen u mee in de wereld van R met R-Studio in de Datamine R™ toolbox. Behandeld worden samples, steekproeven en de meest gangbare hypothese testen.
Als data scientist heeft u kennis nodig van de basisideeën van programmeer concepten voor Big Data. Naast objectoriëntatie zijn ook Big Data concepten als map reduce van belang. Hiervoor wordt gebruikgemaakt van python. Vervolgens krijgt u een introductie in de theorie van het nemen van steekproeven met daarnaast een introductie in Social Network Analysis en visualisatie met Gephi en Mondrian. De trainers introduceren u in de meest gangbare machine learning algoritmen van dit moment. Aan de hand van een classificatietool wordt, in zowel python als R via de CRISP methodologie, langs de stappen gelopen die nodig zijn om tot een voorspellend model te komen.
Een volledige dag zal gewijd worden aan textmining en Natural Language Processing. Met python Natural Language Toolkit (NLTK) worden de mogelijkheden onderzocht voor het analyseren van teksten. In een volledige dag leert u hoe de wereld van Big Data opslag eruit ziet en bent u in staat een keuze te maken voor een van de systemen bij de start van een Big Data project. Daarnaast krijgt u een introductie op web 3.0 semantic search waarin concepten als Resource Descripting Framework en de querytaal SPARQL aan bod komen.
Daarnaast wordt er een volledige dag besteed aan Data Cleaning en GIS. Hoe gaat u bijvoorbeeld om met missing data, outliers, etc.? Hoe visualiseert u de data om snel inzicht te krijgen? Wat kunt u met GIS Openstreet map? Aan de hand van verschillende achterliggende theorieën wordt Data Science in het bedrijf behandeld. Aan bod komen analytics at work, het Delta model en het Maturity model.
Certified Data Science Professional (CDSP) – lesmateriaal
U ontvangt uitgebreid lesmateriaal, 4 boeken, een 8 Gb USB-stick met alle voorbeelden en tools op de Datamine R™ virtual machine.
Certified Data Science Professional (CDSP) – niveau en voorkennis
U heeft geen specifieke voorkennis nodig om succesvol deel te kunnen nemen aan deze Certified Data Science Professional opleiding. De CDSP opleiding is echter behoorlijk pittig en technisch van aard, daarom adviseren wij om pas deel te nemen wanneer u minimaal HBO werk- en denkniveau heeft. Het is een grote pré indien u kennis heeft van en ervaring met de basisprincipes van programmeren en feeling heeft met statistiek. Enige jaren werkervaring in een IT-rol is eveneens aan te bevelen.