Denna online-kurs kommer att introducera dig till olika högprestandaberäkningar (HPC) anläggningar för stora dataanalys. Detta inkluderar R - ett programmeringsspråk känd för sin enkelhet, elegans och samhällets stöd - och Hadoop - en öppen källkod, ramverk Java-baserade programmering för stora datamängder.
Du kommer att få reda på hur man använder dem, undvika vanliga fallgropar och sparar tid och pengar.
Vilka ämnen kommer du täcka?
- Första stegen i R och RStudio
- Att arbeta med Apache Hadoop 1 - Fundamentals
- Att arbeta med Apache Hadoop 2 - RHadoop
- Statistisk lärande med hjälp av RHadoop
Vad kommer du att uppnå?
I slutet av kursen kommer du att:
- Förstå hur prestandan hos moderna superdatorer uppnås
- Förstå de grundläggande funktionerna i Bash terminalfönster
- Förstå de grundläggande funktionerna i Apache Hadoop för skalbar, distribuerad databehandling
- Förstå de grundläggande funktionerna i RHadoop
- Förstå de grundläggande problemen med övervakad och oövervakad inlärning
- Utföra grundläggande klustring, regression och klassificering med RHadoop.
Program taught in:
Denna kurs är
Online