Read the Official Description

Denna online-kurs kommer att introducera dig till olika högprestandaberäkningar (HPC) anläggningar för stora dataanalys. Detta inkluderar R - ett programmeringsspråk känd för sin enkelhet, elegans och samhällets stöd - och Hadoop - en öppen källkod, ramverk Java-baserade programmering för stora datamängder.

Du kommer att få reda på hur man använder dem, undvika vanliga fallgropar och sparar tid och pengar.

Vilka ämnen kommer du täcka?

  • Första stegen i R och RStudio
  • Att arbeta med Apache Hadoop 1 - Fundamentals
  • Att arbeta med Apache Hadoop 2 - RHadoop
  • Statistisk lärande med hjälp av RHadoop

Vad kommer du att uppnå?

I slutet av kursen kommer du att:

  • Förstå hur prestandan hos moderna superdatorer uppnås
  • Förstå de grundläggande funktionerna i Bash terminalfönster
  • Förstå de grundläggande funktionerna i Apache Hadoop för skalbar, distribuerad databehandling
  • Förstå de grundläggande funktionerna i RHadoop
  • Förstå de grundläggande problemen med övervakad och oövervakad inlärning
  • Utföra grundläggande klustring, regression och klassificering med RHadoop.
Program taught in:
Engelska
FutureLearn

See 257 more programs offered by FutureLearn »

Denna kurs är Online
Startdatum
Open Enrollment
Duration
5 veckor
Deltid
Pris
Free
Deadline
By locations
By date
Startdatum
Open Enrollment
Slutdatum
Application deadline

Open Enrollment

Location
Application deadline
Slutdatum