4 godziny szkolenia, które jest wprowadzeniem do platformy Hadoop.
Lekko, bez nadmiernych dygresji i gór informacji. W sam raz na pierwszy rzut oka.
Czego się nauczysz
Trudno przecenić rolę platformy Hadoop dla dzisiejszego świata i narzędzi Big Data. W trakcie warsztatu postaramy się określić czym jest Big Data, opanujemy podstawy platformy Hadoop ze szczególnym uwzględnieniem rozproszonego systemu plików HDFS, managera zasobów YARN oraz silnika przetwarzania danych MapReduce.
Dla kogo jest ten warsztat
Warsztat przeznaczony jest dla osób chcących zapoznać się z podstawami najważniejszej platformy Big Data, która dostępna jest zarówno w środowiskach on premise jak i na platformach chmurowych.
Wymagania wstępne
- Podstawowa wiedza IT
- Podstawowa wiedza w zakresie języków programowania Python i Java
- Podstawowa wiedza w zakresie relacyjnych baz danych
- Konto Google, dostęp do platformy GCP
Szkolenie prowadzone we współpracy ze Stacja IT
Program
Godzina 1
- Co to jest Big Data? (30 minut)
- Sprawdzenie i konfiguracja środowiska (20 minut)
- Przerwa kawowa (10 minut)
Godzina 2
- Czym jest Hadoop? (20 minut)
- Podstawy HDFS, YARN (30 minut)
- Przerwa kawowa (10 minut)
Godzina 3
- MapReduce - wprowadzenie (20 minut)
- MapReduce - pierwsze kroki (30 minut)
- Przerwa kawowa (10 minut)
Godzina 4
- Hadoop Family na przykładzie Hive (40 minut)
Hadoop-Family-na-przykładzie-Hive.zpln (sol) - I co dalej? - podsumowanie i zakończenie (20 minut)