Big Data i platforma Hadoop - wprowadzenie

Kurs Big Data i platforma Hadoop - wprowadzenie jest praktycznym wprowadzeniem do tematyki Big Data, ze szczególnym uwzględnieniem platformy Hadoop oraz jej podstawowych narzędzi.

Podstawowe cele szkolenia to:

  • Zapoznanie z platformą Hadoop
  • Wykorzystanie narzędzi Pig, Hive do implementacji złożonych procesów przetwarzających dane
  • Zastosowanie bazy danych HBase

Główne jego zalety to:

  • Praktyczne wprowadzenie do tematyki Big Data - po zakończonym szkoleniu znasz podstawowe pojęcia a także możliwości i mechanizmy Big Data.
  • Przedstawienie praktycznych przykładów oraz praktyk niezbędnych do przeprowadzania analizy dużych ilości danych
  • Praktyka przed teorią - nie tylko wiesz jak, ale także dlaczego

Dla kogo?

  • Analitycy i programiści, którzy chcą wejść w świat Big Data i rozpocząć przygodę z podstawowymi platformami i narzędziami które są jego synonimami

Wymagania:

  • Dobra znajomość: języka SQL, relacyjnego modelu danych oraz hurtowni danych
  • Podstawowa znajomość obiektowych języków programowania np.: Java, Python lub Scala

Struktura kursu

Kurs podzielony jest na tematy. Każdy z tematów obejmuje wykładowy materiał wprowadzający i zestaw ćwiczeń/zadań/tutoriali, który w praktyczny sposób pozwala zaznajomić się z przedstawianym tematem.

Materiał wykładowy ilustrowany jest slajdami z dużą liczbą przykładów.

Materiał praktyczny ma charakter zadań/warsztatów/tutoriali do samodzielnego wykonania.

Lista tematów

  1. Wprowadzenie

  2. Wprowadzenie do Big Data

  3. Hadoop - wprowadzenie, MapReduce

  4. HDFS, YARN

  5. Spark - wprowadzenie

  6. Hive

  7. Wprowadzenie do baz danych NoSQL

  8. HBase

  9. Architektury Big Data