Harmonogram
Dzień 1
- Wprowadzenie do baz danych NoSQL
- MongoDB - podstawy
- MongoDB - zapytania
- MongoDB - indeksy, zaawansowane zapytania
- Dodatki
Dzień 2
- Elasticsearch
- Kibana
- Cassandra - wprowadzenie
- Cassandra - CQL
- Neo4j - podstawy
- Neo4j - Cypher
- Dodatki
Dzień 3
- Systemy BigData - wprowadzenie
- Hadoop, HDFS, YARN - wprowadzenie
- Architektura Lambda
- Architektura Kappa
- Kafka
- Spark - wprowadzenie
- Spark - DataFrames
- Dodatki
Wprowadzenie
Fundamenty dla baz danych NoSQL powstały w latach 2006-2007 wraz z rozwiązaniami takimi jak BigTable (Google) i Dynamo (Amazon). W latach 2007-2009 powstały najważniejsze z obecnie funkcjonujących baz danych noSQL: MongoDB, HBase, Redis, Cassandra, Neo4j.
Zainteresowanie bazami danych z tego nurtu związane jest ze wzrostem zapotrzebowania na rozwiązania pozwalające przetwarzać dane w sposób odpowiedni dla globalnych usług i platform Internetowych, wzrostem przetwarzanych ilości danych o charakterystyce, która nie zawsze współgra ze starymi dobrymi relacyjnymi bazami danych.
Kurs przedstawia wybrane bazy danych i silniki przetwarzania danych - liderów w swoich kategoriach wśród baz danych NoSQL.
W zależności od konfiguracji i oczekiwań słuchaczy, kurs omawia:
- MongoDB - dokumentowy model danych
- Neo4j - grafowy model danych
- Cassandra - model danych oparty o rodziny kolumn
- Redis - model danych klucz-wartość
- Elasticsearch i Kibana - silnik wyszukiwań i wizualizacja danych
- Esper - silnik przetwarzania danych strumieniowych
- eXist - dokumentowa baza danych oparta o format XML
- Elementy Big Data (HDFS, HBase) - gdzie bazy danych nurtu NoSQL są szczególnie użyteczne
Struktura Kursu
Kurs podzielony jest na tematy. Każdy z tematów obejmuje wykład wprowadzający i ewentualny opis warsztatu/zestawu zadań.
Wykład ilustrowany jest slajdami.
Zestawy zadań mają charakter zadań do samodzielnego wykonania.
Lista Tematów
Dzień 1. Wprowadzenie, Dokumentowe Bazy Danych
- Wprowadzenie Do Baz Danych NoSQL
- Wykład
- MongoDB - Podstawy
- MongoDB - Zapytania
- MongoDB - Indeksy, Zaawansowane Zapytania
- Materiały Dodatkowe
Dzień 2. Silniki Wyszukiwań, Wizualizacja Danych, Bazy Danych Grafowe I Rodziny-Kolumn
- Elasticsearch
- Kibana
- Cassandra - Wprowadzenie
- Wykład
- Cassandra - Modelowanie, CQL, API
- Wykład
- Neo4j - Podstawy
- Wykład
- Neo4j - Cypher
- Wykład
- Materiały Dodatkowe
Dzień 3. Elementy Big Data
- Systemy BigData - Wprowadzenie
- Wykład
- Hadoop, HDFS, YARN - Wprowadzenie
- Wykład
- Architektura Lamdba
- Wykład
- Architektura Kappa
- Wykład
- Kafka
- Wykład
- Spark - Wprowadzenie
- Wykład
- Spark - DataFrames
- Wykład
- Materiały Dodatkowe
Literatura
- Cassandra: The Definitive Guide
Autorzy: Carpenter, Jeff; Hewitt, Eben
Wydawnictwo: O'Reilly Media, Inc., 2016 - Graph Databases
Autorzy: Robinson, Ian; Webber, Jim; Eifrem, Emil
Wydawnictwo: O'Reilly Media, Inc., 2015 - Redis Essentials
Autorzy: Silva, Maxwell Dayvson Da.
Wydawnictwo: Packt Publishing, 2015 - MongoDB: The Definitive Guide
Autorzy: Chodorow, Kristina
Wydawnictwo: O'Reilly Media, Inc., 2013 - Hadoop: The Definitive Guide
Autorzy: White, Tom
Wydawnictwo: O'Reilly Media, Inc., 2015 - neo4j - https://neo4j.com/docs/developer-manual/current/
- Redis - https://redis.io/documentation
- Cassandra - http://cassandra.apache.org/doc/latest/, https://docs.datastax.com/en/cassandra/3.0/
- Esper - http://www.espertech.com/esper/esper-documentation/
- MongoDB - https://docs.mongodb.com/
- eXist - https://exist-db.org/exist/apps/doc/documentation.xml