Harmonogram
Dzień 1
- Wprowadzenie do baz danych NoSQL
- MongoDB – podstawy
- MongoDB – zapytania
- MongoDB – indeksy, zaawansowane zapytania
- Dodatki
Dzień 2
- Elasticsearch
- Kibana
- Cassandra – wprowadzenie
- Cassandra – CQL
- Neo4j – podstawy
- Neo4j – Cypher
- Dodatki
Dzień 3
- Systemy BigData – wprowadzenie
- Hadoop, HDFS, YARN – wprowadzenie
- Architektura Lambda
- Architektura Kappa
- Kafka
- Spark – wprowadzenie
- Spark – DataFrames
- Dodatki
Wprowadzenie
Fundamenty dla baz danych NoSQL powstały w latach 2006-2007 wraz z rozwiązaniami takimi jak BigTable (Google) i Dynamo (Amazon). W latach 2007-2009 powstały najważniejsze z obecnie funkcjonujących baz danych noSQL: MongoDB, HBase, Redis, Cassandra, Neo4j.
Zainteresowanie bazami danych z tego nurtu związane jest ze wzrostem zapotrzebowania na rozwiązania pozwalające przetwarzać dane w sposób odpowiedni dla globalnych usług i platform Internetowych, wzrostem przetwarzanych ilości danych o charakterystyce, która nie zawsze współgra ze starymi dobrymi relacyjnymi bazami danych.
Kurs przedstawia wybrane bazy danych i silniki przetwarzania danych – liderów w swoich kategoriach wśród baz danych NoSQL.
W zależności od konfiguracji i oczekiwań słuchaczy, kurs omawia:
- MongoDB – dokumentowy model danych
- Neo4j – grafowy model danych
- Cassandra – model danych oparty o rodziny kolumn
- Redis – model danych klucz-wartość
- Elasticsearch i Kibana – silnik wyszukiwań i wizualizacja danych
- Esper – silnik przetwarzania danych strumieniowych
- eXist – dokumentowa baza danych oparta o format XML
- Elementy Big Data (HDFS, HBase) – gdzie bazy danych nurtu NoSQL są szczególnie użyteczne
Struktura Kursu
Kurs podzielony jest na tematy. Każdy z tematów obejmuje wykład wprowadzający i ewentualny opis warsztatu/zestawu zadań.
Wykład ilustrowany jest slajdami.
Zestawy zadań mają charakter zadań do samodzielnego wykonania.
Lista Tematów
Dzień 1. Wprowadzenie, Dokumentowe Bazy Danych
- Wprowadzenie Do Baz Danych NoSQL
- Wykład
- MongoDB – Podstawy
- MongoDB – Zapytania
- MongoDB – Indeksy, Zaawansowane Zapytania
- Materiały Dodatkowe
Dzień 2. Silniki Wyszukiwań, Wizualizacja Danych, Bazy Danych Grafowe I Rodziny-Kolumn
- Elasticsearch
- Kibana
- Cassandra – Wprowadzenie
- Wykład
- Cassandra – Modelowanie, CQL, API
- Wykład
- Neo4j – Podstawy
- Wykład
- Neo4j – Cypher
- Wykład
- Materiały Dodatkowe
Dzień 3. Elementy Big Data
- Systemy BigData – Wprowadzenie
- Wykład
- Hadoop, HDFS, YARN – Wprowadzenie
- Wykład
- Architektura Lamdba
- Wykład
- Architektura Kappa
- Wykład
- Kafka
- Wykład
- Spark – Wprowadzenie
- Wykład
- Spark – DataFrames
- Wykład
- Materiały Dodatkowe
Literatura
- Cassandra: The Definitive Guide
Autorzy: Carpenter, Jeff; Hewitt, Eben
Wydawnictwo: O’Reilly Media, Inc., 2016 - Graph Databases
Autorzy: Robinson, Ian; Webber, Jim; Eifrem, Emil
Wydawnictwo: O’Reilly Media, Inc., 2015 - Redis Essentials
Autorzy: Silva, Maxwell Dayvson Da.
Wydawnictwo: Packt Publishing, 2015 - MongoDB: The Definitive Guide
Autorzy: Chodorow, Kristina
Wydawnictwo: O’Reilly Media, Inc., 2013 - Hadoop: The Definitive Guide
Autorzy: White, Tom
Wydawnictwo: O’Reilly Media, Inc., 2015 - neo4j – https://neo4j.com/docs/developer-manual/current/
- Redis – https://redis.io/documentation
- Cassandra – http://cassandra.apache.org/doc/latest/, https://docs.datastax.com/en/cassandra/3.0/
- Esper – http://www.espertech.com/esper/esper-documentation/
- MongoDB – https://docs.mongodb.com/
- eXist – https://exist-db.org/exist/apps/doc/documentation.xml