Jeszcze niedawno dokumentacja Apache Spark przykładowe fragmenty kodu w ramach dostarczanych API prezentowała w kolejności: Scala, Java, Python R. Od wersji 3.5.0 ta kolejność jest…
Wprowadzenie Nasze wyzwanie jest z jednej strony proste, z drugiej strony dość ambitne. Chcemy dokonać kilku analiz tekstów, które już przetwarzaliśmy… opowiadań Artura Conan Doyla.…
Jeszcze niedawno dokumentacja Apache Spark przykładowe fragmenty kodu w ramach dostarczanych API prezentowała w kolejności: Scala, Java, Python R. Od wersji 3.5.0 ta kolejność jest…
Apache Spark określany jest mianem standardu de-facto przetwarzania Big Data. Jego popularność, występowanie praktycznie w ramach każdej z platform chmurowych, w środowiskach on-premise, API dla…
Wprowadzenie do Apache Spark w telegraficznym skrócie. Od podstaw do orientacji w temacie.
Aplikacje analizujące napływające dane, reagujące na pojawiające się anomalie, śledzące przebieg procesów biznesowych, analizujące zmianę trendów w sieciach społecznościowych. Platformy odbierające bez przerwy dane z…
Kurs Big Data i platforma Hadoop – wprowadzenie jest praktycznym wprowadzeniem do tematyki Big Data, ze szczególnym uwzględnieniem platformy Hadoop oraz jej podstawowych narzędzi.
Przetwarzanie dokumentów XML może mieć różną postać. Można go realizować proceduralnie za pomocą API takich jako DOM czy SAX. Można wykorzystać do tego celu także…
Nie zawsze program MapReduce jest na tyle prosty, że pierwsza próba jego napisania kończy się sukcesem. Co jeśli nasz program jest na tyle skomplikowany, że…
Szkolenie Projektowanie platformy Big Data z użyciem narzędzi z rodziny Apache zaczyna się od krótkiego wprowadzenia wyjaśnienia tego jak rozumieć Big Data i jakie ma…